Lupu, Andrei

21 publications

TMLR 2026 Bootstrapping Task Spaces for Self-Improvement Minqi Jiang, Andrei Lupu, Yoram Bachrach

NeurIPS 2025 AI Research Agents for Machine Learning: Search, Exploration, and Generalization in MLE-Bench Edan Toledo, Karen Hambardzumyan, Martin Josifoski, Rishi Hazra, Nicolas Baldwin, Alexis Audran-Reiss, Michael Kuchnik, Despoina Magka, Minqi Jiang, Alisia Maria Lupidi, Andrei Lupu, Roberta Raileanu, Tatiana Shavrina, Kelvin Niu, Jean-Christophe Gagnon-Audet, Michael Shvartsman, Shagun Sodhani, Alexander H Miller, Abhishek Charnalia, Derek Dunfield, Carole-Jean Wu, Pontus Stenetorp, Nicola Cancedda, Jakob Nicolaus Foerster, Yoram Bachrach

ICML 2025 Ad-Hoc Human-AI Coordination Challenge Tin Dizdarević, Ravi Hammond, Tobias Gessler, Anisoara Calinescu, Jonathan Cook, Matteo Gallici, Andrei Lupu, Jakob Nicolaus Foerster

IJCAI 2025 Combining Code Generating Large Language Models and Self-Play to Iteratively Refine Strategies in Games Yoram Bachrach, Edan Toledo, Karen Hambardzumyan, Despoina Magka, Martin Josifoski, Minqi Jiang, Jakob N. Foerster, Roberta Raileanu, Tatiana Shavrina, Nicola Cancedda, Avraham Ruderman, Katie Millican, Andrei Lupu, Rishi Hazra

ICLR 2025 OvercookedV2: Rethinking Overcooked for Zero-Shot Coordination Tobias Gessler, Tin Dizdarevic, Ani Calinescu, Benjamin Ellis, Andrei Lupu, Jakob Nicolaus Foerster

NeurIPS 2025 The Automated LLM Speedrunning Benchmark: Reproducing NanoGPT Improvements Bingchen Zhao, Despoina Magka, Minqi Jiang, Xian Li, Roberta Raileanu, Tatiana Shavrina, Jean-Christophe Gagnon-Audet, Kelvin Niu, Shagun Sodhani, Michael Shvartsman, Andrei Lupu, Alisia Maria Lupidi, Karen Hambardzumyan, Martin Josifoski, Edan Toledo, Thomas Foster, Lucia Cipolina-Kun, Derek Dunfield, Abhishek Charnalia, Alexander H Miller, Oisin Mac Aodha, Jakob Nicolaus Foerster, Yoram Bachrach

NeurIPS 2024 Adam on Local Time: Addressing Nonstationarity in RL with Relative Adam Timesteps Benjamin Ellis, Matthew T. Jackson, Andrei Lupu, Alexander D. Goldie, Mattie Fellows, Shimon Whiteson, Jakob N. Foerster

ICLR 2024 Behaviour Distillation Andrei Lupu, Chris Lu, Jarek Luca Liesen, Robert Tjarko Lange, Jakob Nicolaus Foerster

NeurIPS 2024 JaxMARL: Multi-Agent RL Environments and Algorithms in JAX Alexander Rutherford, Benjamin Ellis, Matteo Gallici, Jonathan Cook, Andrei Lupu, Garðar Ingvarsson, Timon Willi, Ravi Hammond, Akbir Khan, Christian Schroeder de Witt, Alexandra Souly, Saptarashmi Bandyopadhyay, Mikayel Samvelyan, Minqi Jiang, Robert Lange, Shimon Whiteson, Bruno Lacerda, Nick Hawes, Tim Rocktäschel, Chris Lu, Jakob Foerster

NeurIPS 2024 Rainbow Teaming: Open-Ended Generation of Diverse Adversarial Prompts Mikayel Samvelyan, Sharath Chandra Raparthy, Andrei Lupu, Eric Hambro, Aram H. Markosyan, Manish Bhatt, Yuning Mao, Minqi Jiang, Jack Parker-Holder, Jakob Foerster, Tim Rocktäschel, Roberta Raileanu

ICLRW 2024 Rainbow Teaming: Open-Ended Generation of Diverse Adversarial Prompts Mikayel Samvelyan, Sharath Chandra Raparthy, Andrei Lupu, Eric Hambro, Aram H. Markosyan, Manish Bhatt, Yuning Mao, Minqi Jiang, Jack Parker-Holder, Jakob Nicolaus Foerster, Tim Rocktäschel, Roberta Raileanu

ICLR 2023 Adversarial Diversity in Hanabi Brandon Cui, Andrei Lupu, Samuel Sokota, Hengyuan Hu, David J Wu, Jakob Nicolaus Foerster

NeurIPSW 2023 JaxMARL: Multi-Agent RL Environments in JAX Alexander Rutherford, Benjamin Ellis, Matteo Gallici, Jonathan Cook, Andrei Lupu, Garðar Ingvarsson, Timon Willi, Akbir Khan, Christian Schroeder de Witt, Alexandra Souly, Saptarashmi Bandyopadhyay, Mikayel Samvelyan, Minqi Jiang, Robert Tjarko Lange, Shimon Whiteson, Bruno Lacerda, Nick Hawes, Tim Rocktäschel, Chris Lu, Jakob Nicolaus Foerster

NeurIPS 2022 Grounding Aleatoric Uncertainty for Unsupervised Environment Design Minqi Jiang, Michael Dennis, Jack Parker-Holder, Andrei Lupu, Heinrich Küttler, Edward Grefenstette, Tim Rocktäschel, Jakob Foerster

NeurIPS 2022 Off-Team Learning Brandon Cui, Hengyuan Hu, Andrei Lupu, Samuel Sokota, Jakob Foerster

NeurIPS 2022 Self-Explaining Deviations for Coordination Hengyuan Hu, Samuel Sokota, David Wu, Anton Bakhtin, Andrei Lupu, Brandon Cui, Jakob Foerster

NeurIPSW 2021 Grounding Aleatoric Uncertainty in Unsupervised Environment Design Minqi Jiang, Michael D Dennis, Jack Parker-Holder, Andrei Lupu, Heinrich Kuttler, Edward Grefenstette, Tim Rocktäschel, Jakob Nicolaus Foerster

ICML 2021 Trajectory Diversity for Zero-Shot Coordination Andrei Lupu, Brandon Cui, Hengyuan Hu, Jakob Foerster

AAAI 2020 Gifting in Multi-Agent Reinforcement Learning (Student Abstract) Andrei Lupu, Doina Precup

AAAI 2019 Leveraging Observations in Bandits: Between Risks and Benefits Andrei Lupu, Audrey Durand, Doina Precup

AAAI 2018 Imitation Upper Confidence Bound for Bandits on a Graph Andrei Lupu, Doina Precup