Jiang, Minqi

38 publications

TMLR 2026 Bootstrapping Task Spaces for Self-Improvement Minqi Jiang, Andrei Lupu, Yoram Bachrach

NeurIPS 2025 AI Research Agents for Machine Learning: Search, Exploration, and Generalization in MLE-Bench Edan Toledo, Karen Hambardzumyan, Martin Josifoski, Rishi Hazra, Nicolas Baldwin, Alexis Audran-Reiss, Michael Kuchnik, Despoina Magka, Minqi Jiang, Alisia Maria Lupidi, Andrei Lupu, Roberta Raileanu, Tatiana Shavrina, Kelvin Niu, Jean-Christophe Gagnon-Audet, Michael Shvartsman, Shagun Sodhani, Alexander H Miller, Abhishek Charnalia, Derek Dunfield, Carole-Jean Wu, Pontus Stenetorp, Nicola Cancedda, Jakob Nicolaus Foerster, Yoram Bachrach

IJCAI 2025 Combining Code Generating Large Language Models and Self-Play to Iteratively Refine Strategies in Games Yoram Bachrach, Edan Toledo, Karen Hambardzumyan, Despoina Magka, Martin Josifoski, Minqi Jiang, Jakob N. Foerster, Roberta Raileanu, Tatiana Shavrina, Nicola Cancedda, Avraham Ruderman, Katie Millican, Andrei Lupu, Rishi Hazra

NeurIPS 2025 The Automated LLM Speedrunning Benchmark: Reproducing NanoGPT Improvements Bingchen Zhao, Despoina Magka, Minqi Jiang, Xian Li, Roberta Raileanu, Tatiana Shavrina, Jean-Christophe Gagnon-Audet, Kelvin Niu, Shagun Sodhani, Michael Shvartsman, Andrei Lupu, Alisia Maria Lupidi, Karen Hambardzumyan, Martin Josifoski, Edan Toledo, Thomas Foster, Lucia Cipolina-Kun, Derek Dunfield, Abhishek Charnalia, Alexander H Miller, Oisin Mac Aodha, Jakob Nicolaus Foerster, Yoram Bachrach

ICMLW 2024 Higher Order and Self-Referential Evolution for Population-Based Methods Samuel Coward, Chris Lu, Alistair Letcher, Minqi Jiang, Jack Parker-Holder, Jakob Nicolaus Foerster

NeurIPS 2024 JaxMARL: Multi-Agent RL Environments and Algorithms in JAX Alexander Rutherford, Benjamin Ellis, Matteo Gallici, Jonathan Cook, Andrei Lupu, Garðar Ingvarsson, Timon Willi, Ravi Hammond, Akbir Khan, Christian Schroeder de Witt, Alexandra Souly, Saptarashmi Bandyopadhyay, Mikayel Samvelyan, Minqi Jiang, Robert Lange, Shimon Whiteson, Bruno Lacerda, Nick Hawes, Tim Rocktäschel, Chris Lu, Jakob Foerster

ICLR 2024 Learning to Act Without Actions Dominik Schmidt, Minqi Jiang

NeurIPS 2024 Rainbow Teaming: Open-Ended Generation of Diverse Adversarial Prompts Mikayel Samvelyan, Sharath Chandra Raparthy, Andrei Lupu, Eric Hambro, Aram H. Markosyan, Manish Bhatt, Yuning Mao, Minqi Jiang, Jack Parker-Holder, Jakob Foerster, Tim Rocktäschel, Roberta Raileanu

ICLRW 2024 Rainbow Teaming: Open-Ended Generation of Diverse Adversarial Prompts Mikayel Samvelyan, Sharath Chandra Raparthy, Andrei Lupu, Eric Hambro, Aram H. Markosyan, Manish Bhatt, Yuning Mao, Minqi Jiang, Jack Parker-Holder, Jakob Nicolaus Foerster, Tim Rocktäschel, Roberta Raileanu

ICML 2024 Refining Minimax Regret for Unsupervised Environment Design Michael Beukman, Samuel Coward, Michael Matthews, Mattie Fellows, Minqi Jiang, Michael D Dennis, Jakob Nicolaus Foerster

ICLR 2024 Reward-Free Curricula for Training Robust World Models Marc Rigter, Minqi Jiang, Ingmar Posner

ICLR 2024 The Generalization Gap in Offline Reinforcement Learning Ishita Mediratta, Qingfei You, Minqi Jiang, Roberta Raileanu

NeurIPSW 2023 A Study of Generalization in Offline Reinforcement Learning Ishita Mediratta, Qingfei You, Minqi Jiang, Roberta Raileanu

ICML 2023 A Study of Global and Episodic Bonuses for Exploration in Contextual MDPs Mikael Henaff, Minqi Jiang, Roberta Raileanu

NeurIPS 2023 ADGym: Design Choices for Deep Anomaly Detection Minqi Jiang, Chaochuan Hou, Ao Zheng, Songqiao Han, Hailiang Huang, Qingsong Wen, Xiyang Hu, Yue Zhao

NeurIPS 2023 Discovering General Reinforcement Learning Algorithms with Adversarial Environment Design Matthew T Jackson, Minqi Jiang, Jack Parker-Holder, Risto Vuorio, Chris Lu, Greg Farquhar, Shimon Whiteson, Jakob Foerster

NeurIPSW 2023 JaxMARL: Multi-Agent RL Environments in JAX Alexander Rutherford, Benjamin Ellis, Matteo Gallici, Jonathan Cook, Andrei Lupu, Garðar Ingvarsson, Timon Willi, Akbir Khan, Christian Schroeder de Witt, Alexandra Souly, Saptarashmi Bandyopadhyay, Mikayel Samvelyan, Minqi Jiang, Robert Tjarko Lange, Shimon Whiteson, Bruno Lacerda, Nick Hawes, Tim Rocktäschel, Chris Lu, Jakob Nicolaus Foerster

NeurIPSW 2023 Learning to Act Without Actions Dominik Schmidt, Minqi Jiang

ICLR 2023 MAESTRO: Open-Ended Environment Design for Multi-Agent Reinforcement Learning Mikayel Samvelyan, Akbir Khan, Michael D Dennis, Minqi Jiang, Jack Parker-Holder, Jakob Nicolaus Foerster, Roberta Raileanu, Tim Rocktäschel

NeurIPSW 2023 Minimax: Efficient Baselines for Autocurricula in JAX Minqi Jiang, Michael D Dennis, Edward Grefenstette, Tim Rocktäschel

NeurIPSW 2023 Multi-Agent Diagnostics for Robustness via Illuminated Diversity Mikayel Samvelyan, Davide Paglieri, Minqi Jiang, Jack Parker-Holder, Tim Rocktäschel

CoLLAs 2023 Stabilizing Unsupervised Environment Design with a Learned Adversary Ishita Mediratta, Minqi Jiang, Jack Parker-Holder, Michael Dennis, Eugene Vinitsky, Tim Rocktäschel

ICLRW 2022 A Study of Off-Policy Learning in Environments with Procedural Content Generation Andy Ehrenberg, Robert Kirk, Minqi Jiang, Edward Grefenstette, Tim Rocktäschel

NeurIPS 2022 ADBench: Anomaly Detection Benchmark Songqiao Han, Xiyang Hu, Hailiang Huang, Minqi Jiang, Yue Zhao

ICML 2022 Evolving Curricula with Regret-Based Environment Design Jack Parker-Holder, Minqi Jiang, Michael Dennis, Mikayel Samvelyan, Jakob Foerster, Edward Grefenstette, Tim Rocktäschel

NeurIPS 2022 Exploration via Elliptical Episodic Bonuses Mikael Henaff, Roberta Raileanu, Minqi Jiang, Tim Rocktäschel

NeurIPS 2022 GriddlyJS: A Web IDE for Reinforcement Learning Christopher Bamford, Minqi Jiang, Mikayel Samvelyan, Tim Rocktäschel

NeurIPS 2022 Grounding Aleatoric Uncertainty for Unsupervised Environment Design Minqi Jiang, Michael Dennis, Jack Parker-Holder, Andrei Lupu, Heinrich Küttler, Edward Grefenstette, Tim Rocktäschel, Jakob Foerster

NeurIPS 2022 Improving Intrinsic Exploration with Language Abstractions Jesse Mu, Victor Zhong, Roberta Raileanu, Minqi Jiang, Noah Goodman, Tim Rocktäschel, Edward Grefenstette

NeurIPSW 2022 Integrating Episodic and Global Bonuses for Efficient Exploration Mikael Henaff, Minqi Jiang, Roberta Raileanu

NeurIPSW 2022 MAESTRO: Open-Ended Environment Design for Multi-Agent Reinforcement Learning Mikayel Samvelyan, Akbir Khan, Michael D Dennis, Minqi Jiang, Jack Parker-Holder, Jakob Nicolaus Foerster, Roberta Raileanu, Tim Rocktäschel

NeurIPSW 2021 Grounding Aleatoric Uncertainty in Unsupervised Environment Design Minqi Jiang, Michael D Dennis, Jack Parker-Holder, Andrei Lupu, Heinrich Kuttler, Edward Grefenstette, Tim Rocktäschel, Jakob Nicolaus Foerster

ICML 2021 Prioritized Level Replay Minqi Jiang, Edward Grefenstette, Tim Rocktäschel

NeurIPS 2021 Replay-Guided Adversarial Environment Design Minqi Jiang, Michael Dennis, Jack Parker-Holder, Jakob Foerster, Edward Grefenstette, Tim Rocktäschel

NeurIPSW 2021 Return Dispersion as an Estimator of Learning Potential for Prioritized Level Replay Iryna Korshunova, Minqi Jiang, Jack Parker-Holder, Tim Rocktäschel, Edward Grefenstette

NeurIPSW 2021 Return Dispersion as an Estimator of Learning Potential for Prioritized Level Replay Iryna Korshunova, Minqi Jiang, Jack Parker-Holder, Tim Rocktäschel, Edward Grefenstette

NeurIPSW 2021 That Escalated Quickly: Compounding Complexity by Editing Levels at the Frontier of Agent Capabilities Jack Parker-Holder, Minqi Jiang, Michael D Dennis, Mikayel Samvelyan, Jakob Nicolaus Foerster, Edward Grefenstette, Tim Rocktäschel

ICMLW 2020 WordCraft: An Environment for Benchmarking Commonsense Agents Minqi Jiang, Jelena Luketina, Nantas Nardelli, Pasquale Minervini, Philip Torr, Shimon Whiteson, Tim Rocktäschel