Rocktäschel, Tim

78 publications

ICLR 2025 BALROG: Benchmarking Agentic LLM and VLM Reasoning on Games Davide Paglieri, Bartłomiej Cupiał, Samuel Coward, Ulyana Piterbarg, Maciej Wolczyk, Akbir Khan, Eduardo Pignatelli, Łukasz Kuciński, Lerrel Pinto, Rob Fergus, Jakob Nicolaus Foerster, Jack Parker-Holder, Tim Rocktäschel

NeurIPS 2025 Imagined Autocurricula Ahmet H. Güzel, Matthew Thomas Jackson, Jarek Luca Liesen, Tim Rocktäschel, Jakob Nicolaus Foerster, Ilija Bogunovic, Jack Parker-Holder

ICML 2025 Investigating Non-Transitivity in LLM-as-a-Judge Yi Xu, Laura Ruis, Tim Rocktäschel, Robert Kirk

ICLRW 2025 Preference-Based Alignment of Discrete Diffusion Models Umberto Borso, Davide Paglieri, Jude Wells, Tim Rocktäschel

ICLR 2025 Procedural Knowledge in Pretraining Drives Reasoning in Large Language Models Laura Ruis, Maximilian Mozes, Juhan Bae, Siddhartha Rao Kamalakara, Dwaraknath Gnaneshwar, Acyr Locatelli, Robert Kirk, Tim Rocktäschel, Edward Grefenstette, Max Bartolo

ICMLW 2024 Assessing the Zero-Shot Capabilities of LLMs for Action Evaluation in RL Eduardo Pignatelli, Johan Ferret, Davide Paglieri, Samuel Coward, Tim Rocktäschel, Edward Grefenstette, Laura Toni

ICML 2024 Debating with More Persuasive LLMs Leads to More Truthful Answers Akbir Khan, John Hughes, Dan Valentine, Laura Ruis, Kshitij Sachan, Ansh Radhakrishnan, Edward Grefenstette, Samuel R. Bowman, Tim Rocktäschel, Ethan Perez

ICML 2024 Genie: Generative Interactive Environments Jake Bruce, Michael D Dennis, Ashley Edwards, Jack Parker-Holder, Yuge Shi, Edward Hughes, Matthew Lai, Aditi Mavalankar, Richie Steigerwald, Chris Apps, Yusuf Aytar, Sarah Maria Elisabeth Bechtle, Feryal Behbahani, Stephanie C.Y. Chan, Nicolas Heess, Lucy Gonzalez, Simon Osindero, Sherjil Ozair, Scott Reed, Jingwei Zhang, Konrad Zolna, Jeff Clune, Nando De Freitas, Satinder Singh, Tim Rocktäschel

ICLR 2024 H-GAP: Humanoid Control with a Generalist Planner Zhengyao Jiang, Yingchen Xu, Nolan Wagener, Yicheng Luo, Michael Janner, Edward Grefenstette, Tim Rocktäschel, Yuandong Tian

NeurIPS 2024 JaxMARL: Multi-Agent RL Environments and Algorithms in JAX Alexander Rutherford, Benjamin Ellis, Matteo Gallici, Jonathan Cook, Andrei Lupu, Garðar Ingvarsson, Timon Willi, Ravi Hammond, Akbir Khan, Christian Schroeder de Witt, Alexandra Souly, Saptarashmi Bandyopadhyay, Mikayel Samvelyan, Minqi Jiang, Robert Lange, Shimon Whiteson, Bruno Lacerda, Nick Hawes, Tim Rocktäschel, Chris Lu, Jakob Foerster

ICLR 2024 Mechanistically Analyzing the Effects of Fine-Tuning on Procedurally Defined Tasks Samyak Jain, Robert Kirk, Ekdeep Singh Lubana, Robert P. Dick, Hidenori Tanaka, Tim Rocktäschel, Edward Grefenstette, David Krueger

ICLRW 2024 Mechanistically Analyzing the Effects of Fine-Tuning on Procedurally Defined Tasks Samyak Jain, Robert Kirk, Ekdeep Singh Lubana, Robert P. Dick, Hidenori Tanaka, Tim Rocktäschel, Edward Grefenstette, David Krueger

NeurIPSW 2024 On Reward Functions for Self-Improving Chain-of-Thought Reasoning Without Supervised Datasets (Abridged Version) Thomas Foster, Eltayeb Ahmed, Jonathan Cook, Shalev Lifshitz, Tim Rocktäschel, Jakob Nicolaus Foerster

ICMLW 2024 Outliers and Calibration Sets Have Diminishing Effect on Quantization of Modern LLMs Davide Paglieri, Saurabh Dash, Tim Rocktäschel, Jack Parker-Holder

ICML 2024 Position: Open-Endedness Is Essential for Artificial Superhuman Intelligence Edward Hughes, Michael D Dennis, Jack Parker-Holder, Feryal Behbahani, Aditi Mavalankar, Yuge Shi, Tom Schaul, Tim Rocktäschel

ICML 2024 Promptbreeder: Self-Referential Self-Improvement via Prompt Evolution Chrisantha Fernando, Dylan Sunil Banarse, Henryk Michalewski, Simon Osindero, Tim Rocktäschel

NeurIPS 2024 Rainbow Teaming: Open-Ended Generation of Diverse Adversarial Prompts Mikayel Samvelyan, Sharath Chandra Raparthy, Andrei Lupu, Eric Hambro, Aram H. Markosyan, Manish Bhatt, Yuning Mao, Minqi Jiang, Jack Parker-Holder, Jakob Foerster, Tim Rocktäschel, Roberta Raileanu

ICLRW 2024 Rainbow Teaming: Open-Ended Generation of Diverse Adversarial Prompts Mikayel Samvelyan, Sharath Chandra Raparthy, Andrei Lupu, Eric Hambro, Aram H. Markosyan, Manish Bhatt, Yuning Mao, Minqi Jiang, Jack Parker-Holder, Jakob Nicolaus Foerster, Tim Rocktäschel, Roberta Raileanu

NeurIPSW 2024 TICKing All the Boxes: Generated Checklists Improve LLM Evaluation and Generation Jonathan Cook, Tim Rocktäschel, Jakob Nicolaus Foerster, Dennis Aumiller, Alex Wang

JAIR 2023 A Survey of Zero-Shot Generalisation in Deep Reinforcement Learning Robert Kirk, Amy Zhang, Edward Grefenstette, Tim Rocktäschel

ICMLW 2023 Do LLMs Selectively Encode the Goal of an Agent's Reach? Laura Ruis, Arduin Findeis, Herbie Bradley, Hossein A. Rahmani, Kyoung Whan Choe, Edward Grefenstette, Tim Rocktäschel

ICLR 2023 Efficient Planning in a Compact Latent Action Space Zhengyao Jiang, Tianjun Zhang, Michael Janner, Yueying Li, Tim Rocktäschel, Edward Grefenstette, Yuandong Tian

NeurIPSW 2023 H-GAP: Humanoid Control with a Generalist Planner Zhengyao Jiang, Yingchen Xu, Nolan Wagener, Yicheng Luo, Michael Janner, Edward Grefenstette, Tim Rocktäschel, Yuandong Tian

NeurIPSW 2023 How Does Fine-Tuning Affect Your Model? Mechanistic Analysis on Procedural Tasks Samyak Jain, Robert Kirk, Ekdeep Singh Lubana, Robert P. Dick, Hidenori Tanaka, Tim Rocktäschel, Edward Grefenstette, David Krueger

ICML 2023 Human-Timescale Adaptation in an Open-Ended Task Space Jakob Bauer, Kate Baumli, Feryal Behbahani, Avishkar Bhoopchand, Nathalie Bradley-Schmieg, Michael Chang, Natalie Clay, Adrian Collister, Vibhavari Dasagi, Lucy Gonzalez, Karol Gregor, Edward Hughes, Sheleem Kashem, Maria Loks-Thompson, Hannah Openshaw, Jack Parker-Holder, Shreya Pathak, Nicolas Perez-Nieves, Nemanja Rakicevic, Tim Rocktäschel, Yannick Schroecker, Satinder Singh, Jakub Sygnowski, Karl Tuyls, Sarah York, Alexander Zacherl, Lei M Zhang

NeurIPSW 2023 JaxMARL: Multi-Agent RL Environments in JAX Alexander Rutherford, Benjamin Ellis, Matteo Gallici, Jonathan Cook, Andrei Lupu, Garðar Ingvarsson, Timon Willi, Akbir Khan, Christian Schroeder de Witt, Alexandra Souly, Saptarashmi Bandyopadhyay, Mikayel Samvelyan, Minqi Jiang, Robert Tjarko Lange, Shimon Whiteson, Bruno Lacerda, Nick Hawes, Tim Rocktäschel, Chris Lu, Jakob Nicolaus Foerster

NeurIPSW 2023 Leading the Pack: N-Player Opponent Shaping Alexandra Souly, Timon Willi, Akbir Khan, Robert Kirk, Chris Lu, Edward Grefenstette, Tim Rocktäschel

ICLR 2023 MAESTRO: Open-Ended Environment Design for Multi-Agent Reinforcement Learning Mikayel Samvelyan, Akbir Khan, Michael D Dennis, Minqi Jiang, Jack Parker-Holder, Jakob Nicolaus Foerster, Roberta Raileanu, Tim Rocktäschel

NeurIPSW 2023 Minimax: Efficient Baselines for Autocurricula in JAX Minqi Jiang, Michael D Dennis, Edward Grefenstette, Tim Rocktäschel

NeurIPSW 2023 Mix-ME: Quality-Diversity for Multi-Agent Learning Garðar Ingvarsson, Mikayel Samvelyan, Manon Flageat, Bryan Lim, Antoine Cully, Tim Rocktäschel

NeurIPSW 2023 Multi-Agent Diagnostics for Robustness via Illuminated Diversity Mikayel Samvelyan, Davide Paglieri, Minqi Jiang, Jack Parker-Holder, Tim Rocktäschel

CoLLAs 2023 Stabilizing Unsupervised Environment Design with a Learned Adversary Ishita Mediratta, Minqi Jiang, Jack Parker-Holder, Michael Dennis, Eugene Vinitsky, Tim Rocktäschel

NeurIPS 2023 The Goldilocks of Pragmatic Understanding: Fine-Tuning Strategy Matters for Implicature Resolution by LLMs Laura Ruis, Akbir Khan, Stella Biderman, Sara Hooker, Tim Rocktäschel, Edward Grefenstette

NeurIPSW 2023 Vision-Language Models as a Source of Rewards Kate Baumli, Satinder Singh, Feryal Behbahani, Harris Chan, Gheorghe Comanici, Sebastian Flennerhag, Maxime Gazeau, Kristian Holsheimer, Dan Horgan, Michael Laskin, Clare Lyle, Volodymyr Mnih, Alexander Neitz, Fabio Pardo, Jack Parker-Holder, John Quan, Tim Rocktäschel, Himanshu Sahni, Tom Schaul, Yannick Schroecker, Stephen Spencer, Richie Steigerwald, Luyu Wang, Lei M Zhang

ICLRW 2022 A Study of Off-Policy Learning in Environments with Procedural Content Generation Andy Ehrenberg, Robert Kirk, Minqi Jiang, Edward Grefenstette, Tim Rocktäschel

NeurIPS 2022 Dungeons and Data: A Large-Scale NetHack Dataset Eric Hambro, Roberta Raileanu, Danielle Rothermel, Vegard Mella, Tim Rocktäschel, Heinrich Küttler, Naila Murray

NeurIPSW 2022 Efficient Planning in a Compact Latent Action Space Zhengyao Jiang, Tianjun Zhang, Michael Janner, Yueying Li, Tim Rocktäschel, Edward Grefenstette, Yuandong Tian

ICML 2022 Evolving Curricula with Regret-Based Environment Design Jack Parker-Holder, Minqi Jiang, Michael Dennis, Mikayel Samvelyan, Jakob Foerster, Edward Grefenstette, Tim Rocktäschel

NeurIPS 2022 Exploration via Elliptical Episodic Bonuses Mikael Henaff, Roberta Raileanu, Minqi Jiang, Tim Rocktäschel

NeurIPS 2022 GriddlyJS: A Web IDE for Reinforcement Learning Christopher Bamford, Minqi Jiang, Mikayel Samvelyan, Tim Rocktäschel

NeurIPS 2022 Grounding Aleatoric Uncertainty for Unsupervised Environment Design Minqi Jiang, Michael Dennis, Jack Parker-Holder, Andrei Lupu, Heinrich Küttler, Edward Grefenstette, Tim Rocktäschel, Jakob Foerster

CoLLAs 2022 Hierarchical Kickstarting for Skill Transfer in Reinforcement Learning Michael Matthews, Mikayel Samvelyan, Jack Parker-holder, Edward Grefenstette, Tim Rocktäschel

NeurIPS 2022 Improving Intrinsic Exploration with Language Abstractions Jesse Mu, Victor Zhong, Roberta Raileanu, Minqi Jiang, Noah Goodman, Tim Rocktäschel, Edward Grefenstette

NeurIPS 2022 Improving Policy Learning via Language Dynamics Distillation Victor Zhong, Jesse Mu, Luke Zettlemoyer, Edward Grefenstette, Tim Rocktäschel

NeurIPS 2022 Learning General World Models in a Handful of Reward-Free Deployments Yingchen Xu, Jack Parker-Holder, Aldo Pacchiano, Philip Ball, Oleh Rybkin, S Roberts, Tim Rocktäschel, Edward Grefenstette

NeurIPSW 2022 MAESTRO: Open-Ended Environment Design for Multi-Agent Reinforcement Learning Mikayel Samvelyan, Akbir Khan, Michael D Dennis, Minqi Jiang, Jack Parker-Holder, Jakob Nicolaus Foerster, Roberta Raileanu, Tim Rocktäschel

ICLRW 2022 SkillHack: A Benchmark for Skill Transfer in Open-Ended Reinforcement Learning Michael Matthews, Mikayel Samvelyan, Jack Parker-Holder, Edward Grefenstette, Tim Rocktäschel

NeurIPSW 2021 Graph Backup: Data Efficient Backup Exploiting Markovian Data Zhengyao Jiang, Tianjun Zhang, Robert Kirk, Tim Rocktäschel, Edward Grefenstette

NeurIPSW 2021 Grounding Aleatoric Uncertainty in Unsupervised Environment Design Minqi Jiang, Michael D Dennis, Jack Parker-Holder, Andrei Lupu, Heinrich Kuttler, Edward Grefenstette, Tim Rocktäschel, Jakob Nicolaus Foerster

ICLR 2021 Learning with AMIGo: Adversarially Motivated Intrinsic Goals Andres Campero, Roberta Raileanu, Heinrich Kuttler, Joshua B. Tenenbaum, Tim Rocktäschel, Edward Grefenstette

ICLR 2021 My Body Is a Cage: The Role of Morphology in Graph-Based Incompatible Control Vitaly Kurin, Maximilian Igl, Tim Rocktäschel, Wendelin Boehmer, Shimon Whiteson

ICML 2021 Prioritized Level Replay Minqi Jiang, Edward Grefenstette, Tim Rocktäschel

NeurIPS 2021 Replay-Guided Adversarial Environment Design Minqi Jiang, Michael Dennis, Jack Parker-Holder, Jakob Foerster, Edward Grefenstette, Tim Rocktäschel

NeurIPSW 2021 Return Dispersion as an Estimator of Learning Potential for Prioritized Level Replay Iryna Korshunova, Minqi Jiang, Jack Parker-Holder, Tim Rocktäschel, Edward Grefenstette

NeurIPSW 2021 That Escalated Quickly: Compounding Complexity by Editing Levels at the Frontier of Agent Capabilities Jack Parker-Holder, Minqi Jiang, Michael D Dennis, Mikayel Samvelyan, Jakob Nicolaus Foerster, Edward Grefenstette, Tim Rocktäschel

AAAI 2020 Differentiable Reasoning on Large Knowledge Bases and Natural Language Pasquale Minervini, Matko Bosnjak, Tim Rocktäschel, Sebastian Riedel, Edward Grefenstette

AAAI 2020 Generating Interactive Worlds with Text Angela Fan, Jack Urbanek, Pratik Ringshia, Emily Dinan, Emma Qian, Siddharth Karamcheti, Shrimai Prabhumoye, Douwe Kiela, Tim Rocktäschel, Arthur Szlam, Jason Weston

ICML 2020 Learning Reasoning Strategies in End-to-End Differentiable Proving Pasquale Minervini, Sebastian Riedel, Pontus Stenetorp, Edward Grefenstette, Tim Rocktäschel

ICLR 2020 RIDE: Rewarding Impact-Driven Exploration for Procedurally-Generated Environments Roberta Raileanu, Tim Rocktäschel

ICLR 2020 RTFM: Generalising to New Environment Dynamics via Reading Victor Zhong, Tim Rocktäschel, Edward Grefenstette

NeurIPS 2020 Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks Patrick Lewis, Ethan Perez, Aleksandra Piktus, Fabio Petroni, Vladimir Karpukhin, Naman Goyal, Heinrich Küttler, Mike Lewis, Wen-tau Yih, Tim Rocktäschel, Sebastian Riedel, Douwe Kiela

NeurIPS 2020 The NetHack Learning Environment Heinrich Küttler, Nantas Nardelli, Alexander Miller, Roberta Raileanu, Marco Selvatici, Edward Grefenstette, Tim Rocktäschel

ICMLW 2020 WordCraft: An Environment for Benchmarking Commonsense Agents Minqi Jiang, Jelena Luketina, Nantas Nardelli, Pasquale Minervini, Philip Torr, Shimon Whiteson, Tim Rocktäschel

ICML 2019 A Baseline for Any Order Gradient Estimation in Stochastic Computation Graphs Jingkai Mao, Jakob Foerster, Tim Rocktäschel, Maruan Al-Shedivat, Gregory Farquhar, Shimon Whiteson

IJCAI 2019 A Survey of Reinforcement Learning Informed by Natural Language Jelena Luketina, Nantas Nardelli, Gregory Farquhar, Jakob N. Foerster, Jacob Andreas, Edward Grefenstette, Shimon Whiteson, Tim Rocktäschel

ICLR 2019 Stable Opponent Shaping in Differentiable Games Alistair Letcher, Jakob Foerster, David Balduzzi, Tim Rocktäschel, Shimon Whiteson

ICML 2018 DiCE: The Infinitely Differentiable Monte Carlo Estimator Jakob Foerster, Gregory Farquhar, Maruan Al-Shedivat, Tim Rocktäschel, Eric Xing, Shimon Whiteson

NeurIPS 2018 E-SNLI: Natural Language Inference with Natural Language Explanations Oana-Maria Camburu, Tim Rocktäschel, Thomas Lukasiewicz, Phil Blunsom

ICMLW 2018 Towards Neural Theorem Proving at Scale Pasquale Minervini, Matko Bošnjak, Tim Rocktäschel, Sebastian Riedel

ICLR 2018 TreeQN and ATreeC: Differentiable Tree-Structured Models for Deep Reinforcement Learning Gregory Farquhar, Tim Rocktäschel, Maximilian Igl, Shimon Whiteson

UAI 2017 Adversarial Sets for Regularising Neural Link Predictors Pasquale Minervini, Thomas Demeester, Tim Rocktäschel, Sebastian Riedel

NeurIPS 2017 End-to-End Differentiable Proving Tim Rocktäschel, Sebastian Riedel

ICLR 2017 Frustratingly Short Attention Spans in Neural Language Modeling Michal Daniluk, Tim Rocktäschel, Johannes Welbl, Sebastian Riedel

ICML 2017 Programming with a Differentiable Forth Interpreter Matko Bošnjak, Tim Rocktäschel, Jason Naradowsky, Sebastian Riedel

ICLR 2017 Programming with a Differentiable Forth Interpreter Matko Bosnjak, Tim Rocktäschel, Jason Naradowsky, Sebastian Riedel

ICLR 2016 Reasoning About Entailment with Neural Attention Tim Rocktäschel, Edward Grefenstette, Karl Moritz Hermann, Tomás Kociský, Phil Blunsom