Ajay, Anurag

14 publications

NeurIPS 2024 Learning Multimodal Behaviors from Scratch with Diffusion Policy Gradient Zechu Li, Rickmer Krohn, Tao Chen, Anurag Ajay, Pulkit Agrawal, Georgia Chalvatzaki

CVPR 2024 OpenEQA: Embodied Question Answering in the Era of Foundation Models Arjun Majumdar, Anurag Ajay, Xiaohan Zhang, Pranav Putta, Sriram Yenamandra, Mikael Henaff, Sneha Silwal, Paul Mcvay, Oleksandr Maksymets, Sergio Arnaud, Karmesh Yadav, Qiyang Li, Ben Newman, Mohit Sharma, Vincent Berges, Shiqi Zhang, Pulkit Agrawal, Yonatan Bisk, Dhruv Batra, Mrinal Kalakrishnan, Franziska Meier, Chris Paxton, Alexander Sax, Aravind Rajeswaran

NeurIPS 2023 Compositional Foundation Models for Hierarchical Planning Anurag Ajay, Seungwook Han, Yilun Du, Shuang Li, Abhi Gupta, Tommi Jaakkola, Josh Tenenbaum, Leslie P. Kaelbling, Akash Srivastava, Pulkit Agrawal

NeurIPSW 2023 Compositional Foundation Models for Hierarchical Planning Anurag Ajay, Seungwook Han, Yilun Du, Shuang Li, Abhi Gupta, Tommi Jaakkola, Joshua Tenenbaum, Leslie Kaelbling, Akash Srivastava, Pulkit Agrawal

ICLR 2023 Is Conditional Generative Modeling All You Need for Decision Making? Anurag Ajay, Yilun Du, Abhi Gupta, Joshua B. Tenenbaum, Tommi S. Jaakkola, Pulkit Agrawal

ICML 2023 Parallel $q$-Learning: Scaling Off-Policy Reinforcement Learning Under Massively Parallel Simulation Zechu Li, Tao Chen, Zhang-Wei Hong, Anurag Ajay, Pulkit Agrawal

ICML 2023 Statistical Learning Under Heterogeneous Distribution Shift Max Simchowitz, Anurag Ajay, Pulkit Agrawal, Akshay Krishnamurthy

NeurIPS 2022 Distributionally Adaptive Meta Reinforcement Learning Anurag Ajay, Abhishek Gupta, Dibya Ghosh, Sergey Levine, Pulkit Agrawal

ICMLW 2022 Distributionally Adaptive Meta Reinforcement Learning Anurag Ajay, Dibya Ghosh, Sergey Levine, Pulkit Agrawal, Abhishek Gupta

NeurIPSW 2022 Is Conditional Generative Modeling All You Need for Decision-Making? Anurag Ajay, Yilun Du, Abhi Gupta, Joshua B. Tenenbaum, Tommi S. Jaakkola, Pulkit Agrawal

ICML 2022 Offline RL Policies Should Be Trained to Be Adaptive Dibya Ghosh, Anurag Ajay, Pulkit Agrawal, Sergey Levine

ICLR 2022 Overcoming the Spectral Bias of Neural Value Approximation Ge Yang, Anurag Ajay, Pulkit Agrawal

ICLR 2021 OPAL: Offline Primitive Discovery for Accelerating Offline Reinforcement Learning Anurag Ajay, Aviral Kumar, Pulkit Agrawal, Sergey Levine, Ofir Nachum

NeurIPS 2016 Backprop KF: Learning Discriminative Deterministic State Estimators Tuomas Haarnoja, Anurag Ajay, Sergey Levine, Pieter Abbeel