Kembhavi, Aniruddha

58 publications

CVPR 2025 Eval3D: Interpretable and Fine-Grained Evaluation for 3D Generation Shivam Duggal, Yushi Hu, Oscar Michel, Aniruddha Kembhavi, William T. Freeman, Noah A. Smith, Ranjay Krishna, Antonio Torralba, Ali Farhadi, Wei-Chiu Ma

CVPR 2025 Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models Matt Deitke, Christopher Clark, Sangho Lee, Rohun Tripathi, Yue Yang, Jae Sung Park, Mohammadreza Salehi, Niklas Muennighoff, Kyle Lo, Luca Soldaini, Jiasen Lu, Taira Anderson, Erin Bransom, Kiana Ehsani, Huong Ngo, YenSung Chen, Ajay Patel, Mark Yatskar, Chris Callison-Burch, Andrew Head, Rose Hendrix, Favyen Bastani, Eli VanderBilt, Nathan Lambert, Yvonne Chou, Arnavi Chheda, Jenna Sparks, Sam Skjonsberg, Michael Schmitz, Aaron Sarnat, Byron Bischoff, Pete Walsh, Chris Newell, Piper Wolters, Tanmay Gupta, Kuo-Hao Zeng, Jon Borchardt, Dirk Groeneveld, Crystal Nam, Sophie Lebrecht, Caitlin Wittlif, Carissa Schoenick, Oscar Michel, Ranjay Krishna, Luca Weihs, Noah A. Smith, Hannaneh Hajishirzi, Ross Girshick, Ali Farhadi, Aniruddha Kembhavi

CVPR 2025 One Diffusion to Generate Them All Duong H. Le, Tuan Pham, Sangho Lee, Christopher Clark, Aniruddha Kembhavi, Stephan Mandt, Ranjay Krishna, Jiasen Lu

CVPR 2025 ReSpec: Relevance and Specificity Grounded Online Filtering for Learning on Video-Text Data Streams Chris Dongjoo Kim, Jihwan Moon, Sangwoo Moon, Heeseung Yun, Sihaeng Lee, Aniruddha Kembhavi, Soonyoung Lee, Gunhee Kim, Sangho Lee, Christopher Clark

TMLR 2024 Exposing and Addressing Cross-Task Inconsistency in Unified Vision-Language Models Adyasha Maharana, Amita Kamath, Christopher Clark, Mohit Bansal, Aniruddha Kembhavi

NeurIPS 2024 From an Image to a Scene: Learning to Imagine the World from a Million 360° Videos Matthew Wallingford, Anand Bhattad, Aditya Kusupati, Vivek Ramanujan, Matt Deitke, Sham Kakade, Aniruddha Kembhavi, Roozbeh Mottaghi, Wei-Chiu Ma, Ali Farhadi

CVPR 2024 Holodeck: Language Guided Generation of 3D Embodied AI Environments Yue Yang, Fan-Yun Sun, Luca Weihs, Eli VanderBilt, Alvaro Herrasti, Winson Han, Jiajun Wu, Nick Haber, Ranjay Krishna, Lingjie Liu, Chris Callison-Burch, Mark Yatskar, Aniruddha Kembhavi, Christopher Clark

CVPR 2024 Iterated Learning Improves Compositionality in Large Vision-Language Models Chenhao Zheng, Jieyu Zhang, Aniruddha Kembhavi, Ranjay Krishna

CVPRW 2024 MIMIC: Masked Image Modeling with Image Correspondences Kalyani Marathe, Mahtab Bigverdi, Nishat Khan, Tuhin Kundu, Patrick Howe, Sharan Ranjit S, Anand Bhattad, Aniruddha Kembhavi, Linda G. Shapiro, Ranjay Krishna

CoRL 2024 PoliFormer: Scaling On-Policy RL with Transformers Results in Masterful Navigators Kuo-Hao Zeng, Zichen Zhang, Kiana Ehsani, Rose Hendrix, Jordi Salvador, Alvaro Herrasti, Ross Girshick, Aniruddha Kembhavi, Luca Weihs

CVPR 2024 Promptable Behaviors: Personalizing Multi-Objective Rewards from Human Preferences Minyoung Hwang, Luca Weihs, Chanwoo Park, Kimin Lee, Aniruddha Kembhavi, Kiana Ehsani

CVPR 2024 SPOC: Imitating Shortest Paths in Simulation Enables Effective Navigation and Manipulation in the Real World Kiana Ehsani, Tanmay Gupta, Rose Hendrix, Jordi Salvador, Luca Weihs, Kuo-Hao Zeng, Kunal Pratap Singh, Yejin Kim, Winson Han, Alvaro Herrasti, Ranjay Krishna, Dustin Schwenk, Eli VanderBilt, Aniruddha Kembhavi

CVPR 2024 Seeing the Unseen: Visual Common Sense for Semantic Placement Ram Ramrakhya, Aniruddha Kembhavi, Dhruv Batra, Zsolt Kira, Kuo-Hao Zeng, Luca Weihs

ICLR 2024 Selective Visual Representations Improve Convergence and Generalization for Embodied AI Ainaz Eftekhar, Kuo-Hao Zeng, Jiafei Duan, Ali Farhadi, Aniruddha Kembhavi, Ranjay Krishna

NeurIPS 2024 Task Me Anything Jieyu Zhang, Weikai Huang, Zixian Ma, Oscar Michel, Dong He, Tanmay Gupta, Wei-Chiu Ma, Ali Farhadi, Aniruddha Kembhavi, Ranjay Krishna

NeurIPSW 2024 Taskverse: A Benchmark Generation Engine for Multi-Modal Language Model Jieyu Zhang, Weikai Huang, Zixian Ma, Oscar Michel, Dong He, Tanmay Gupta, Wei-Chiu Ma, Ali Farhadi, Aniruddha Kembhavi, Ranjay Krishna

CVPR 2024 Unified-IO 2: Scaling Autoregressive Multimodal Models with Vision Language Audio and Action Jiasen Lu, Christopher Clark, Sangho Lee, Zichen Zhang, Savya Khosla, Ryan Marten, Derek Hoiem, Aniruddha Kembhavi

CVPR 2023 EXCALIBUR: Encouraging and Evaluating Embodied Exploration Hao Zhu, Raghav Kapoor, So Yeon Min, Winson Han, Jiatai Li, Kaiwen Geng, Graham Neubig, Yonatan Bisk, Aniruddha Kembhavi, Luca Weihs

TMLR 2023 FLUID: A Unified Evaluation Framework for Flexible Sequential Data Matthew Wallingford, Aditya Kusupati, Keivan Alizadeh-Vahid, Aaron Walsman, Aniruddha Kembhavi, Ali Farhadi

ICCV 2023 I Can't Believe There's No Images! Learning Visual Tasks Using Only Language Supervision Sophia Gu, Christopher Clark, Aniruddha Kembhavi

NeurIPS 2023 Neural Priming for Sample-Efficient Adaptation Matthew Wallingford, Vivek Ramanujan, Alex Fang, Aditya Kusupati, Roozbeh Mottaghi, Aniruddha Kembhavi, Ludwig Schmidt, Ali Farhadi

ICLR 2023 Neural Radiance Field Codebooks Matthew Wallingford, Aditya Kusupati, Alex Fang, Vivek Ramanujan, Aniruddha Kembhavi, Roozbeh Mottaghi, Ali Farhadi

NeurIPS 2023 OBJECT 3DIT: Language-Guided 3D-Aware Image Editing Oscar Michel, Anand Bhattad, Eli VanderBilt, Ranjay Krishna, Aniruddha Kembhavi, Tanmay Gupta

NeurIPS 2023 Objaverse-XL: A Universe of 10m+ 3D Objects Matt Deitke, Ruoshi Liu, Matthew Wallingford, Huong Ngo, Oscar Michel, Aditya Kusupati, Alan Fan, Christian Laforte, Vikram Voleti, Samir Yitzhak Gadre, Eli VanderBilt, Aniruddha Kembhavi, Carl Vondrick, Georgia Gkioxari, Kiana Ehsani, Ludwig Schmidt, Ali Farhadi

CVPR 2023 Objaverse: A Universe of Annotated 3D Objects Matt Deitke, Dustin Schwenk, Jordi Salvador, Luca Weihs, Oscar Michel, Eli VanderBilt, Ludwig Schmidt, Kiana Ehsani, Aniruddha Kembhavi, Ali Farhadi

CVPR 2023 Phone2Proc: Bringing Robust Robots into Our Chaotic World Matt Deitke, Rose Hendrix, Ali Farhadi, Kiana Ehsani, Aniruddha Kembhavi

ICCV 2023 SatlasPretrain: A Large-Scale Dataset for Remote Sensing Image Understanding Favyen Bastani, Piper Wolters, Ritwik Gupta, Joe Ferdinando, Aniruddha Kembhavi

ICCV 2023 Scene Graph Contrastive Learning for Embodied Navigation Kunal Pratap Singh, Jordi Salvador, Luca Weihs, Aniruddha Kembhavi

NeurIPS 2023 SugarCrepe: Fixing Hackable Benchmarks for Vision-Language Compositionality Cheng-Yu Hsieh, Jieyu Zhang, Zixian Ma, Aniruddha Kembhavi, Ranjay Krishna

ICLR 2023 UNIFIED-IO: A Unified Model for Vision, Language, and Multi-Modal Tasks Jiasen Lu, Christopher Clark, Rowan Zellers, Roozbeh Mottaghi, Aniruddha Kembhavi

CVPR 2023 Visual Programming: Compositional Visual Reasoning Without Training Tanmay Gupta, Aniruddha Kembhavi

NeurIPS 2022 Ask4Help: Learning to Leverage an Expert for Embodied Tasks Kunal Pratap Singh, Luca Weihs, Alvaro Herrasti, Jonghyun Choi, Aniruddha Kembhavi, Roozbeh Mottaghi

TMLR 2022 Benchmarking Progress to Infant-Level Physical Reasoning in AI Luca Weihs, Amanda Yuile, Renée Baillargeon, Cynthia Fisher, Gary Marcus, Roozbeh Mottaghi, Aniruddha Kembhavi

ECCV 2022 Object Manipulation via Visual Target Localization Kiana Ehsani, Ali Farhadi, Aniruddha Kembhavi, Roozbeh Mottaghi

CVPR 2022 Simple but Effective: CLIP Embeddings for Embodied AI Apoorv Khandelwal, Luca Weihs, Roozbeh Mottaghi, Aniruddha Kembhavi

CVPR 2022 Towards General Purpose Vision Systems: An End-to-End Task-Agnostic Vision-Language Architecture Tanmay Gupta, Amita Kamath, Aniruddha Kembhavi, Derek Hoiem

ECCV 2022 Webly Supervised Concept Expansion for General Purpose Vision Models Amita Kamath, Christopher Clark, Tanmay Gupta, Eric Kolve, Derek Hoiem, Aniruddha Kembhavi

CVPR 2022 What Do Navigation Agents Learn About Their Environment? Kshitij Dwivedi, Gemma Roig, Aniruddha Kembhavi, Roozbeh Mottaghi

NeurIPS 2022 🏘️ ProcTHOR: Large-Scale Embodied AI Using Procedural Generation Matt Deitke, Eli VanderBilt, Alvaro Herrasti, Luca Weihs, Kiana Ehsani, Jordi Salvador, Winson Han, Eric Kolve, Aniruddha Kembhavi, Roozbeh Mottaghi

NeurIPS 2021 Bridging the Imitation Gap by Adaptive Insubordination Luca Weihs, Unnat Jain, Iou-Jen Liu, Jordi Salvador, Svetlana Lazebnik, Aniruddha Kembhavi, Alex Schwing

NeurIPS 2021 Container: Context Aggregation Networks Peng Gao, Jiasen Lu, Hongsheng Li, Roozbeh Mottaghi, Aniruddha Kembhavi

ICCV 2021 GridToPix: Training Embodied Agents with Minimal Supervision Unnat Jain, Iou-Jen Liu, Svetlana Lazebnik, Aniruddha Kembhavi, Luca Weihs, Alexander G. Schwing

ICLR 2021 Learning Generalizable Visual Representations via Interactive Gameplay Luca Weihs, Aniruddha Kembhavi, Kiana Ehsani, Sarah M Pratt, Winson Han, Alvaro Herrasti, Eric Kolve, Dustin Schwenk, Roozbeh Mottaghi, Ali Farhadi

CVPR 2021 ManipulaTHOR: A Framework for Visual Object Manipulation Kiana Ehsani, Winson Han, Alvaro Herrasti, Eli VanderBilt, Luca Weihs, Eric Kolve, Aniruddha Kembhavi, Roozbeh Mottaghi

ICCV 2021 RobustNav: Towards Benchmarking Robustness in Embodied Navigation Prithvijit Chattopadhyay, Judy Hoffman, Roozbeh Mottaghi, Aniruddha Kembhavi

CVPR 2021 Visual Room Rearrangement Luca Weihs, Matt Deitke, Aniruddha Kembhavi, Roozbeh Mottaghi

CVPR 2021 Visual Semantic Role Labeling for Video Understanding Arka Sadhu, Tanmay Gupta, Mark Yatskar, Ram Nevatia, Aniruddha Kembhavi

ECCV 2020 A Cordial Sync: Going Beyond Marginal Policies for Multi-Agent Embodied Tasks Unnat Jain, Luca Weihs, Eric Kolve, Ali Farhadi, Svetlana Lazebnik, Aniruddha Kembhavi, Alexander Schwing

ECCV 2020 Grounded Situation Recognition Sarah Pratt, Mark Yatskar, Luca Weihs, Ali Farhadi, Aniruddha Kembhavi

NeurIPS 2020 Learning About Objects by Learning to Interact with Them Martin Lohmann, Jordi Salvador, Aniruddha Kembhavi, Roozbeh Mottaghi

NeurIPS 2020 Supermasks in Superposition Mitchell Wortsman, Vivek Ramanujan, Rosanne Liu, Aniruddha Kembhavi, Mohammad Rastegari, Jason Yosinski, Ali Farhadi

ECCV 2018 Imagine This! Scripts to Compositions to Videos Tanmay Gupta, Dustin Schwenk, Ali Farhadi, Derek Hoiem, Aniruddha Kembhavi

CVPR 2017 Are You Smarter than a Sixth Grader? Textbook Question Answering for Multimodal Machine Comprehension Aniruddha Kembhavi, Minjoon Seo, Dustin Schwenk, Jonghyun Choi, Ali Farhadi, Hannaneh Hajishirzi

ICLR 2017 Bidirectional Attention Flow for Machine Comprehension Min Joon Seo, Aniruddha Kembhavi, Ali Farhadi, Hannaneh Hajishirzi

ECCV 2016 A Diagram Is Worth a Dozen Images Aniruddha Kembhavi, Mike Salvato, Eric Kolve, Min Joon Seo, Hannaneh Hajishirzi, Ali Farhadi

ECCV 2010 Why Did the Person Cross the Road (There)? Scene Understanding Using Probabilistic Logic Models and Common Sense Reasoning Aniruddha Kembhavi, Tom Yeh, Larry S. Davis

ICCV 2009 Human Detection Using Partial Least Squares Analysis William Robson Schwartz, Aniruddha Kembhavi, David Harwood, Larry S. Davis

ICCV 2009 Incremental Multiple Kernel Learning for Object Recognition Aniruddha Kembhavi, Behjat Siddiquie, Roland Miezianko, Scott McCloskey, Larry S. Davis