Verma, Mudit

12 publications

TMLR 2025 Do Think Tags Really Help LLMs Plan? a Critical Evaluation of ReAct-Style Prompting Siddhant Bhambri, Mudit Verma, Subbarao Kambhampati

ICML 2025 ITBench: Evaluating AI Agents Across Diverse Real-World IT Automation Tasks Saurabh Jha, Rohan R. Arora, Yuji Watanabe, Takumi Yanagawa, Yinfang Chen, Jackson Clark, Bhavya Bhavya, Mudit Verma, Harshit Kumar, Hirokuni Kitahara, Noah Zheutlin, Saki Takano, Divya Pathak, Felix George, Xinbo Wu, Bekir O Turkkan, Gerard Vanloo, Michael Nidd, Ting Dai, Oishik Chatterjee, Pranjal Gupta, Suranjana Samanta, Pooja Aggarwal, Rong Lee, Jae-Wook Ahn, Debanjana Kar, Amit Paradkar, Yu Deng, Pratibha Moogi, Prateeti Mohapatra, Naoki Abe, Chandrasekhar Narayanaswami, Tianyin Xu, Lav R. Varshney, Ruchi Mahindru, Anca Sailer, Laura Shwartz, Daby Sow, Nicholas C. M. Fuller, Ruchir Puri

NeurIPSW 2024 Do Think Tags Really Help LLMs Plan? a Critical Evaluation of ReAct-Style Prompting Mudit Verma, Siddhant Bhambri, Subbarao Kambhampati

ICLR 2024 Hindsight PRIORs for Reward Learning from Human Preferences Mudit Verma, Katherine Metcalf

ICML 2024 Position: LLMs Can’t Plan, but Can Help Planning in LLM-Modulo Frameworks Subbarao Kambhampati, Karthik Valmeekam, Lin Guan, Mudit Verma, Kaya Stechly, Siddhant Bhambri, Lucas Paul Saldyt, Anil B Murthy

ICMLW 2023 Exploiting Action Distances for Reward Learning from Human Preferences Mudit Verma, Siddhant Bhambri, Subbarao Kambhampati

ICMLW 2023 Preference Proxies: Evaluating Large Language Models in Capturing Human Preferences in Human-AI Tasks Mudit Verma, Siddhant Bhambri, Subbarao Kambhampati

ICMLW 2023 Preference Proxies: Evaluating Large Language Models in Capturing Human Preferences in Human-AI Tasks Mudit Verma, Siddhant Bhambri, Subbarao Kambhampati

ICLR 2022 Bridging the Gap: Providing Post-Hoc Symbolic Explanations for Sequential Decision-Making Problems with Inscrutable Representations Sarath Sreedharan, Utkarsh Soni, Mudit Verma, Siddharth Srivastava, Subbarao Kambhampati

AAAI 2022 Symbols as a Lingua Franca for Bridging Human-AI Chasm for Explainable and Advisable AI Systems Subbarao Kambhampati, Sarath Sreedharan, Mudit Verma, Yantian Zha, Lin Guan

NeurIPS 2021 Widening the Pipeline in Human-Guided Reinforcement Learning with Explanation and Context-Aware Data Augmentation Lin Guan, Mudit Verma, Suna Guo, Ruohan Zhang, Subbarao Kambhampati

NeurIPSW 2020 Explanation Augmented Feedback in Human-in-the-Loop Reinforcement Learning Lin Guan, Mudit Verma, Sihang Guo, Ruohan Zhang, Subbarao Kambhampati