Stengel-Eskin, Elias

26 publications

ICLR 2026 Calibrating Verbalized Confidence with Self-Generated Distractors Victor Wang, Elias Stengel-Eskin

ICLR 2026 Gistify: Codebase-Level Understanding via Runtime Execution Hyunji Lee, Minseon Kim, Chinmay Singh, Matheus Pereira, Atharv Sonwane, Isadora White, Elias Stengel-Eskin, Mohit Bansal, Zhengyan Shi, Alessandro Sordoni, Marc-Alexandre Côté, Xingdi Yuan, Lucas Caccia

ICLR 2026 One Life to Learn: Inferring Symbolic World Models for Stochastic Environments from Unguided Exploration Zaid Khan, Archiki Prasad, Elias Stengel-Eskin, Jaemin Cho, Mohit Bansal

ICLR 2026 PoSh: Using Scene Graphs to Guide LLMs-as-a-Judge for Detailed Image Descriptions Amith Ananthram, Elias Stengel-Eskin, Lorena A. Bradford, Julia Demarest, Adam Purvis, Keith Krut, Robert Stein, Rina Elster Pantalony, Mohit Bansal, Kathleen McKeown

ICLR 2026 TrustGen: A Platform of Dynamic Benchmarking on the Trustworthiness of Generative Foundation Models Yue Huang, Chujie Gao, Siyuan Wu, Haoran Wang, Xiangqi Wang, Jiayi Ye, Yujun Zhou, Yanbo Wang, Jiawen Shi, Qihui Zhang, Han Bao, Zhaoyi Liu, Yuan Li, Tianrui Guan, Peiran Wang, Haomin Zhuang, Dongping Chen, Kehan Guo, Andy Zou, Bryan Hooi, Caiming Xiong, Elias Stengel-Eskin, Hongyang Zhang, Hongzhi Yin, Huan Zhang, Huaxiu Yao, Jieyu Zhang, Jaehong Yoon, Kai Shu, Ranjay Krishna, Swabha Swayamdipta, Weijia Shi, Xiang Li, Yuexing Hao, Zhihao Jia, Zhize Li, Xiuying Chen, Zhengzhong Tu, Xiyang Hu, Tianyi Zhou, Jieyu Zhao, Lichao Sun, Furong Huang, Or Cohen-Sasson, Prasanna Sattigeri, Anka Reuel, Max Lamparth, Yue Zhao, Nouha Dziri, Yu Su, Huan Sun, Heng Ji, Chaowei Xiao, Mohit Bansal, Nitesh V Chawla, Jian Pei, Jianfeng Gao, Michael Backes, Philip S. Yu, Neil Zhenqiang Gong, Pin-Yu Chen, Bo Li, Dawn Song, Xiangliang Zhang

ICCV 2025 CAPTURE: Evaluating Spatial Reasoning in Vision Language Models via Occluded Object Counting Atin Pothiraj, Elias Stengel-Eskin, Jaemin Cho, Mohit Bansal

ICLR 2025 DataEnvGym: Data Generation Agents in Teacher Environments with Student Feedback Zaid Khan, Elias Stengel-Eskin, Jaemin Cho, Mohit Bansal

NeurIPS 2025 LASeR: Learning to Adaptively Select Reward Models with Multi-Arm Bandits Duy Nguyen, Archiki Prasad, Elias Stengel-Eskin, Mohit Bansal

TMLR 2025 Reliable and Responsible Foundation Models Xinyu Yang, Junlin Han, Rishi Bommasani, Jinqi Luo, Wenjie Qu, Wangchunshu Zhou, Adel Bibi, Xiyao Wang, Jaehong Yoon, Elias Stengel-Eskin, Shengbang Tong, Lingfeng Shen, Rafael Rafailov, Runjia Li, Zhaoyang Wang, Yiyang Zhou, Chenhang Cui, Yu Wang, Wenhao Zheng, Huichi Zhou, Jindong Gu, Zhaorun Chen, Peng Xia, Tony Lee, Thomas P Zollo, Vikash Sehwag, Jixuan Leng, Jiuhai Chen, Yuxin Wen, Huan Zhang, Zhun Deng, Linjun Zhang, Pavel Izmailov, Pang Wei Koh, Yulia Tsvetkov, Andrew Gordon Wilson, Jiaheng Zhang, James Zou, Cihang Xie, Hao Wang, Philip Torr, Julian McAuley, David Alvarez-Melis, Florian Tramèr, Kaidi Xu, Suman Jana, Chris Callison-Burch, Rene Vidal, Filippos Kokkinos, Mohit Bansal, Beidi Chen, Huaxiu Yao

ICLR 2025 See It from My Perspective: How Language Affects Cultural Bias in Image Understanding Amith Ananthram, Elias Stengel-Eskin, Mohit Bansal, Kathleen McKeown

ICLR 2025 System 1.x: Learning to Balance Fast and Slow Planning with Language Models Swarnadeep Saha, Archiki Prasad, Justin Chen, Peter Hase, Elias Stengel-Eskin, Mohit Bansal

CVPR 2025 VideoTree: Adaptive Tree-Based Video Representation for LLM Reasoning on Long Videos Ziyang Wang, Shoubin Yu, Elias Stengel-Eskin, Jaehong Yoon, Feng Cheng, Gedas Bertasius, Mohit Bansal

ECCV 2024 Contrastive Region Guidance: Improving Grounding in Vision-Language Models Without Training David Wan, Jaemin Cho, Elias Stengel-Eskin, Mohit Bansal

TMLR 2024 Fundamental Problems with Model Editing: How Should Rational Belief Revision Work in LLMs? Peter Hase, Thomas Hofweber, Xiang Zhou, Elias Stengel-Eskin, Mohit Bansal

NeurIPS 2024 GTBench: Uncovering the Strategic Reasoning Capabilities of LLMs via Game-Theoretic Evaluations Jinhao Duan, Renming Zhang, James Diffenderfer, Bhavya Kailkhura, Lichao Sun, Elias Stengel-Eskin, Mohit Bansal, Tianlong Chen, Kaidi Xu

NeurIPS 2024 LACIE: Listener-Aware Finetuning for Calibration in Large Language Models Elias Stengel-Eskin, Peter Hase, Mohit Bansal

ICML 2024 Language-Guided Skill Learning with Temporal Variational Inference Haotian Fu, Pratyusha Sharma, Elias Stengel-Eskin, George Konidaris, Nicolas Le Roux, Marc-Alexandre Côté, Xingdi Yuan

ICLRW 2024 Language-Guided Skill Learning with Temporal Variational Inference Haotian Fu, Pratyusha Sharma, Elias Stengel-Eskin, George Konidaris, Nicolas Le Roux, Marc-Alexandre Côté, Xingdi Yuan

ICML 2024 MAGDi: Structured Distillation of Multi-Agent Interaction Graphs Improves Reasoning in Smaller Language Models Justin Chen, Swarnadeep Saha, Elias Stengel-Eskin, Mohit Bansal

ICML 2024 ReGAL: Refactoring Programs to Discover Generalizable Abstractions Elias Stengel-Eskin, Archiki Prasad, Mohit Bansal

ICLR 2024 Rephrase, Augment, Reason: Visual Grounding of Questions for Vision-Language Models Archiki Prasad, Elias Stengel-Eskin, Mohit Bansal

CoLLAs 2024 Sub-Goal Distillation: A Method to Improve Small Language Agents Maryam Hashemzadeh, Elias Stengel-Eskin, Sarath Chandar, Marc-Alexandre Côté

ICLR 2024 Zero and Few-Shot Semantic Parsing with Ambiguous Inputs Elias Stengel-Eskin, Kyle Rawlins, Benjamin Van Durme

CVPR 2023 Super-CLEVR: A Virtual Benchmark to Diagnose Domain Robustness in Visual Reasoning Zhuowan Li, Xingrui Wang, Elias Stengel-Eskin, Adam Kortylewski, Wufei Ma, Benjamin Van Durme, Alan L. Yuille

ICCV 2021 Calibrating Concepts and Operations: Towards Symbolic Reasoning on Real Images Zhuowan Li, Elias Stengel-Eskin, Yixiao Zhang, Cihang Xie, Quan Hung Tran, Benjamin Van Durme, Alan Yuille

CoRL 2021 Guiding Multi-Step Rearrangement Tasks with Natural Language Instructions Elias Stengel-Eskin, Andrew Hundt, Zhuohong He, Aditya Murali, Nakul Gopalan, Matthew Gombolay, Gregory Hager