Sachan, Mrinmaya

35 publications

ICLRW 2025 Antipodal Pairing and Mechanistic Signals in Dense SAE Latents Alessandro Stolfo, Ben Peng Wu, Mrinmaya Sachan

NeurIPS 2025 Are Language Models Efficient Reasoners? a Perspective from Logic Programming Andreas Opedal, Yanick Zengaffinen, Haruki Shirakami, Clemente Pasti, Mrinmaya Sachan, Abulhair Saparov, Ryan Cotterell, Bernhard Schölkopf

AAAI 2025 Calibrating Large Language Models with Sample Consistency Qing Lyu, Kumar Shridhar, Chaitanya Malaviya, Li Zhang, Yanai Elazar, Niket Tandon, Marianna Apidianaki, Mrinmaya Sachan, Chris Callison-Burch

NeurIPS 2025 Dense SAE Latents Are Features, Not Bugs Xiaoqing Sun, Alessandro Stolfo, Joshua Engels, Ben Peng Wu, Senthooran Rajamanoharan, Mrinmaya Sachan, Max Tegmark

ICML 2025 Do Vision-Language Models Really Understand Visual Language? Yifan Hou, Buse Giledereli, Yilei Tu, Mrinmaya Sachan

ICLR 2025 Language Model Alignment in Multilingual Trolley Problems Zhijing Jin, Max Kleiman-Weiner, Giorgio Piatti, Sydney Levine, Jiarui Liu, Fernando Gonzalez Adauto, Francesco Ortu, András Strausz, Mrinmaya Sachan, Rada Mihalcea, Yejin Choi, Bernhard Schölkopf

ICLR 2025 MathGAP: Out-of-Distribution Evaluation on Problems with Arbitrarily Complex Proofs Andreas Opedal, Haruki Shirakami, Bernhard Schölkopf, Abulhair Saparov, Mrinmaya Sachan

NeurIPS 2025 Personalized Exercise Recommendation with Semantically-Grounded Knowledge Tracing Yilmazcan Ozyurt, Tunaberk Almaci, Stefan Feuerriegel, Mrinmaya Sachan

NeurIPS 2025 SeePhys: Does Seeing Help Thinking? – Benchmarking Vision-Based Physics Reasoning Kun Xiang, Heng Li, Terry Jingchen Zhang, Yinya Huang, Zirong Liu, Peixin Qu, Jixi He, Jiaqi Chen, Yu-Jie Yuan, Jianhua Han, Hang Xu, Hanhui Li, Mrinmaya Sachan, Xiaodan Liang

ICLRW 2024 Agents: An Open-Source Framework for Autonomous Language Agents Wangchunshu Zhou, Yuchen Eleanor Jiang, Long Li, Jialong Wu, Tiannan Wang, Shuai Wang, Jiamin Chen, Jintian Zhang, Jing Chen, Xiangru Tang, Peng Cui, Ningyu Zhang, Huajun Chen, Mrinmaya Sachan

NeurIPSW 2024 Analyzing Human Questioning Behavior and Causal Curiosity Through Natural Queries Roberto Ceraolo, Dmitrii Kharlapenko, Amélie Reymond, Rada Mihalcea, Bernhard Schölkopf, Mrinmaya Sachan, Zhijing Jin

ICLR 2024 Can Large Language Models Infer Causation from Correlation? Zhijing Jin, Jiarui Liu, Zhiheng Lyu, Spencer Poff, Mrinmaya Sachan, Rada Mihalcea, Mona T. Diab, Bernhard Schölkopf

NeurIPS 2024 Confidence Regulation Neurons in Language Models Alessandro Stolfo, Ben Wu, Wes Gurnee, Yonatan Belinkov, Xingyi Song, Mrinmaya Sachan, Neel Nanda

ICMLW 2024 Confidence Regulation Neurons in Language Models Alessandro Stolfo, Ben Peng Wu, Wes Gurnee, Yonatan Belinkov, Xingyi Song, Mrinmaya Sachan, Neel Nanda

NeurIPS 2024 Cooperate or Collapse: Emergence of Sustainable Cooperation in a Society of LLM Agents Giorgio Piatti, Zhijing Jin, Max Kleiman-Weiner, Bernhard Schölkopf, Mrinmaya Sachan, Rada Mihalcea

ICML 2024 Do Language Models Exhibit the Same Cognitive Biases in Problem Solving as Human Learners? Andreas Opedal, Alessandro Stolfo, Haruki Shirakami, Ying Jiao, Ryan Cotterell, Bernhard Schölkopf, Abulhair Saparov, Mrinmaya Sachan

NeurIPSW 2024 Multilingual Trolley Problems for Language Models Zhijing Jin, Max Kleiman-Weiner, Giorgio Piatti, Sydney Levine, Jiarui Liu, Fernando Gonzalez Adauto, Francesco Ortu, András Strausz, Mrinmaya Sachan, Rada Mihalcea, Yejin Choi, Bernhard Schölkopf

NeurIPS 2024 On Affine Homotopy Between Language Encoders Robin S. M. Chan, Reda Boumasmoud, Anej Svete, Yuxin Ren, Qipeng Guo, Zhijing Jin, Shauli Ravfogel, Mrinmaya Sachan, Bernhard Schölkopf, Mennatallah El-Assady, Ryan Cotterell

ICLRW 2024 The ART of LLM Refinement: Ask, Refine, Trust Kumar Shridhar, Koustuv Sinha, Andrew Cohen, Tianlu Wang, Ping Yu, Ramakanth Pasunuru, Mrinmaya Sachan, Jason E Weston, Asli Celikyilmaz

ICMLW 2024 Towards Aligning Language Models with Textual Feedback Saüc Abadal Lloret, Shehzaad Dhuliawala, Keerthiram Murugesan, Mrinmaya Sachan

TMLR 2024 Variational Classification: A Probabilistic Generalization of the SoftMax Classifier Shehzaad Zuzar Dhuliawala, Mrinmaya Sachan, Carl Allen

NeurIPS 2023 CLadder: Assessing Causal Reasoning in Language Models Zhijing Jin, Yuen Chen, Felix Leeb, Luigi Gresele, Ojasv Kamal, Zhiheng Lyu, Kevin Blin, Fernando Gonzalez Adauto, Max Kleiman-Weiner, Mrinmaya Sachan, Bernhard Schölkopf

ICML 2023 Controlled Text Generation with Natural Language Instructions Wangchunshu Zhou, Yuchen Eleanor Jiang, Ethan Wilcox, Ryan Cotterell, Mrinmaya Sachan

ICML 2023 Infusing Lattice Symmetry Priors in Attention Mechanisms for Sample-Efficient Abstract Geometric Reasoning Mattia Atzeni, Mrinmaya Sachan, Andreas Loukas

NeurIPSW 2023 Variational Classification Shehzaad Dhuliawala, Mrinmaya Sachan, Carl Allen

NeurIPSW 2023 Variational Classification Shehzaad Zuzar Dhuliawala, Mrinmaya Sachan, Carl Allen

ICLR 2022 Case-Based Reasoning for Better Generalization in Textual Reinforcement Learning Mattia Atzeni, Shehzaad Zuzar Dhuliawala, Keerthiram Murugesan, Mrinmaya Sachan

AAAI 2022 Deep Clustering of Text Representations for Supervision-Free Probing of Syntax Vikram Gupta, Haoyue Shi, Kevin Gimpel, Mrinmaya Sachan

TMLR 2022 Learning the Transformer Kernel Sankalan Pal Chowdhury, Adamos Solomou, Kumar Avinava Dubey, Mrinmaya Sachan

NeurIPS 2022 When to Make Exceptions: Exploring Language Models as Accounts of Human Moral Judgment Zhijing Jin, Sydney Levine, Fernando Gonzalez Adauto, Ojasv Kamal, Maarten Sap, Mrinmaya Sachan, Rada Mihalcea, Josh Tenenbaum, Bernhard Schölkopf

AAAI 2021 Text-Based RL Agents with Commonsense Knowledge: New Challenges, Environments and Baselines Keerthiram Murugesan, Mattia Atzeni, Pavan Kapanipathi, Pushkar Shukla, Sadhana Kumaravel, Gerald Tesauro, Kartik Talamadupula, Mrinmaya Sachan, Murray Campbell

MLHC 2018 Effective Use of Bidirectional Language Modeling for Transfer Learning in Biomedical Named Entity Recognition Devendra Singh Sachan, Pengtao Xie, Mrinmaya Sachan, Eric P. Xing

NeurIPS 2018 Learning Pipelines with Limited Data and Domain Knowledge: A Study in Parsing Physics Problems Mrinmaya Sachan, Kumar Avinava Dubey, Tom M. Mitchell, Dan Roth, Eric P Xing

IJCAI 2016 Grounding Topic Models with Knowledge Bases Zhiting Hu, Gang Luo, Mrinmaya Sachan, Eric P. Xing, Zaiqing Nie

IJCAI 2015 An Active Learning Approach to Coreference Resolution Mrinmaya Sachan, Eduard H. Hovy, Eric P. Xing