Chai, Jiajun

10 publications

ICLR 2026 LogiConBench: Benchmarking Logical Consistencies of LLMs Zheng Chen, Chuan Zhou, Fengxiang Cheng, Yip Tin Po, Fenrong Liu, Yisen Wang, Jiajun Chai, Xiaohan Wang, Guojun Yin, Wei Lin, Bo Li, Haoxuan Li, Zhouchen Lin

ICLR 2026 MAD-Logic: Multi-Agent Debate Enhances Symbolic Translation and Reasoning Haocheng Yang, Fengxiang Cheng, Tianjun Yao, Mengyue Yang, Jiajun Chai, Xiaohan Wang, Guojun Yin, Wei Lin, Soummya Kar, Fenrong Liu, Haoxuan Li, Yisen Wang

ICLR 2026 REST: Reshaping Token-Level Policy Gradients for Tool-Use Large Language Models Zihan Lin, Xiaohan Wang, Jie Cao, Jiajun Chai, Guojun Yin, Wei Lin, Ran He

ICLR 2026 SAE as a Crystal Ball: Interpretable Features Predict Cross-Domain Transferability of LLMs Without Training Qi Zhang, Yifei Wang, Xiaohan Wang, Jiajun Chai, Guojun Yin, Wei Lin, Yisen Wang

ICLR 2026 SRFT: A Single-Stage Method with Supervised and Reinforcement Fine-Tuning for Reasoning Yuqian Fu, Tinghong Chen, Jiajun Chai, Xihuai Wang, Songjun Tu, Guojun Yin, Wei Lin, Qichao Zhang, Yuanheng Zhu, Dongbin Zhao

ICML 2025 DipLLM: Fine-Tuning LLM for Strategic Decision-Making in Diplomacy Kaixuan Xu, Jiajun Chai, Sicheng Li, Yuqian Fu, Yuanheng Zhu, Dongbin Zhao

ICLR 2025 Empowering LLM Agents with Zero-Shot Optimal Decision-Making Through Q-Learning Jiajun Chai, Sicheng Li, Yuqian Fu, Dongbin Zhao, Yuanheng Zhu

ICLR 2025 INS: Interaction-Aware Synthesis to Enhance Offline Multi-Agent Reinforcement Learning Yuqian Fu, Yuanheng Zhu, Jian Zhao, Jiajun Chai, Dongbin Zhao

NeurIPS 2025 Learning and Planning Multi-Agent Tasks via an MoE-Based World Model Zijie Zhao, Zhongyue Zhao, Kaixuan Xu, Yuqian Fu, Jiajun Chai, Yuanheng Zhu, Dongbin Zhao

NeurIPSW 2024 Empowering LLM Agents with Zero-Shot Optimal Decision-Making Through Q-Learning Jiajun Chai, Sicheng Li, Yuqian Fu, Dongbin Zhao, Yuanheng Zhu