Mi, Haitao

16 publications

TMLR 2026 VScan: Rethinking Visual Token Reduction for Efficient Large Vision-Language Models Ce Zhang, Kaixin Ma, Tianqing Fang, Wenhao Yu, Hongming Zhang, Zhisong Zhang, Haitao Mi, Dong Yu

ICLR 2025 DOTS: Learning to Reason Dynamically in LLMs via Optimal Reasoning Trajectories Search Murong Yue, Wenlin Yao, Haitao Mi, Dian Yu, Ziyu Yao, Dong Yu

ICML 2025 Do NOT Think That Much for 2+3=? on the Overthinking of Long Reasoning Models Xingyu Chen, Jiahao Xu, Tian Liang, Zhiwei He, Jianhui Pang, Dian Yu, Linfeng Song, Qiuzhi Liu, Mengfei Zhou, Zhuosheng Zhang, Rui Wang, Zhaopeng Tu, Haitao Mi, Dong Yu

NeurIPS 2025 Improving LLM General Preference Alignment via Optimistic Online Mirror Descent Yuheng Zhang, Dian Yu, Tao Ge, Linfeng Song, Zhichen Zeng, Haitao Mi, Nan Jiang, Dong Yu

ICLR 2025 Iterative Nash Policy Optimization: Aligning LLMs with General Preferences via No-Regret Learning Yuheng Zhang, Dian Yu, Baolin Peng, Linfeng Song, Ye Tian, Mingyue Huo, Nan Jiang, Haitao Mi, Dong Yu

AAAI 2025 LiteSearch: Efficient Tree Search with Dynamic Exploration Budget for Math Reasoning Ante Wang, Linfeng Song, Ye Tian, Baolin Peng, Dian Yu, Haitao Mi, Jinsong Su, Dong Yu

NeurIPS 2025 MPS-Prover: Advancing Stepwise Theorem Proving by Multi-Perspective Search and Data Curation Zhenwen Liang, Linfeng Song, Yang Li, Tao Yang, Haitao Mi, Dong Yu

NeurIPS 2025 The First Few Tokens Are All You Need: An Efficient and Effective Unsupervised Prefix Fine-Tuning Method for Reasoning Models Ke Ji, Jiahao Xu, Tian Liang, Qiuzhi Liu, Zhiwei He, Xiaoyuan Liu, Xingyu Chen, Junying Chen, Benyou Wang, Zhaopeng Tu, Haitao Mi, Dong Yu

NeurIPS 2025 Thoughts Are All over the Place: On the Underthinking of Long Reasoning Models Yue Wang, Qiuzhi Liu, Jiahao Xu, Tian Liang, Xingyu Chen, Zhiwei He, Linfeng Song, Dian Yu, Juntao Li, Zhuosheng Zhang, Rui Wang, Zhaopeng Tu, Haitao Mi, Dong Yu

NeurIPS 2025 Trust, but Verify: A Self-Verification Approach to Reinforcement Learning with Verifiable Rewards Xiaoyuan Liu, Tian Liang, Zhiwei He, Jiahao Xu, Wenxuan Wang, Pinjia He, Zhaopeng Tu, Haitao Mi, Dong Yu

NeurIPS 2025 Two Experts Are All You Need for Steering Thinking: Reinforcing Cognitive Effort in MoE Reasoning Models Without Additional Training Mengru Wang, Xingyu Chen, Yue Wang, Zhiwei He, Jiahao Xu, Tian Liang, Qiuzhi Liu, Yunzhi Yao, Wenxuan Wang, Ruotian Ma, Haitao Mi, Ningyu Zhang, Zhaopeng Tu, Xiaolong Li, Dong Yu

NeurIPS 2025 UniGist: Towards General and Hardware-Aligned Sequence-Level Long Context Compression Chenlong Deng, Zhisong Zhang, Kelong Mao, Shuaiyi Li, Tianqing Fang, Hongming Zhang, Haitao Mi, Dong Yu, Zhicheng Dou

ICLR 2024 The Trickle-Down Impact of Reward Inconsistency on RLHF Lingfeng Shen, Sihao Chen, Linfeng Song, Lifeng Jin, Baolin Peng, Haitao Mi, Daniel Khashabi, Dong Yu

NeurIPS 2024 Toward Self-Improvement of LLMs via Imagination, Searching, and Criticizing Ye Tian, Baolin Peng, Linfeng Song, Lifeng Jin, Dian Yu, Lei Han, Haitao Mi, Dong Yu

IJCAI 2021 IIAS: An Intelligent Insurance Assessment System Through Online Real-Time Conversation Analysis Mengdi Zhou, Shuang Peng, Minghui Yang, Nan Li, Hongbin Wang, Li Qiao, Haitao Mi, Zujie Wen, Teng Xu, Lei Liu

AAAI 2010 Forest-Based Semantic Role Labeling Hao Xiong, Haitao Mi, Yang Liu, Qun Liu