Yu, Dian

16 publications

ICLR 2025 DOTS: Learning to Reason Dynamically in LLMs via Optimal Reasoning Trajectories Search Murong Yue, Wenlin Yao, Haitao Mi, Dian Yu, Ziyu Yao, Dong Yu

ICML 2025 Do NOT Think That Much for 2+3=? on the Overthinking of Long Reasoning Models Xingyu Chen, Jiahao Xu, Tian Liang, Zhiwei He, Jianhui Pang, Dian Yu, Linfeng Song, Qiuzhi Liu, Mengfei Zhou, Zhuosheng Zhang, Rui Wang, Zhaopeng Tu, Haitao Mi, Dong Yu

NeurIPS 2025 Improving LLM General Preference Alignment via Optimistic Online Mirror Descent Yuheng Zhang, Dian Yu, Tao Ge, Linfeng Song, Zhichen Zeng, Haitao Mi, Nan Jiang, Dong Yu

ICLR 2025 Iterative Nash Policy Optimization: Aligning LLMs with General Preferences via No-Regret Learning Yuheng Zhang, Dian Yu, Baolin Peng, Linfeng Song, Ye Tian, Mingyue Huo, Nan Jiang, Haitao Mi, Dong Yu

AAAI 2025 LiteSearch: Efficient Tree Search with Dynamic Exploration Budget for Math Reasoning Ante Wang, Linfeng Song, Ye Tian, Baolin Peng, Dian Yu, Haitao Mi, Jinsong Su, Dong Yu

NeurIPS 2025 Thoughts Are All over the Place: On the Underthinking of Long Reasoning Models Yue Wang, Qiuzhi Liu, Jiahao Xu, Tian Liang, Xingyu Chen, Zhiwei He, Linfeng Song, Dian Yu, Juntao Li, Zhuosheng Zhang, Rui Wang, Zhaopeng Tu, Haitao Mi, Dong Yu

ECCV 2024 Alternate Diverse Teaching for Semi-Supervised Medical Image Segmentation Zhen Zhao, Zicheng Wang, Dian Yu, Longyue Wang, Yixuan Yuan, Luping Zhou

NeurIPS 2024 Toward Self-Improvement of LLMs via Imagination, Searching, and Criticizing Ye Tian, Baolin Peng, Linfeng Song, Lifeng Jin, Dian Yu, Lei Han, Haitao Mi, Dong Yu

ICLR 2023 Knowledge-in-Context: Towards Knowledgeable Semi-Parametric Language Models Xiaoman Pan, Wenlin Yao, Hongming Zhang, Dian Yu, Dong Yu, Jianshu Chen

NeurIPSW 2023 MinT: Boosting Generalization in Mathematical Reasoning via Multi-View Fine-Tuning Zhenwen Liang, Dian Yu, Xiaoman Pan, Wenlin Yao, Qingkai Zeng, Xiangliang Zhang, Dong Yu

ICLR 2023 ReAct: Synergizing Reasoning and Acting in Language Models Shunyu Yao, Jeffrey Zhao, Dian Yu, Nan Du, Izhak Shafran, Karthik R Narasimhan, Yuan Cao

NeurIPS 2023 Tree of Thoughts: Deliberate Problem Solving with Large Language Models Shunyu Yao, Dian Yu, Jeffrey Zhao, Izhak Shafran, Tom Griffiths, Yuan Cao, Karthik Narasimhan

NeurIPSW 2022 ReAct: Synergizing Reasoning and Acting in Language Models Shunyu Yao, Jeffrey Zhao, Dian Yu, Izhak Shafran, Karthik R Narasimhan, Yuan Cao

IJCAI 2020 Exploration Based Language Learning for Text-Based Games Andrea Madotto, Mahdi Namazifar, Joost Huizinga, Piero Molino, Adrien Ecoffet, Huaixiu Zheng, Alexandros Papangelis, Dian Yu, Chandra Khatri, Gökhan Tür

AAAI 2020 Filling Conversation Ellipsis for Better Social Dialog Understanding Xiyuan Zhang, Chengxi Li, Dian Yu, Samuel Davidson, Zhou Yu

AAAI 2020 MultiSumm: Towards a Unified Model for Multi-Lingual Abstractive Summarization Yue Cao, Xiaojun Wan, Jin-ge Yao, Dian Yu