Zheng, Tong

6 publications

ICLR 2026 CDE: Curiosity-Driven Exploration for Efficient Reinforcement Learning in Large Language Models Runpeng Dai, Linfeng Song, Haolin Liu, Zhenwen Liang, Dian Yu, Haitao Mi, Zhaopeng Tu, Rui Liu, Tong Zheng, Hongtu Zhu, Dong Yu

ICLR 2026 Learning to Reason via Mixture-of-Thought for Logical Reasoning Tong Zheng, Lichang Chen, Simeng Han, R. Thomas McCoy, Heng Huang

ICLR 2026 Parallel-R1: Towards Parallel Thinking via Reinforcement Learning Tong Zheng, Hongming Zhang, Wenhao Yu, Xiaoyang Wang, He Xing, Runpeng Dai, Rui Liu, Huiwen Bao, Chengsong Huang, Heng Huang, Dong Yu

ICLR 2025 Towards Optimal Multi-Draft Speculative Decoding Zhengmian Hu, Tong Zheng, Vignesh Viswanathan, Ziyi Chen, Ryan A. Rossi, Yihan Wu, Dinesh Manocha, Heng Huang

NeurIPS 2024 Predictor-Corrector Enhanced Transformers with Exponential Moving Average Coefficient Learning Bei Li, Tong Zheng, Rui Wang, Jiahao Liu, Qingyan Guo, Junliang Guo, Xu Tan, Tong Xiao, Jingbo Zhu, Jingang Wang, Xunliang Cai

ICML 2022 Learning Multiscale Transformer Models for Sequence Generation Bei Li, Tong Zheng, Yi Jing, Chengbo Jiao, Tong Xiao, Jingbo Zhu