Bao, Huiwen

1 publications

ICLR 2026 Parallel-R1: Towards Parallel Thinking via Reinforcement Learning Tong Zheng, Hongming Zhang, Wenhao Yu, Xiaoyang Wang, He Xing, Runpeng Dai, Rui Liu, Huiwen Bao, Chengsong Huang, Heng Huang, Dong Yu