Wang, Jingquan

1 publications

ICLR 2026 R1-Code-Interpreter: LLMs Reason with Code via Supervised and Multi-Stage Reinforcement Learning Yongchao Chen, Yueying Liu, Junwei Zhou, Yilun Hao, Jingquan Wang, Yang Zhang, Na Li, Chuchu Fan