Zhao, Wenshuo

2 publications

ICLR 2026 Mirage or Method? How Model–Task Alignment Induces Divergent RL Conclusions Haoze Wu, Cheng Wang, Wenshuo Zhao, Junxian He

ICLR 2026 The Tool Decathlon: Benchmarking Language Agents for Diverse, Realistic, and Long-Horizon Task Execution Junlong Li, Wenshuo Zhao, Jian Zhao, Weihao Zeng, Haoze Wu, Xiaochen Wang, Rui Ge, Yuxuan Cao, Yuzhen Huang, Wei Liu, Junteng Liu, Zhaochen Su, Yiyang Guo, Fan Zhou, Lueyang Zhang, Juan Michelini, Xingyao Wang, Xiang Yue, Shuyan Zhou, Graham Neubig, Junxian He