Authors Search About

Bao, Yilin

1 publications

ICLRW 2025 Offline Reinforcement Learning for LLM Multi-Step Reasoning Huaijie Wang, Shibo Hao, Hanze Dong, Shenao Zhang, Yilin Bao, Ziran Yang, Yi Wu

ML Anthology — Open source under Apache 2.0. GitHub. Privacy Policy