Zhang, Tonghe

4 publications

ICLR 2026 BFM-Zero: A Promptable Behavioral Foundation Model for Humanoid Control Using Unsupervised Reinforcement Learning Yitang Li, Zhengyi Luo, Tonghe Zhang, Cunxi Dai, Anssi Kanervisto, Andrea Tirinzoni, Haoyang Weng, Kris Kitani, Mateusz Guzek, Ahmed Touati, Alessandro Lazaric, Matteo Pirotta, Guanya Shi

ICLR 2026 SAC Flow: Sample-Efficient Reinforcement Learning of Flow-Based Policies via Velocity-Reparameterized Sequential Modeling Yixian Zhang, Shu'ang Yu, Tonghe Zhang, Mo Guang, Haojia Hui, Kaiwen Long, Yu Wang, Chao Yu, Wenbo Ding

NeurIPS 2025 ReinFlow: Fine-Tuning Flow Matching Policy with Online Reinforcement Learning Tonghe Zhang, Chao Yu, Sichang Su, Yu Wang

ICML 2024 Provably Efficient Partially Observable Risk-Sensitive Reinforcement Learning with Hindsight Observation Tonghe Zhang, Yu Chen, Longbo Huang