Guang, Mo

4 publications

ICLR 2026 LearnPruner: Rethinking Attention-Based Token Pruning in Vision Language Models Rinyoichi Takezoe, Yaqian Li, Zi-Hao Bo, Anzhou Hou, Mo Guang, Kaiwen Long

ICLR 2026 MARSHAL: Incentivizing Multi-Agent Reasoning via Self-Play with Strategic LLMs Huining Yuan, Zelai Xu, Zheyue Tan, Xiangmin Yi, Mo Guang, Kaiwen Long, Haojia Hui, Boxun Li, Xinlei Chen, Bo Zhao, Xiao-Ping Zhang, Chao Yu, Yu Wang

ICLR 2026 RE-PO: Robust Enhanced Policy Optimization as a General Framework for LLM Alignment Xiaoyang Cao, Zelai Xu, Mo Guang, Kaiwen Long, Michiel A. Bakker, Yu Wang, Chao Yu

ICLR 2026 SAC Flow: Sample-Efficient Reinforcement Learning of Flow-Based Policies via Velocity-Reparameterized Sequential Modeling Yixian Zhang, Shu'ang Yu, Tonghe Zhang, Mo Guang, Haojia Hui, Kaiwen Long, Yu Wang, Chao Yu, Wenbo Ding