Gu, Yuzhe

3 publications

ICLR 2025 Mask-DPO: Generalizable Fine-Grained Factuality Alignment of LLMs Yuzhe Gu, Wenwei Zhang, Chengqi Lyu, Dahua Lin, Kai Chen

NeurIPS 2025 Semi-Off-Policy Reinforcement Learning for Vision-Language Slow-Thinking Reasoning Junhao Shen, Haiteng Zhao, Yuzhe Gu, Songyang Gao, Kuikun Liu, Haian Huang, Jianfei Gao, Dahua Lin, Wenwei Zhang, Kai Chen

NeurIPS 2024 ANAH-V2: Scaling Analytical Hallucination Annotation of Large Language Models Yuzhe Gu, Ziwei Ji, Wenwei Zhang, Chengqi Lyu, Dahua Lin, Kai Chen