Ziheng, Zhou

1 publications

ICLR 2026 On the Generalization of SFT: A Reinforcement Learning Perspective with Reward Rectification Yongliang Wu, Yizhou Zhou, Zhou Ziheng, Yingzhe Peng, Xinyu Ye, Xinting Hu, Wenbo Zhu, Lu Qi, Ming-Hsuan Yang, Xu Yang