Authors Search About

Dong, Hande

1 publications

NeurIPS 2025 ReDit: Reward Dithering for Improved LLM Policy Optimization Chenxing Wei, Jiarui Yu, Ying Tiffany He, Hande Dong, Yao Shu, Fei Yu

ML Anthology — Open source under Apache 2.0. GitHub. Privacy Policy