Zheng, Kunhao

14 publications

ICML 2025 Improving Diversity in Language Models: When Temperature Fails, Change the Loss Alexandre Verine, Florian Le Bronnec, Kunhao Zheng, Alexandre Allauzen, Yann Chevaleyre, Benjamin Negrevergne

ICML 2025 Optimizing Language Models for Inference Time Objectives Using Reinforcement Learning Yunhao Tang, Kunhao Zheng, Gabriel Synnaeve, Remi Munos

ICML 2025 PILAF: Optimal Human Preference Sampling for Reward Modeling Yunzhen Feng, Ariel Kwiatkowski, Kunhao Zheng, Julia Kempe, Yaqi Duan

ICLRW 2025 PILAF: Optimal Human Preference Sampling for Reward Modeling Yunzhen Feng, Ariel Kwiatkowski, Kunhao Zheng, Julia Kempe, Yaqi Duan

ICML 2025 RLEF: Grounding Code LLMs in Execution Feedback with Reinforcement Learning Jonas Gehring, Kunhao Zheng, Jade Copet, Vegard Mella, Taco Cohen, Gabriel Synnaeve

ICLR 2025 The KoLMogorov Test: Compression by Code Generation Ori Yoran, Kunhao Zheng, Fabian Gloeckle, Jonas Gehring, Gabriel Synnaeve, Taco Cohen

ICLR 2025 What Makes Large Language Models Reason in (Multi-Turn) Code Generation? Kunhao Zheng, Juliette Decugis, Jonas Gehring, Taco Cohen, Benjamin Negrevergne, Gabriel Synnaeve

ICLR 2023 D4FT: A Deep Learning Approach to Kohn-Sham Density Functional Theory Tianbo Li, Min Lin, Zheyuan Hu, Kunhao Zheng, Giovanni Vignale, Kenji Kawaguchi, A.H. Castro Neto, Kostya S. Novoselov, Shuicheng Yan

CVPR 2023 Distilling Vision-Language Pre-Training to Collaborate with Weakly-Supervised Temporal Action Localization Chen Ju, Kunhao Zheng, Jinxiang Liu, Peisen Zhao, Ya Zhang, Jianlong Chang, Qi Tian, Yanfeng Wang

ICLR 2023 Formal Mathematics Statement Curriculum Learning Stanislas Polu, Jesse Michael Han, Kunhao Zheng, Mantas Baksys, Igor Babuschkin, Ilya Sutskever

ICLRW 2023 JAX-XC: Exchange Correlation Functionals Library in JAX Kunhao Zheng, Min Lin

ICLRW 2023 Neural Integral Functionals Zheyuan Hu, Tianbo Li, Zekun Shi, Kunhao Zheng, Giovanni Vignale, Kenji Kawaguchi, Shuicheng Yan, Min Lin

ECCV 2022 Prompting Visual-Language Models for Efficient Video Understanding Chen Ju, Tengda Han, Kunhao Zheng, Ya Zhang, Weidi Xie

ICLR 2022 miniF2F: A Cross-System Benchmark for Formal Olympiad-Level Mathematics Kunhao Zheng, Jesse Michael Han, Stanislas Polu