Zhang, Haifeng

28 publications

ECML-PKDD 2025 A Bilevel Reinforcement Learning Framework with Language Prior Knowledge Xue Yan, Yan Song, Xinyu Cui, Filippos Christianos, Haifeng Zhang, Jun Wang, David Mguni

ICLRW 2025 ARIES: Stimulating Self-Refinement of Large Language Models with and for Iterative Preference Optimization Yongcheng Zeng, Xuanfa Jin, Guoqing Liu, Quan He, Dong Li, Jianye Hao, Haifeng Zhang, Jun Wang

NeurIPS 2025 Curious Causality-Seeking Agents in Open-Ended Worlds Zhiyu Zhao, Haoxuan Li, Haifeng Zhang, Jun Wang, Francesco Faccio, Jürgen Schmidhuber, Mengyue Yang

NeurIPS 2025 EconGym: A Scalable AI Testbed with Diverse Economic Tasks Qirui Mi, Qipeng Yang, Zijun Fan, Wentian Fan, Heyang Ma, Chengdong Ma, Siyu Xia, Bo An, Jun Wang, Haifeng Zhang

ICLR 2025 Efficient Reinforcement Learning with Large Language Model Priors Xue Yan, Yan Song, Xidong Feng, Mengyue Yang, Haifeng Zhang, Haitham Bou Ammar, Jun Wang

ICLRW 2025 Enhancing Mathematical Reasoning in Language Models Through Focused Differentiation Training Zhiyu Zhao, Yongcheng Zeng, Ning Yang, Zihan Zhao, Haifeng Zhang, Jun Wang, Guoqing Liu

NeurIPS 2025 MF-LLM: Simulating Population Decision Dynamics via a Mean-Field Large Language Model Framework Qirui Mi, Mengyue Yang, Xiangning Yu, Zhiyu Zhao, Cheng Deng, Bo An, Haifeng Zhang, Xu Chen, Jun Wang

NeurIPS 2025 Self-Verifying Reflection Helps Transformers with CoT Reasoning Zhongwei Yu, Wannian Xia, Xue Yan, Bo Xu, Haifeng Zhang, Yali Du, Jun Wang

CVPR 2025 Towards Universal AI-Generated Image Detection by Variational Information Bottleneck Network Haifeng Zhang, Qinghui He, Xiuli Bi, Weisheng Li, Bo Liu, Bin Xiao

AAAI 2024 AI-Based Energy Transportation Safety: Pipeline Radial Threat Estimation Using Intelligent Sensing System Chengyuan Zhu, Yiyuan Yang, Kaixiang Yang, Haifeng Zhang, Qinmin Yang, C. L. Philip Chen

IJCAI 2024 AI-Olympics: Exploring the Generalization of Agents Through Open Competitions Chen Wang, Yan Song, Shuai Wu, Sa Wu, Ruizhi Zhang, Shu Lin, Haifeng Zhang

NeurIPS 2024 Large Language Models Play StarCraft II:Benchmarks and a Chain of Summarization Approach Weiyu Ma, Qirui Mi, Yongcheng Zeng, Xue Yan, Yuqiao Wu, Runji Lin, Haifeng Zhang, Jun Wang

NeurIPS 2024 Learning to Discuss Strategically: A Case Study on One Night Ultimate Werewolf Xuanfa Jin, Ziyan Wang, Yali Du, Meng Fang, Haifeng Zhang, Jun Wang

ICML 2024 Token-Level Direct Preference Optimization Yongcheng Zeng, Guoqing Liu, Weiyu Ma, Ning Yang, Haifeng Zhang, Jun Wang

NeurIPS 2023 An Efficient End-to-End Training Approach for Zero-Shot Human-AI Coordination Xue Yan, Jiaxian Guo, Xingzhou Lou, Jun Wang, Haifeng Zhang, Yali Du

ICLRW 2022 A Game-Theoretic Approach for Improving Generalization Ability of TSP Solvers Chenguang Wang, Yaodong Yang, Oliver Slumbers, Congying Han, Tiande Guo, Haifeng Zhang, Jun Wang

NeurIPS 2022 A Theoretical Understanding of Gradient Bias in Meta-Reinforcement Learning Bo Liu, Xidong Feng, Jie Ren, Luo Mai, Rui Zhu, Haifeng Zhang, Jun Wang, Yaodong Yang

NeurIPSW 2022 Contextual Transformer for Offline Meta Reinforcement Learning Runji Lin, Ye Li, Xidong Feng, Zhaowei Zhang, Xian Hong Wu Fung, Haifeng Zhang, Jun Wang, Yali Du, Yaodong Yang

AAAI 2022 Learning to Identify Top Elo Ratings: A Dueling Bandits Approach Xue Yan, Yali Du, Binxin Ru, Jun Wang, Haifeng Zhang, Xu Chen

IJCAI 2022 Reconciling Cognitive Modeling with Knowledge Forgetting: A Continuous Time-Aware Neural Network Approach Haiping Ma, Jingyuan Wang, Hengshu Zhu, Xin Xia, Haifeng Zhang, Xingyi Zhang, Lei Zhang

AAAI 2021 Early Safety Warnings for Long-Distance Pipelines: A Distributed Optical Fiber Sensor Machine Learning Approach Yiyuan Yang, Yi Li, Taojia Zhang, Yan Zhou, Haifeng Zhang

ICML 2021 Estimating $α$-Rank from a Few Entries with Low Rank Matrix Completion Yali Du, Xue Yan, Xu Chen, Jun Wang, Haifeng Zhang

NeurIPS 2021 Settling the Variance of Multi-Agent Policy Gradients Jakub Grudzien Kuba, Muning Wen, Linghui Meng, Shangding Gu, Haifeng Zhang, David Mguni, Jun Wang, Yaodong Yang

AAAI 2020 Bi-Level Actor-Critic for Multi-Agent Coordination Haifeng Zhang, Weizhe Chen, Zeren Huang, Minne Li, Yaodong Yang, Weinan Zhang, Jun Wang

IJCAI 2020 Improving Knowledge Tracing via Pre-Training Question Embeddings Yunfei Liu, Yang Yang, Xianyu Chen, Jian Shen, Haifeng Zhang, Yong Yu

IJCAI 2020 Weakly Supervised Local-Global Relation Network for Facial Expression Recognition Haifeng Zhang, Wen Su, Jun Yu, Zengfu Wang

IJCAI 2018 Learning to Design Games: Strategic Environments in Reinforcement Learning Haifeng Zhang, Jun Wang, Zhiming Zhou, Weinan Zhang, Yin Wen, Yong Yu, Wenxin Li

AAAI 2016 Submodular Optimization with Routing Constraints Haifeng Zhang, Yevgeniy Vorobeychik