Yu, Chao

40 publications

ICLRW 2025 An Empirical Study of Policy Interpolation via Diffusion Models Yuqing Xie, Chao Yu, Ya Zhang, Yu Wang

ICML 2025 Conservative Offline Goal-Conditioned Implicit V-Learning Kaiqiang Ke, Qian Lin, Zongkai Liu, Shenghong He, Chao Yu

ICLR 2025 Diverse Policies Recovering via Pointwise Mutual Information Weighted Imitation Learning Hanlin Yang, Jian Yao, Weiming Liu, Qing Wang, Hanmin Qin, Kong Hansheng, Kirk Tang, Jiechao Xiong, Chao Yu, Kai Li, Junliang Xing, Hongwu Chen, Juchao Zhuo, Qiang Fu, Yang Wei, Haobo Fu

JMLR 2025 Learning Global Nash Equilibrium in Team Competitive Games with Generalized Fictitious Cross-Play Zelai Xu, Chao Yu, Yancheng Liang, Yi Wu, Yu Wang

ICML 2025 Learning Strategic Language Agents in the Werewolf Game with Iterative Latent Space Policy Optimization Zelai Xu, Wanjun Gu, Chao Yu, Yi Wu, Yu Wang

ICML 2025 Learning from Suboptimal Data in Continuous Control via Auto-Regressive Soft Q-Network Jijia Liu, Feng Gao, Qingmin Liao, Chao Yu, Yu Wang

CoRL 2025 Mastering Multi-Drone Volleyball Through Hierarchical Co-Self-Play Reinforcement Learning Ruize Zhang, Sirui Xiang, Zelai Xu, Feng Gao, Shilong Ji, Wenhao Tang, Wenbo Ding, Chao Yu, Yu Wang

AAAI 2025 Offline Multi-Agent Reinforcement Learning via In-Sample Sequential Policy Optimization Zongkai Liu, Qian Lin, Chao Yu, Xiawei Wu, Yile Liang, Donghui Li, Xuetao Ding

AAAI 2025 Rapid Learning in Constrained Minimax Games with Negative Momentum Zijian Fang, Zongkai Liu, Chao Yu, Chaohao Hu

NeurIPS 2025 ReinFlow: Fine-Tuning Flow Matching Policy with Online Reinforcement Learning Tonghe Zhang, Chao Yu, Sichang Su, Yu Wang

CoRL 2025 Toward Real-World Cooperative and Competitive Soccer with Quadrupedal Robot Teams Zhi Su, Yuman Gao, Emily Lukas, Yunfei Li, Jiaze Cai, Faris Talubah, Fei Gao, Chao Yu, Zhongyu Li, Yi Wu, Koushil Sreenath

NeurIPS 2025 VolleyBots: A Testbed for Multi-Drone Volleyball Game Combining Motion Control and Strategic Play Zelai Xu, Ruize Zhang, Chao Yu, Huining Yuan, Xiangmin Yi, Shilong Ji, Chuqi Wang, Wenhao Tang, Feng Gao, Wenbo Ding, Xinlei Chen, Yu Wang

NeurIPS 2025 What Can RL Bring to VLA Generalization? an Empirical Study Jijia Liu, Feng Gao, Bingwen Wei, Xinlei Chen, Qingmin Liao, Yi Wu, Chao Yu, Yu Wang

AAAI 2024 Accelerate Multi-Agent Reinforcement Learning in Zero-Sum Games with Subgame Curriculum Learning Jiayu Chen, Zelai Xu, Yunfei Li, Chao Yu, Jiaming Song, Huazhong Yang, Fei Fang, Yu Wang, Yi Wu

NeurIPS 2024 An Offline Adaptation Framework for Constrained Multi-Objective Reinforcement Learning Qian Lin, Zongkai Liu, Danying Mo, Chao Yu

ICML 2024 Is DPO Superior to PPO for LLM Alignment? a Comprehensive Study Shusheng Xu, Wei Fu, Jiaxuan Gao, Wenjie Ye, Weilin Liu, Zhiyu Mei, Guangju Wang, Chao Yu, Yi Wu

ICML 2024 Language Agents with Reinforcement Learning for Strategic Play in the Werewolf Game Zelai Xu, Chao Yu, Fei Fang, Yu Wang, Yi Wu

ICLR 2024 Off-Policy Primal-Dual Safe Reinforcement Learning Zifan Wu, Bo Tang, Qian Lin, Chao Yu, Shangqin Mao, Qianlong Xie, Xingxing Wang, Dong Wang

TMLR 2024 Revisiting Discrete Soft Actor-Critic Haibin Zhou, Tong Wei, Zichuan Lin, Junyou Li, Junliang Xing, Yuanchun Shi, Li Shen, Chao Yu, Deheng Ye

NeurIPSW 2024 Sharing Minds During MARL Training for Enhanced Cooperative LLM Agents Jiaxuan Gao, Yule Wen, Chao Yu, Yi Wu

IJCAI 2023 Automatic Truss Design with Reinforcement Learning Weihua Du, Jinglun Zhao, Chao Yu, Xingcheng Yao, Zimeng Song, Siyang Wu, Ruifeng Luo, Zhiyuan Liu, Xianzhong Zhao, Yi Wu

IJCAI 2023 Causal Deep Reinforcement Learning Using Observational Data Wenxuan Zhu, Chao Yu, Qiang Zhang

AAAI 2023 Hierarchical Mean-Field Deep Reinforcement Learning for Large-Scale Multiagent Systems Chao Yu

NeurIPS 2023 Hybrid Policy Optimization from Imperfect Demonstrations Hanlin Yang, Chao Yu, Peng Sun, Siji Chen

ICLR 2023 Learning Zero-Shot Cooperation with Humans, Assuming Humans Are Biased Chao Yu, Jiaxuan Gao, Weilin Liu, Botian Xu, Hao Tang, Jiaqi Yang, Yu Wang, Yi Wu

AAAI 2023 Models as Agents: Optimizing Multi-Step Predictions of Interactive Local Models in Model-Based Multi-Agent Reinforcement Learning Zifan Wu, Chao Yu, Chen Chen, Jianye Hao, Hankz Hankui Zhuo

ICML 2023 Safe Offline Reinforcement Learning with Real-Time Budget Constraints Qian Lin, Bo Tang, Zifan Wu, Chao Yu, Shangqin Mao, Qianlong Xie, Xingxing Wang, Dong Wang

AAAI 2023 Subspace-Aware Exploration for Sparse-Reward Multi-Agent Tasks Pei Xu, Junge Zhang, Qiyue Yin, Chao Yu, Yaodong Yang, Kaiqi Huang

NeurIPS 2022 A Unified Diversity Measure for Multiagent Reinforcement Learning Zongkai Liu, Chao Yu, Yaodong Yang, Peng Sun, Zifan Wu, Yuan Li

AAAI 2022 Creativity of AI: Automatic Symbolic Option Discovery for Facilitating Deep Reinforcement Learning Mu Jin, Zhihao Ma, Kebing Jin, Hankz Hankui Zhuo, Chen Chen, Chao Yu

ECCV 2022 Learning Efficient Multi-Agent Cooperative Visual Exploration Chao Yu, Xinyi Yang, Jiaxuan Gao, Huazhong Yang, Yu Wang, Yi Wu

NeurIPS 2022 Plan to Predict: Learning an Uncertainty-Foreseeing Model for Model-Based Reinforcement Learning Zifan Wu, Chao Yu, Chen Chen, Jianye Hao, Hankz Hankui Zhuo

ICML 2022 Revisiting Some Common Practices in Cooperative Multi-Agent Reinforcement Learning Wei Fu, Chao Yu, Zelai Xu, Jiaqi Yang, Yi Wu

NeurIPS 2022 The Surprising Effectiveness of PPO in Cooperative Multi-Agent Games Chao Yu, Akash Velu, Eugene Vinitsky, Jiaxuan Gao, Yu Wang, Alexandre Bayen, Yi Wu

AAAI 2021 A Joint Training Dual-MRC Framework for Aspect Based Sentiment Analysis Yue Mao, Yi Shen, Chao Yu, Longjun Cai

NeurIPS 2021 Coordinated Proximal Policy Optimization Zifan Wu, Chao Yu, Deheng Ye, Junge Zhang, Haiyin Piao, Hankz Hankui Zhuo

ICLR 2021 Discovering Diverse Multi-Agent Strategic Behavior via Reward Randomization Zhenggang Tang, Chao Yu, Boyuan Chen, Huazhe Xu, Xiaolong Wang, Fei Fang, Simon Shaolei Du, Yu Wang, Yi Wu

NeurIPSW 2021 Learning Efficient Multi-Agent Cooperative Visual Exploration Chao Yu, Xinyi Yang, Jiaxuan Gao, Huazhong Yang, Yu Wang, Yi Wu

IJCAI 2019 Large-Scale Home Energy Management Using Entropy-Based Collective Multiagent Deep Reinforcement Learning Framework Yaodong Yang, Jianye Hao, Yan Zheng, Chao Yu

IJCAI 2019 The Price of Governance: A Middle Ground Solution to Coordination in Organizational Control Chao Yu, Guozhen Tan