Zhang, Chongjie

77 publications

ICLR 2026 Correlated Policy Optimization in Multi-Agent Subteams Dingyang Chen, Jianing Ye, Zhenyu Zhang, Xiaolong Kuang, Xinyang Shen, Ozalp Ozer, Chongjie Zhang, Qi Zhang

ICLR 2026 OPRIDE: Efficient Offline Preference-Based Reinforcement Learning via In-Dataset Exploration Yiqin Yang, Hao Hu, Yihuan Mao, Jin Zhang, Chengjie Wu, Yuhua Jiang, Xu Yang, Runpeng Xie, Yi Fan, Bo Liu, Yang Gao, Bo Xu, Chongjie Zhang

ICLR 2026 Translating Flow to Policy via Hindsight Online Imitation Yitian Zheng, Zhangchen Ye, Weijun Dong, Shengjie Wang, Yuyang Liu, Chongjie Zhang, Chuan Wen, Yang Gao

NeurIPS 2025 A Bayesian Fast-Slow Framework to Mitigate Interference in Non-Stationary Reinforcement Learning Yihuan Mao, Chongjie Zhang

ICML 2025 Enhancing Decision-Making of Large Language Models via Actor-Critic Heng Dong, Kefei Duan, Chongjie Zhang

ICLR 2025 Episodic Novelty Through Temporal Distance Yuhua Jiang, Qihan Liu, Yiqin Yang, Xiaoteng Ma, Dianyu Zhong, Hao Hu, Jun Yang, Bin Liang, Bo Xu, Chongjie Zhang, Qianchuan Zhao

ICLR 2025 Fewer May Be Better: Enhancing Offline Reinforcement Learning with Reduced Dataset Yiqin Yang, Quanwei Wang, Chenghao Li, Hao Hu, Chengjie Wu, Yuhua Jiang, Dianyu Zhong, Ziyou Zhang, Qianchuan Zhao, Chongjie Zhang, Bo Xu

ICML 2025 Learning Policy Committees for Effective Personalization in MDPs with Diverse Tasks Luise Ge, Michael Lanier, Anindya Sarkar, Bengisu Guresti, Chongjie Zhang, Yevgeniy Vorobeychik

ICLR 2025 Learning to Plan Before Answering: Self-Teaching LLMs to Learn Abstract Plans for Problem Solving Jin Zhang, Flood Sung, Zhilin Yang, Yang Gao, Chongjie Zhang

NeurIPS 2025 Revisiting Multi-Agent World Modeling from a Diffusion-Inspired Perspective Yang Zhang, Xinran Li, Jianing Ye, Shuang Qiu, Delin Qu, Xiu Li, Chongjie Zhang, Chenjia Bai

ICML 2024 Bayesian Design Principles for Offline-to-Online Reinforcement Learning Hao Hu, Yiqin Yang, Jianing Ye, Chengjie Wu, Ziqing Mai, Yujing Hu, Tangjie Lv, Changjie Fan, Qianchuan Zhao, Chongjie Zhang

ICLR 2024 Efficient Multi-Agent Reinforcement Learning by Planning Qihan Liu, Jianing Ye, Xiaoteng Ma, Jun Yang, Bin Liang, Chongjie Zhang

NeurIPSW 2024 Episodic Novelty Through Temporal Distance Yuhua Jiang, Qihan Liu, Yiqin Yang, Xiaoteng Ma, Dianyu Zhong, Bo Xu, Jun Yang, Bin Liang, Chongjie Zhang, Qianchuan Zhao

NeurIPS 2024 GOMAA-Geo: GOal Modality Agnostic Active Geo-Localization Anindya Sarkar, Srikumar Sastry, Aleksis Pirinen, Chongjie Zhang, Nathan Jacobs, Yevgeniy Vorobeychik

ICLR 2024 Imitation Learning from Observation with Automatic Discount Scheduling Yuyang Liu, Weijun Dong, Yingdong Hu, Chuan Wen, Zhao-Heng Yin, Chongjie Zhang, Yang Gao

ICLR 2024 Leveraging Hyperbolic Embeddings for Coarse-to-Fine Robot Design Heng Dong, Junyu Zhang, Chongjie Zhang

ICML 2024 Planning, Fast and Slow: Online Reinforcement Learning with Action-Free Offline Data via Multiscale Planners Chengjie Wu, Hao Hu, Yiqin Yang, Ning Zhang, Chongjie Zhang

IJCAI 2024 STAR: Spatio-Temporal State Compression for Multi-Agent Tasks with Rich Observations Chao Li, Yujing Hu, Shangdong Yang, Tangjie Lv, Changjie Fan, Wenbin Li, Chongjie Zhang, Yang Gao

ICLR 2024 Stylized Offline Reinforcement Learning: Extracting Diverse High-Quality Behaviors from Heterogeneous Datasets Yihuan Mao, Chengjie Wu, Xi Chen, Hao Hu, Ji Jiang, Tianze Zhou, Tangjie Lv, Changjie Fan, Zhipeng Hu, Yi Wu, Yujing Hu, Chongjie Zhang

ICLR 2024 Towards Robust Offline Reinforcement Learning Under Diverse Data Corruption Rui Yang, Han Zhong, Jiawei Xu, Amy Zhang, Chongjie Zhang, Lei Han, Tong Zhang

TMLR 2023 A Survey on Transformers in Reinforcement Learning Wenzhe Li, Hao Luo, Zichuan Lin, Chongjie Zhang, Zongqing Lu, Deheng Ye

NeurIPS 2023 Conservative Offline Policy Adaptation in Multi-Agent Games Chengjie Wu, Pingzhong Tang, Jun Yang, Yujing Hu, Tangjie Lv, Changjie Fan, Chongjie Zhang

AAAI 2023 Flow to Control: Offline Reinforcement Learning with Lossless Primitive Discovery Yiqin Yang, Hao Hu, Wenzhe Li, Siyuan Li, Jun Yang, Qianchuan Zhao, Chongjie Zhang

ICML 2023 Offline Meta Reinforcement Learning with In-Distribution Online Adaptation Jianhao Wang, Jin Zhang, Haozhe Jiang, Junyu Zhang, Liwei Wang, Chongjie Zhang

ICML 2023 Symmetry-Aware Robot Design with Structured Subgroups Heng Dong, Junyu Zhang, Tonghan Wang, Chongjie Zhang

ICLR 2023 The Provable Benefit of Unsupervised Data Sharing for Offline Reinforcement Learning Hao Hu, Yiqin Yang, Qianchuan Zhao, Chongjie Zhang

NeurIPS 2023 Unsupervised Behavior Extraction via Random Intent Priors Hao Hu, Yiqin Yang, Jianing Ye, Ziqing Mai, Chongjie Zhang

ICML 2023 What Is Essential for Unseen Goal Generalization of Offline Goal-Conditioned RL? Rui Yang, Lin Yong, Xiaoteng Ma, Hao Hu, Chongjie Zhang, Tong Zhang

ICLR 2022 Active Hierarchical Exploration with Stable Subgoal Representation Learning Siyuan Li, Jin Zhang, Jianhao Wang, Yang Yu, Chongjie Zhang

NeurIPS 2022 CUP: Critic-Guided Policy Reuse Jin Zhang, Siyuan Li, Chongjie Zhang

ICLR 2022 Context-Aware Sparse Deep Coordination Graphs Tonghan Wang, Liang Zeng, Weijun Dong, Qianlan Yang, Yang Yu, Chongjie Zhang

ICML 2022 Individual Reward Assisted Multi-Agent Reinforcement Learning Li Wang, Yupeng Zhang, Yujing Hu, Weixun Wang, Chongjie Zhang, Yang Gao, Jianye Hao, Tangjie Lv, Changjie Fan

NeurIPS 2022 LAPO: Latent-Variable Advantage-Weighted Policy Optimization for Offline Reinforcement Learning Xi Chen, Ali Ghadirzadeh, Tianhe Yu, Jianhao Wang, Alex Yuan Gao, Wenzhe Li, Liang Bin, Chelsea Finn, Chongjie Zhang

NeurIPS 2022 Low-Rank Modular Reinforcement Learning via Muscle Synergy Heng Dong, Tonghan Wang, Jiayuan Liu, Chongjie Zhang

NeurIPSW 2022 Model and Method: Training-Time Attack for Cooperative Multi-Agent Reinforcement Learning Siyang Wu, Tonghan Wang, Xiaoran Wu, Jingfeng Zhang, Yujing Hu, Changjie Fan, Chongjie Zhang

IJCAI 2022 Multi-Agent Concentrative Coordination with Decentralized Task Representation Lei Yuan, Chenghe Wang, Jianhao Wang, Fuxiang Zhang, Feng Chen, Cong Guan, Zongzhang Zhang, Chongjie Zhang, Yang Yu

AAAI 2022 Multi-Agent Incentive Communication via Decentralized Teammate Modeling Lei Yuan, Jianhao Wang, Fuxiang Zhang, Chenghe Wang, Zongzhang Zhang, Yang Yu, Chongjie Zhang

NeurIPSW 2022 Multi-Agent Policy Transfer via Task Relationship Modeling Rong-Jun Qin, Feng Chen, Tonghan Wang, Lei Yuan, Xiaoran Wu, Yipeng Kang, Zongzhang Zhang, Chongjie Zhang, Yang Yu

NeurIPS 2022 Non-Linear Coordination Graphs Yipeng Kang, Tonghan Wang, Qianlan Yang, Xiaoran Wu, Chongjie Zhang

ICLR 2022 Offline Reinforcement Learning with Value-Based Episodic Memory Xiaoteng Ma, Yiqin Yang, Hao Hu, Jun Yang, Chongjie Zhang, Qianchuan Zhao, Bin Liang, Qihan Liu

ICML 2022 On the Role of Discount Factor in Offline Reinforcement Learning Hao Hu, Yiqin Yang, Qianchuan Zhao, Chongjie Zhang

NeurIPS 2022 RORL: Robust Offline Reinforcement Learning via Conservative Smoothing Rui Yang, Chenjia Bai, Xiaoteng Ma, Zhaoran Wang, Chongjie Zhang, Lei Han

ICLR 2022 Rethinking Goal-Conditioned Supervised Learning and Its Connection to Offline RL Rui Yang, Yiming Lu, Wenzhe Li, Hao Sun, Meng Fang, Yali Du, Xiu Li, Lei Han, Chongjie Zhang

NeurIPS 2022 Safe Opponent-Exploitation Subgame Refinement Mingyang Liu, Chengjie Wu, Qihan Liu, Yansen Jing, Jun Yang, Pingzhong Tang, Chongjie Zhang

ICLRW 2022 Safe Opponent-Exploitation Subgame Refinement Mingyang Liu, Chengjie Wu, Qihan Liu, Yansen Jing, Jun Yang, Pingzhong Tang, Chongjie Zhang

ICML 2022 Self-Organized Polynomial-Time Coordination Graphs Qianlan Yang, Weijun Dong, Zhizhou Ren, Jianhao Wang, Tonghan Wang, Chongjie Zhang

NeurIPS 2021 Celebrating Diversity in Shared Multi-Agent Reinforcement Learning Chenghao Li, Tonghan Wang, Chengjie Wu, Qianchuan Zhao, Jun Yang, Chongjie Zhang

ICLR 2021 DOP: Off-Policy Multi-Agent Decomposed Policy Gradients Yihan Wang, Beining Han, Tonghan Wang, Heng Dong, Chongjie Zhang

NeurIPS 2021 Episodic Multi-Agent Reinforcement Learning with Curiosity-Driven Exploration Lulu Zheng, Jiarui Chen, Jianhao Wang, Jiamin He, Yujing Hu, Yingfeng Chen, Changjie Fan, Yang Gao, Chongjie Zhang

ICML 2021 Generalizable Episodic Memory for Deep Reinforcement Learning Hao Hu, Jianing Ye, Guangxiang Zhu, Zhizhou Ren, Chongjie Zhang

ICLR 2021 Learning Subgoal Representations with Slow Dynamics Siyuan Li, Lulu Zheng, Jianhao Wang, Chongjie Zhang

ICML 2021 MetaCURE: Meta Reinforcement Learning with Empowerment-Driven Exploration Jin Zhang, Jianhao Wang, Hao Hu, Tong Chen, Yingfeng Chen, Changjie Fan, Chongjie Zhang

NeurIPS 2021 Model-Based Reinforcement Learning via Imagination with Derived Memory Yao Mu, Yuzheng Zhuang, Bin Wang, Guangxiang Zhu, Wulong Liu, Jianyu Chen, Ping Luo, Shengbo Li, Chongjie Zhang, Jianye Hao

NeurIPS 2021 Offline Reinforcement Learning with Reverse Model-Based Imagination Jianhao Wang, Wenzhe Li, Haozhe Jiang, Guangxiang Zhu, Siyuan Li, Chongjie Zhang

NeurIPS 2021 On the Estimation Bias in Double Q-Learning Zhizhou Ren, Guangxiang Zhu, Hao Hu, Beining Han, Jianglun Chen, Chongjie Zhang

ICLR 2021 QPLEX: Duplex Dueling Multi-Agent Q-Learning Jianhao Wang, Zhizhou Ren, Terry Liu, Yang Yu, Chongjie Zhang

ICLR 2021 RODE: Learning Roles to Decompose Multi-Agent Tasks Tonghan Wang, Tarun Gupta, Anuj Mahajan, Bei Peng, Shimon Whiteson, Chongjie Zhang

IJCAI 2021 Reward-Constrained Behavior Cloning Zhaorong Wang, Meng Wang, Jingqi Zhang, Yingfeng Chen, Chongjie Zhang

NeurIPS 2021 Towards Understanding Cooperative Multi-Agent Q-Learning with Value Factorization Jianhao Wang, Zhizhou Ren, Beining Han, Jianing Ye, Chongjie Zhang

NeurIPS 2020 Bridging Imagination and Reality for Model-Based Deep Reinforcement Learning Guangxiang Zhu, Minghao Zhang, Honglak Lee, Chongjie Zhang

ICLR 2020 Episodic Reinforcement Learning with Associative Memory Guangxiang Zhu, Zichuan Lin, Guangwen Yang, Chongjie Zhang

ICLR 2020 Influence-Based Multi-Agent Exploration Tonghan Wang, Jianhao Wang, Yi Wu, Chongjie Zhang

ICLR 2020 Learning Nearly Decomposable Value Functions via Communication Minimization Tonghan Wang, Jianhao Wang, Chongyi Zheng, Chongjie Zhang

AAAI 2020 Object-Oriented Dynamics Learning Through Multi-Level Abstraction Guangxiang Zhu, Jianhao Wang, Zhizhou Ren, Zichuan Lin, Chongjie Zhang

ICML 2020 ROMA: Multi-Agent Reinforcement Learning with Emergent Roles Tonghan Wang, Heng Dong, Victor Lesser, Chongjie Zhang

NeurIPS 2019 Hierarchical Reinforcement Learning with Advantage-Based Auxiliary Rewards Siyuan Li, Rui Wang, Minxue Tang, Chongjie Zhang

IJCAI 2019 Towards Efficient Detection and Optimal Response Against Sophisticated Opponents Tianpei Yang, Jianye Hao, Zhaopeng Meng, Chongjie Zhang, Yan Zheng, Ze Zheng

AAAI 2018 An Optimal Online Method of Selecting Source Policies for Reinforcement Learning Siyuan Li, Chongjie Zhang

NeurIPS 2018 Object-Oriented Dynamics Predictor Guangxiang Zhu, Zhiao Huang, Chongjie Zhang

JAIR 2017 Perturbation Training for Human-Robot Teams Ramya Ramakrishnan, Chongjie Zhang, Julie A. Shah

IJCAI 2016 Co-Optimizating Multi-Agent Placement with Task Assignment and Scheduling Chongjie Zhang, Julie A. Shah

AAAI 2015 On Fairness in Decision-Making Under Uncertainty: Definitions, Computation, and Comparison Chongjie Zhang, Julie A. Shah

AAAI 2014 Decentralized Multi-Agent Reinforcement Learning in Average-Reward Dynamic DCOPs Duc Thien Nguyen, William Yeoh, Hoong Chuin Lau, Shlomo Zilberstein, Chongjie Zhang

NeurIPS 2014 Fairness in Multi-Agent Sequential Decision-Making Chongjie Zhang, Julie A Shah

AAAI 2011 Coordinated Multi-Agent Reinforcement Learning in Networked Distributed POMDPs Chongjie Zhang, Victor R. Lesser

AAAI 2010 Multi-Agent Learning with Policy Prediction Chongjie Zhang, Victor R. Lesser

IJCAI 2009 A Multi-Agent Learning Approach to Online Distributed Resource Allocation Chongjie Zhang, Victor R. Lesser, Prashant J. Shenoy