Zhang, Zongzhang

54 publications

ICML 2025 Behavior-Regularized Diffusion Policy Optimization for Offline Reinforcement Learning Chen-Xiao Gao, Chenyang Wu, Mingjun Cao, Chenjun Xiao, Yang Yu, Zongzhang Zhang

TMLR 2025 Efficient Multi-Agent Cooperation Learning Through Teammate Lookahead Feng Chen, Xinwei Chen, Rong-Jun Qin, Cong Guan, Lei Yuan, Zongzhang Zhang, Yang Yu

NeurIPS 2025 EvaLearn: Quantifying the Learning Capability and Efficiency of LLMs via Sequential Problem Solving Shihan Dou, Ming Zhang, Chenhao Huang, Jiayi Chen, Feng Chen, Shichun Liu, Yan Liu, Chenxiao Liu, Cheng Zhong, Zongzhang Zhang, Tao Gui, Chao Xin, Wei Chengzhi, Lin Yan, Qi Zhang, Xuanjing Huang

NeurIPS 2025 Focus-Then-Reuse: Fast Adaptation in Visual Perturbation Environments Jiahui Wang, Chao Chen, Jiacheng Xu, Zongzhang Zhang, Yang Yu

NeurIPS 2025 Multi-Agent Imitation by Learning and Sampling from Factorized Soft Q-Function Yi-Chen Li, Zhongxiang Ling, Tao Jiang, Fuxiang Zhang, Pengyuan Wang, Lei Yuan, Zongzhang Zhang, Yang Yu

ICLR 2025 Q-Adapter: Customizing Pre-Trained LLMs to New Preferences with Forgetting Mitigation Yi-Chen Li, Fuxiang Zhang, Wenjie Qiu, Lei Yuan, Chengxing Jia, Zongzhang Zhang, Yang Yu, Bo An

IJCAI 2025 Reinforced In-Context Black-Box Optimization Lei Song, Chen-Xiao Gao, Ke Xue, Chenyang Wu, Dong Li, Jianye Hao, Zongzhang Zhang, Chao Qian

IJCAI 2025 Reward Models in Deep Reinforcement Learning: A Survey Rui Yu, Shenghua Wan, Yucen Wang, Chen-Xiao Gao, Le Gan, Zongzhang Zhang, De-Chuan Zhan

AAAI 2024 ACT: Empowering Decision Transformer with Dynamic Programming via Advantage Conditioning Chenxiao Gao, Chenyang Wu, Mingjun Cao, Rui Kong, Zongzhang Zhang, Yang Yu

ICLR 2024 Attention-Guided Contrastive Role Representations for Multi-Agent Reinforcement Learning Zican Hu, Zongzhang Zhang, Huaxiong Li, Chunlin Chen, Hongyu Ding, Zhi Wang

ICML 2024 Debiased Offline Representation Learning for Fast Online Adaptation in Non-Stationary Dynamics Xinyu Zhang, Wenjie Qiu, Yi-Chen Li, Lei Yuan, Chengxing Jia, Zongzhang Zhang, Yang Yu

ICML 2024 Deep Demonstration Tracing: Learning Generalizable Imitator Policy for Runtime Imitation from a Single Demonstration Xiong-Hui Chen, Junyin Ye, Hang Zhao, Yi-Chen Li, Xu-Hui Liu, Haoran Shi, Yu-Yan Xu, Zhihao Ye, Si-Hang Yang, Yang Yu, Anqi Huang, Kai Xu, Zongzhang Zhang

IJCAI 2024 Efficient and Stable Offline-to-Online Reinforcement Learning via Continual Policy Revitalization Rui Kong, Chenyang Wu, Chen-Xiao Gao, Zongzhang Zhang, Ming Li

AAAI 2024 Focus-Then-Decide: Segmentation-Assisted Reinforcement Learning Chao Chen, Jiacheng Xu, Weijian Liao, Hao Ding, Zongzhang Zhang, Yang Yu, Rui Zhao

AAAI 2024 Generalizable Policy Improvement via Reinforcement Sampling (Student Abstract) Rui Kong, Chenyang Wu, Zongzhang Zhang

AAAI 2024 Generalizable Task Representation Learning for Offline Meta-Reinforcement Learning with Data Limitations Renzhe Zhou, Chenxiao Gao, Zongzhang Zhang, Yang Yu

ICLR 2024 Language Model Self-Improvement by Reinforcement Learning Contemplation Jing-Cheng Pang, Pengyuan Wang, Kaiyuan Li, Xiong-Hui Chen, Jiacheng Xu, Zongzhang Zhang, Yang Yu

NeurIPS 2024 Multi-Agent Domain Calibration with a Handful of Offline Data Tao Jiang, Lei Yuan, Lihe Li, Cong Guan, Zongzhang Zhang, Yang Yu

AAAI 2024 Multi-Expert Distillation for Few-Shot Coordination (Student Abstract) Yujian Zhu, Hao Ding, Zongzhang Zhang

NeurIPS 2024 ODRL: A Benchmark for Off-Dynamics Reinforcement Learning Jiafei Lyu, Kang Xu, Jiacheng Xu, Mengbei Yan, Jingwen Yang, Zongzhang Zhang, Chenjia Bai, Zongqing Lu, Xiu Li

TMLR 2024 One by One, Continual Coordinating with Humans via Hyper-Teammate Identification Cong Guan, Feng Chen, Ke Xue, Chunpeng Fan, Lichao Zhang, Ziqian Zhang, Pengyao Zhao, Zongzhang Zhang, Chao Qian, Lei Yuan, Yang Yu

ICLR 2024 Policy Rehearsing: Training Generalizable Policies for Reinforcement Learning Chengxing Jia, Chenxiao Gao, Hao Yin, Fuxiang Zhang, Xiong-Hui Chen, Tian Xu, Lei Yuan, Zongzhang Zhang, Zhi-Hua Zhou, Yang Yu

AAAI 2023 Anti-Drifting Feature Selection via Deep Reinforcement Learning (Student Abstract) Aoran Wang, Hongyang Yang, Feng Mao, Zongzhang Zhang, Yang Yu, Xiaoyang Liu

AAAI 2023 Deep Anomaly Detection and Search via Reinforcement Learning (Student Abstract) Chao Chen, Dawei Wang, Feng Mao, Zongzhang Zhang, Yang Yu

ICLR 2023 Discovering Generalizable Multi-Agent Coordination Skills from Multi-Task Offline Data Fuxiang Zhang, Chengxing Jia, Yi-Chen Li, Lei Yuan, Yang Yu, Zongzhang Zhang

AAAI 2023 Expert Data Augmentation in Imitation Learning (Student Abstract) Fuguang Han, Zongzhang Zhang

AAAI 2023 Learning Generalizable Batch Active Learning Strategies via Deep Q-Networks (Student Abstract) Yi-Chen Li, Wen-Jie Shen, Boyu Zhang, Feng Mao, Zongzhang Zhang, Yang Yu

AAAI 2023 Model-Based Offline Weighted Policy Optimization (Student Abstract) Renzhe Zhou, Zongzhang Zhang, Yang Yu

ICML 2023 Policy Regularization with Dataset Constraint for Offline Reinforcement Learning Yuhang Ran, Yi-Chen Li, Fuxiang Zhang, Zongzhang Zhang, Yang Yu

AAAI 2023 Policy-Independent Behavioral Metric-Based Representation for Deep Reinforcement Learning Weijian Liao, Zongzhang Zhang, Yang Yu

ICML 2023 Retrosynthetic Planning with Dual Value Networks Guoqing Liu, Di Xue, Shufang Xie, Yingce Xia, Austin Tripp, Krzysztof Maziarz, Marwin Segler, Tao Qin, Zongzhang Zhang, Tie-Yan Liu

AAAI 2023 Towards Deployment-Efficient and Collision-Free Multi-Agent Path Finding (Student Abstract) Feng Chen, Chenghe Wang, Fuxiang Zhang, Hao Ding, Qiaoyong Zhong, Shiliang Pu, Zongzhang Zhang

AAAI 2022 Adapt to Environment Sudden Changes by Learning a Context Sensitive Policy Fan-Ming Luo, Shengyi Jiang, Yang Yu, Zongzhang Zhang, Yi-Feng Zhang

NeurIPS 2022 Bayesian Optimistic Optimization: Optimistic Exploration for Model-Based Reinforcement Learning Chenyang Wu, Tianci Li, Zongzhang Zhang, Yang Yu

NeurIPS 2022 Efficient Multi-Agent Communication via Self-Supervised Information Aggregation Cong Guan, Feng Chen, Lei Yuan, Chenghe Wang, Hao Yin, Zongzhang Zhang, Yang Yu

IJCAI 2022 Efficient Multi-Agent Communication via Shapley Message Value Di Xue, Lei Yuan, Zongzhang Zhang, Yang Yu

IJCAI 2022 Multi-Agent Concentrative Coordination with Decentralized Task Representation Lei Yuan, Chenghe Wang, Jianhao Wang, Fuxiang Zhang, Feng Chen, Cong Guan, Zongzhang Zhang, Chongjie Zhang, Yang Yu

NeurIPS 2022 Multi-Agent Dynamic Algorithm Configuration Ke Xue, Jiacheng Xu, Lei Yuan, Miqing Li, Chao Qian, Zongzhang Zhang, Yang Yu

AAAI 2022 Multi-Agent Incentive Communication via Decentralized Teammate Modeling Lei Yuan, Jianhao Wang, Fuxiang Zhang, Chenghe Wang, Zongzhang Zhang, Yang Yu, Chongjie Zhang

NeurIPSW 2022 Multi-Agent Policy Transfer via Task Relationship Modeling Rong-Jun Qin, Feng Chen, Tonghan Wang, Lei Yuan, Xiaoran Wu, Yipeng Kang, Zongzhang Zhang, Chongjie Zhang, Yang Yu

NeurIPS 2021 Adaptive Online Packing-Guided Search for POMDPs Chenyang Wu, Guoyu Yang, Zongzhang Zhang, Yang Yu, Dong Li, Wulong Liu, Jianye Hao

NeurIPS 2021 Cross-Modal Domain Adaptation for Cost-Efficient Visual Reinforcement Learning Xiong-Hui Chen, Shengyi Jiang, Feng Xu, Zongzhang Zhang, Yang Yu

AAAI 2021 Enhancing Context-Based Meta-Reinforcement Learning Algorithms via an Efficient Task Encoder (Student Abstract) Feng Xu, Shengyi Jiang, Hao Yin, Zongzhang Zhang, Yang Yu, Ming Li, Dong Li, Wulong Liu

AAAI 2021 LB-DESPOT: Efficient Online POMDP Planning Considering Lower Bound in Action Selection (Student Abstract) Chenyang Wu, Rui Kong, Guoyu Yang, Xianghan Kong, Zongzhang Zhang, Yang Yu, Dong Li, Wulong Liu

IJCAI 2020 Efficient Deep Reinforcement Learning via Adaptive Policy Transfer Tianpei Yang, Jianye Hao, Zhaopeng Meng, Zongzhang Zhang, Yujing Hu, Yingfeng Chen, Changjie Fan, Weixun Wang, Wulong Liu, Zhaodong Wang, Jiajie Peng

AAAI 2020 Generative Adversarial Imitation Learning from Failed Experiences (Student Abstract) Jiacheng Zhu, Jiahao Lin, Meng Wang, Yingfeng Chen, Changjie Fan, Chong Jiang, Zongzhang Zhang

AAAI 2020 Third-Person Imitation Learning via Image Difference and Variational Discriminator Bottleneck (Student Abstract) Chong Jiang, Zongzhang Zhang, Zixuan Chen, Jiacheng Zhu, Junpeng Jiang

IJCAI 2020 Triple-GAIL: A Multi-Modal Imitation Learning Framework with Generative Adversarial Nets Cong Fei, Bin Wang, Yuzheng Zhuang, Zongzhang Zhang, Jianye Hao, Hongbo Zhang, Xuewu Ji, Wulong Liu

IJCAI 2019 Monte Carlo Tree Search for Policy Optimization Xiaobai Ma, Katherine Rose Driggs-Campbell, Zongzhang Zhang, Mykel J. Kochenderfer

NeurIPS 2018 A Deep Bayesian Policy Reuse Approach Against Non-Stationary Agents Yan Zheng, Zhaopeng Meng, Jianye Hao, Zongzhang Zhang, Tianpei Yang, Changjie Fan

IJCAI 2017 Weighted Double Q-Learning Zongzhang Zhang, Zhiyuan Pan, Mykel J. Kochenderfer

ICML 2014 Covering Number for Efficient Heuristic-Based POMDP Planning Zongzhang Zhang, David Hsu, Wee Sun Lee

AAAI 2012 Covering Number as a Complexity Measure for POMDP Planning and Learning Zongzhang Zhang, Michael L. Littman, Xiaoping Chen

UAI 2012 FHHOP: A Factored Hybrid Heuristic Online Planning Algorithm for Large POMDPs Zongzhang Zhang, Xiaoping Chen