Lu, Zongqing

75 publications

TMLR 2025 $f$-Divergence Policy Optimization in Fully Decentralized Cooperative MARL Kefan Su, Zongqing Lu

UAI 2025 Best Possible Q-Learning Jiechuan Jiang, Zongqing Lu

ICML 2025 Cradle: Empowering Foundation Agents Towards General Computer Control Weihao Tan, Wentao Zhang, Xinrun Xu, Haochong Xia, Ziluo Ding, Boyu Li, Bohan Zhou, Junpeng Yue, Jiechuan Jiang, Yewen Li, Ruyi An, Molei Qin, Chuqiao Zong, Longtao Zheng, Yujie Wu, Xiaoqiang Chai, Yifei Bi, Tianbao Xie, Pengjie Gu, Xiyun Li, Ceyao Zhang, Long Tian, Chaojie Wang, Xinrun Wang, Börje F. Karlsson, Bo An, Shuicheng Yan, Zongqing Lu

UAI 2025 Creative Agents: Empowering Agents with Imagination for Creative Tasks Penglin Cai, Chi Zhang, Yuhui Fu, Haoqi Yuan, Zongqing Lu

ICLR 2025 Cross-Domain Offline Policy Adaptation with Optimal Transport and Dataset Constraint Jiafei Lyu, Mengbei Yan, Zhongjian Qiao, Runze Liu, Xiaoteng Ma, Deheng Ye, Jing-Wen Yang, Zongqing Lu, Xiu Li

ICLR 2025 Cross-Embodiment Dexterous Grasping with Reinforcement Learning Haoqi Yuan, Bohan Zhou, Yuhui Fu, Zongqing Lu

ICLR 2025 Discrete Latent Plans via Semantic Skill Abstractions Haobin Jiang, Jiangxing Wang, Zongqing Lu

ICLR 2025 Efficient Residual Learning with Mixture-of-Experts for Universal Dexterous Grasping Ziye Huang, Haoqi Yuan, Yuhui Fu, Zongqing Lu

NeurIPS 2025 From Experts to a Generalist: Toward General Whole-Body Control for Humanoid Robots Yuxuan Wang, Ming Yang, Ziluo Ding, Yu Zhang, Weishuai Zeng, Xinrun Xu, Haobin Jiang, Zongqing Lu

ICLR 2025 From Pixels to Tokens: Byte-Pair Encoding on Quantized Visual Modalities Wanpeng Zhang, Zilong Xie, Yicheng Feng, Yijiang Li, Xingrun Xing, Sipeng Zheng, Zongqing Lu

ICCV 2025 GTR: Guided Thought Reinforcement Prevents Thought Collapse in RL-Based VLM Agent Training Tong Wei, Yijun Yang, Junliang Xing, Yuanchun Shi, Zongqing Lu, Deheng Ye

ICLR 2025 Learning Video-Conditioned Policy on Unlabelled Data with Joint Embedding Predictive Transformer Hao Luo, Zongqing Lu

NeurIPS 2025 MEgoHand: Multimodal Egocentric Hand-Object Interaction Motion Generation Bohan Zhou, Yi Zhan, Zhongbin Zhang, Zongqing Lu

ICLR 2025 MLLM as Retriever: Interactively Learning Multimodal Retrieval for Embodied Agents Junpeng Yue, Xinrun Xu, Börje F. Karlsson, Zongqing Lu

ICCV 2025 MotionCtrl: A Real-Time Controllable Vision-Language-Motion Model Bin Cao, Sipeng Zheng, Ye Wang, Lujie Xia, Qianshan Wei, Qin Jin, Jing Liu, Zongqing Lu

NeurIPS 2025 OpenMMEgo: Enhancing Egocentric Understanding for LMMs with Open Weights and Data Hao Luo, Zihao Yue, Wanpeng Zhang, Yicheng Feng, Sipeng Zheng, Deheng Ye, Zongqing Lu

NeurIPS 2025 Planning with Quantized Opponent Models XiaoPeng Yu, Kefan Su, Zongqing Lu

ICML 2025 Revisiting Cooperative Off-Policy Multi-Agent Reinforcement Learning Yueheng Li, Guangming Xie, Zongqing Lu

TMLR 2025 SELU: Self-Learning Embodied Multimodal Large Language Models in Unknown Environments Boyu Li, Haobin Jiang, Ziluo Ding, Xinrun Xu, Haoran Li, Dongbin Zhao, Zongqing Lu

ICML 2025 Scaling Large Motion Models with Million-Level Human Motions Ye Wang, Sipeng Zheng, Bin Cao, Qianshan Wei, Weishuai Zeng, Qin Jin, Zongqing Lu

ICCV 2025 Unified Multimodal Understanding via Byte-Pair Visual Encoding Wanpeng Zhang, Yicheng Feng, Hao Luo, Yijiang Li, Zihao Yue, Sipeng Zheng, Zongqing Lu

ICCV 2025 VideoOrion: Tokenizing Object Dynamics in Videos Yicheng Feng, Yijiang Li, Wanpeng Zhang, Sipeng Zheng, Hao Luo, Zihao Yue, Zongqing Lu

ICLR 2025 Watch Less, Do More: Implicit Skill Discovery for Video-Conditioned Policy Jiangxing Wang, Zongqing Lu

TMLR 2024 A Fully Decentralized Surrogate for Multi-Agent Policy Optimization Kefan Su, Zongqing Lu

NeurIPS 2024 AdaPKC: PeakConv with Adaptive Peak Receptive Field for Radar Semantic Segmentation Teng Li, Liwen Zhang, Youcheng Zhang, Zijun Hu, Pengcheng Pi, Zongqing Lu, Qingmin Liao, Zhe Ma

NeurIPS 2024 AuctionNet: A Novel Benchmark for Decision-Making in Large-Scale Games Kefan Su, Yusen Huo, Zhilin Zhang, Shuai Dou, Chuan Yu, Jian Xu, Zongqing Lu, Bo Zheng

NeurIPSW 2024 Cradle: Empowering Foundation Agents Towards General Computer Control Weihao Tan, Wentao Zhang, Xinrun Xu, Haochong Xia, Gang Ding, Boyu Li, Bohan Zhou, Junpeng Yue, Jiechuan Jiang, Yewen Li, Ruyi An, Molei Qin, Chuqiao Zong, Longtao Zheng, YuJie Wu, Xiaoqiang Chai, Yifei Bi, Tianbao Xie, Pengjie Gu, Xiyun Li, Ceyao Zhang, Long Tian, Chaojie Wang, Xinrun Wang, Börje F. Karlsson, Bo An, Shuicheng Yan, Zongqing Lu

ICML 2024 Cross-Domain Policy Adaptation by Capturing Representation Mismatch Jiafei Lyu, Chenjia Bai, Jing-Wen Yang, Zongqing Lu, Xiu Li

AAAI 2024 Learning Multi-Object Positional Relationships via Emergent Communication Yicheng Feng, Boshi An, Zongqing Lu

NeurIPS 2024 Multi-Agent Coordination via Multi-Level Communication Ziluo Ding, Zeyuan Liu, Zhirui Fang, Kefan Su, Liwen Zhu, Zongqing Lu

NeurIPS 2024 ODRL: A Benchmark for Off-Dynamics Reinforcement Learning Jiafei Lyu, Kang Xu, Jiacheng Xu, Mengbei Yan, Jingwen Yang, Zongzhang Zhang, Chenjia Bai, Zongqing Lu, Xiu Li

NeurIPS 2024 Opponent Modeling Based on Subgoal Inference Xiaopeng Yu, Jiechuan Jiang, Zongqing Lu

NeurIPS 2024 Pre-Trained Multi-Goal Transformers with Prompt Optimization for Efficient Online Adaptation Haoqi Yuan, Yuhui Fu, Feiyang Xie, Zongqing Lu

ECCV 2024 Pre-Trained Visual Dynamics Representations for Efficient Policy Learning Hao Luo, Bohan Zhou, Zongqing Lu

ICLR 2024 Pre-Training Goal-Based Models for Sample-Efficient Reinforcement Learning Haoqi Yuan, Zhancun Mu, Feiyang Xie, Zongqing Lu

NeurIPS 2024 RL-GPT: Integrating Reinforcement Learning and Code-as-Policy Shaoteng Liu, Haoqi Yuan, Minda Hu, Yanwei Li, Yukang Chen, Shu Liu, Zongqing Lu, Jiaya Jia

ECCV 2024 Reinforcement Learning Friendly Vision-Language Model for Minecraft Haobin Jiang, Junpeng Yue, Hao Luo, Ziluo Ding, Zongqing Lu

ICLR 2024 SEABO: A Simple Search-Based Method for Offline Imitation Learning Jiafei Lyu, Xiaoteng Ma, Le Wan, Runze Liu, Xiu Li, Zongqing Lu

CVPRW 2024 Semi-Stereo: A Universal Stereo Matching Framework for Imperfect Data via Semi-Supervised Learning Xin Yue, Zongqing Lu, Xiangru Lin, Wenjia Ren, Zhijing Shao, Haonan Hu, Yu Zhang, Qingmin Liao

AAAI 2024 Settling Decentralized Multi-Agent Coordinated Exploration by Novelty Sharing Haobin Jiang, Ziluo Ding, Zongqing Lu

ICLR 2024 Steve-Eye: Equipping LLM-Based Embodied Agents with Visual Perception in Open Worlds Sipeng Zheng, Jiazheng Liu, Yicheng Feng, Zongqing Lu

ICML 2024 Tackling Non-Stationarity in Reinforcement Learning via Causal-Origin Representation Wanpeng Zhang, Yilin Li, Boyu Yang, Zongqing Lu

ICLRW 2024 Towards General Computer Control: A Multimodal Agent for Red Dead Redemption II as a Case Study Weihao Tan, Ziluo Ding, Wentao Zhang, Boyu Li, Bohan Zhou, Junpeng Yue, Haochong Xia, Jiechuan Jiang, Longtao Zheng, Xinrun Xu, Yifei Bi, Pengjie Gu, Xinrun Wang, Börje F. Karlsson, Bo An, Zongqing Lu

JAIR 2024 Understanding What Affects the Generalization Gap in Visual Reinforcement Learning: Theory and Empirical Evidence Jiafei Lyu, Le Wan, Xiu Li, Zongqing Lu

ECCV 2024 UniCode : Learning a Unified Codebook for Multimodal Large Language Models Sipeng Zheng, Bohan Zhou, Yicheng Feng, Ye Wang, Zongqing Lu

ECCV 2024 Visual Grounding for Object-Level Generalization in Reinforcement Learning Haobin Jiang, Zongqing Lu

TMLR 2023 A Survey on Transformers in Reinforcement Learning Wenzhe Li, Hao Luo, Zichuan Lin, Chongjie Zhang, Zongqing Lu, Deheng Ye

ICML 2023 Entity Divider with Language Grounding in Multi-Agent Reinforcement Learning Ziluo Ding, Wanpeng Zhang, Junpeng Yue, Xiangjun Wang, Tiejun Huang, Zongqing Lu

NeurIPS 2023 Learning from Visual Observation via Offline Pretrained State-to-Go Transformer Bohan Zhou, Ke Li, Jiechuan Jiang, Zongqing Lu

ICLR 2023 More Centralized Training, Still Decentralized Execution: Multi-Agent Conditional Policy Factorization Jiangxing Wang, Deheng Ye, Zongqing Lu

CVPR 2023 Multi-Agent Automated Machine Learning Zhaozhi Wang, Kefan Su, Jian Zhang, Huizhu Jia, Qixiang Ye, Xiaodong Xie, Zongqing Lu

NeurIPS 2023 Mutual-Information Regularized Multi-Agent Policy Iteration Wang, Deheng Ye, Zongqing Lu

AAAI 2023 Online Tuning for Offline Decentralized Multi-Agent Reinforcement Learning Jiechuan Jiang, Zongqing Lu

ICCV 2023 ReLeaPS : Reinforcement Learning-Based Illumination Planning for Generalized Photometric Stereo Jun Hoong Chan, Bohan Yu, Heng Guo, Jieji Ren, Zongqing Lu, Boxin Shi

NeurIPSW 2023 Skill Reinforcement Learning and Planning for Open-World Long-Horizon Tasks Haoqi Yuan, Chi Zhang, Hongcheng Wang, Feiyang Xie, Penglin Cai, Hao Dong, Zongqing Lu

ICML 2022 Difference Advantage Estimation for Multi-Agent Policy Gradients Yueheng Li, Guangming Xie, Zongqing Lu

ICML 2022 Divergence-Regularized Multi-Agent Actor-Critic Kefan Su, Zongqing Lu

NeurIPS 2022 Double Check Your State Before Trusting It: Confidence-Aware Bidirectional Offline Model-Based Imagination Jiafei Lyu, Xiu Li, Zongqing Lu

NeurIPS 2022 I2Q: A Fully Decentralized Q-Learning Algorithm Jiechuan Jiang, Zongqing Lu

ICLRW 2022 Learning to Share in Multi-Agent Reinforcement Learning Yuxuan Yi, Ge Li, Yaowei Wang, Zongqing Lu

NeurIPS 2022 Learning to Share in Networked Multi-Agent Reinforcement Learning Yuxuan Yi, Ge Li, Yaowei Wang, Zongqing Lu

ICLRW 2022 MTLight: Efficient Multi-Task Reinforcement Learning for Traffic Signal Control Liwen Zhu, Peixi Peng, Zongqing Lu, Yonghong Tian

NeurIPS 2022 Mildly Conservative Q-Learning for Offline Reinforcement Learning Jiafei Lyu, Xiaoteng Ma, Xiu Li, Zongqing Lu

NeurIPS 2022 Model-Based Opponent Modeling XiaoPeng Yu, Jiechuan Jiang, Wanpeng Zhang, Haobin Jiang, Zongqing Lu

ICML 2022 Robust Task Representations for Offline Meta-Reinforcement Learning via Contrastive Learning Haoqi Yuan, Zongqing Lu

NeurIPSW 2022 State Advantage Weighting for Offline RL Jiafei Lyu, Aicheng Gong, Le Wan, Zongqing Lu, Xiu Li

NeurIPS 2022 Towards Human-Level Bimanual Dexterous Manipulation with Reinforcement Learning Yuanpei Chen, Tianhao Wu, Shengjie Wang, Xidong Feng, Jiechuan Jiang, Zongqing Lu, Stephen McAleer, Hao Dong, Song-Chun Zhu, Yaodong Yang

ICML 2021 FOP: Factorizing Optimal Joint Policy of Maximum-Entropy Multi-Agent Reinforcement Learning Tianhao Zhang, Yueheng Li, Chen Wang, Guangming Xie, Zongqing Lu

AAAI 2021 Hierarchically and Cooperatively Learning Traffic Signal Control Bingyu Xu, Yaowei Wang, Zhaozhi Wang, Huizhu Jia, Zongqing Lu

ICML 2021 The Emergence of Individuality Jiechuan Jiang, Zongqing Lu

AAAI 2020 Generative Exploration and Exploitation Jiechuan Jiang, Zongqing Lu

ICLR 2020 Graph Convolutional Reinforcement Learning Jiechuan Jiang, Chen Dun, Tiejun Huang, Zongqing Lu

NeurIPS 2020 Learning Individually Inferred Communication for Multi-Agent Cooperation Ziluo Ding, Tiejun Huang, Zongqing Lu

NeurIPS 2019 Learning Fairness in Multi-Agent Systems Jiechuan Jiang, Zongqing Lu

NeurIPS 2018 Learning Attentional Communication for Multi-Agent Cooperation Jiechuan Jiang, Zongqing Lu