Ye, Deheng

30 publications

ICML 2025 Ad Hoc Teamwork via Offline Goal-Based Decision Transformers Xinzhi Zhang, Hohei Chan, Deheng Ye, Yi Cai, Mengchen Zhao

ICLR 2025 Cross-Domain Offline Policy Adaptation with Optimal Transport and Dataset Constraint Jiafei Lyu, Mengbei Yan, Zhongjian Qiao, Runze Liu, Xiaoteng Ma, Deheng Ye, Jing-Wen Yang, Zongqing Lu, Xiu Li

ICML 2025 Decision Mixer: Integrating Long-Term and Local Dependencies via Dynamic Token Selection for Decision-Making Hongling Zheng, Li Shen, Yong Luo, Deheng Ye, Bo Du, Jialie Shen, Dacheng Tao

ICCV 2025 GTR: Guided Thought Reinforcement Prevents Thought Collapse in RL-Based VLM Agent Training Tong Wei, Yijun Yang, Junliang Xing, Yuanchun Shi, Zongqing Lu, Deheng Ye

NeurIPS 2025 OpenMMEgo: Enhancing Egocentric Understanding for LMMs with Open Weights and Data Hao Luo, Zihao Yue, Wanpeng Zhang, Yicheng Feng, Sipeng Zheng, Deheng Ye, Zongqing Lu

NeurIPS 2025 Robust Policy Expansion for Offline-to-Online RL Under Diverse Data Corruption Longxiang He, Deheng Ye, Junbo Tan, Xueqian Wang, Li Shen

NeurIPS 2025 Value-Guided Decision Transformer: A Unified Reinforcement Learning Framework for Online and Offline Settings Hongling Zheng, Li Shen, Yong Luo, Deheng Ye, Shuhan Xu, Bo Du, Jialie Shen, Dacheng Tao

NeurIPS 2025 WALL-E: World Alignment by NeuroSymbolic Learning Improves World Model-Based LLM Agents Siyu Zhou, Tianyi Zhou, Yijun Yang, Guodong Long, Deheng Ye, Jing Jiang, Chengqi Zhang

TMLR 2024 Affordable Generative Agents Yangbin Yu, Qin Zhang, Junyou Li, Qiang Fu, Deheng Ye

NeurIPS 2024 Learning Versatile Skills with Curriculum Masking Yao Tang, Zhihui Xie, Zichuan Lin, Deheng Ye, Shuai Li

TMLR 2024 More Agents Is All You Need Junyou Li, Qin Zhang, Yangbin Yu, Qiang Fu, Deheng Ye

TMLR 2024 Revisiting Discrete Soft Actor-Critic Haibin Zhou, Tong Wei, Zichuan Lin, Junyou Li, Junliang Xing, Yuanchun Shi, Li Shen, Chao Yu, Deheng Ye

TMLR 2023 A Survey on Transformers in Reinforcement Learning Wenzhe Li, Hao Luo, Zichuan Lin, Chongjie Zhang, Zongqing Lu, Deheng Ye

ICML 2023 Future-Conditioned Unsupervised Pretraining for Decision Transformer Zhihui Xie, Zichuan Lin, Deheng Ye, Qiang Fu, Yang Wei, Shuai Li

NeurIPS 2023 Hokoff: Real Game Dataset from Honor of Kings and Its Offline Reinforcement Learning Benchmarks Yun Qu, Boyuan Wang, Jianzhun Shao, Yuhang Jiang, Chen Chen, Zhenbin Ye, Liu Linc, Yang Feng, Lin Lai, Hongyang Qin, Minwen Deng, Juchao Zhuo, Deheng Ye, Qiang Fu, Yang Guang, Wei Yang, Lanxiao Huang, Xiangyang Ji

ICLR 2023 More Centralized Training, Still Decentralized Execution: Multi-Agent Conditional Policy Factorization Jiangxing Wang, Deheng Ye, Zongqing Lu

NeurIPS 2023 Mutual-Information Regularized Multi-Agent Policy Iteration Wang, Deheng Ye, Zongqing Lu

TMLR 2023 RLTF: Reinforcement Learning from Unit Test Feedback Jiate Liu, Yiqin Zhu, Kaiwen Xiao, Qiang Fu, Xiao Han, Yang Wei, Deheng Ye

AAAI 2023 RLogist: Fast Observation Strategy on Whole-Slide Images with Deep Reinforcement Learning Boxuan Zhao, Jun Zhang, Deheng Ye, Jian Cao, Xiao Han, Qiang Fu, Wei Yang

TMLR 2023 Replay-Enhanced Continual Reinforcement Learning Tiantian Zhang, Kevin Zehua Shen, Zichuan Lin, Bo Yuan, Xueqian Wang, Xiu Li, Deheng Ye

NeurIPS 2022 Honor of Kings Arena: An Environment for Generalization in Competitive Reinforcement Learning Hua Wei, Jingxiao Chen, Xiyang Ji, Hongyang Qin, Minwen Deng, Siqin Li, Liang Wang, Weinan Zhang, Yong Yu, Liu Linc, Lanxiao Huang, Deheng Ye, Qiang Fu, Wei Yang

IJCAI 2022 JueWu-MC: Playing Minecraft with Sample-Efficient Hierarchical Reinforcement Learning Zichuan Lin, Junyou Li, Jianing Shi, Deheng Ye, Qiang Fu, Wei Yang

IJCAI 2021 Boosting Offline Reinforcement Learning with Residual Generative Modeling Hua Wei, Deheng Ye, Zhao Liu, Hao Wu, Bo Yuan, Qiang Fu, Wei Yang, Zhenhui Li

NeurIPS 2021 Coordinated Proximal Policy Optimization Zifan Wu, Chao Yu, Deheng Ye, Junge Zhang, Haiyin Piao, Hankz Hankui Zhuo

NeurIPS 2021 Learning Diverse Policies in MOBA Games via Macro-Goals Yiming Gao, Bei Shi, Xueying Du, Liang Wang, Guangwei Chen, Zhenjie Lian, Fuhao Qiu, Guoan Han, Weixuan Wang, Deheng Ye, Qiang Fu, Wei Yang, Lanxiao Huang

IJCAI 2021 MapGo: Model-Assisted Policy Optimization for Goal-Oriented Tasks Menghui Zhu, Minghuan Liu, Jian Shen, Zhicheng Zhang, Sheng Chen, Weinan Zhang, Deheng Ye, Yong Yu, Qiang Fu, Wei Yang

AAAI 2020 Mastering Complex Control in MOBA Games with Deep Reinforcement Learning Deheng Ye, Zhao Liu, Mingfei Sun, Bei Shi, Peilin Zhao, Hao Wu, Hongsheng Yu, Shaojie Yang, Xipeng Wu, Qingwei Guo, Qiaobo Chen, Yinyuting Yin, Hao Zhang, Tengfei Shi, Liang Wang, Qiang Fu, Wei Yang, Lanxiao Huang

IJCAI 2020 Relation-Aware Transformer for Portfolio Policy Learning Ke Xu, Yifan Zhang, Deheng Ye, Peilin Zhao, Mingkui Tan

NeurIPS 2020 Towards Playing Full MOBA Games with Deep Reinforcement Learning Deheng Ye, Guibin Chen, Wen Zhang, Sheng Chen, Bo Yuan, Bo Liu, Jia Chen, Zhao Liu, Fuhao Qiu, Hongsheng Yu, Yinyuting Yin, Bei Shi, Liang Wang, Tengfei Shi, Qiang Fu, Wei Yang, Lanxiao Huang, Wei Liu

IJCAI 2019 Adversarial Transfer for Named Entity Boundary Detection with Pointer Networks Jing Li, Deheng Ye, Shuo Shang