Ding, Bo

8 publications

AAAI 2025 Enhancing Decision-Making for LLM Agents via Step-Level Q-Value Models Yuanzhao Zhai, Tingkai Yang, Kele Xu, Dawei Feng, Cheng Yang, Bo Ding, Huaimin Wang

ICML 2025 Improving the Continuity of Goal-Achievement Ability via Policy Self-Regularization for Goal-Conditioned Reinforcement Learning Xudong Gong, Sen Yang, Feng Dawei, Kele Xu, Bo Ding, Huaimin Wang, Yong Dou

ICLR 2025 VVC-Gym: A Fixed-Wing UAV Reinforcement Learning Environment for Multi-Goal Long-Horizon Problems Xudong Gong, Feng Dawei, Kele Xu, Weijia Wang, Zhangjun Sun, Xing Zhou, Si Zheng, Bo Ding, Huaimin Wang

NeurIPS 2024 Goal-Conditioned On-Policy Reinforcement Learning Xudong Gong, Dawei Feng, Kele Xu, Bo Ding, Huaimin Wang

ICML 2024 Iterative Regularized Policy Optimization with Imperfect Demonstrations Gong Xudong, Feng Dawei, Kele Xu, Yuanzhao Zhai, Chengkang Yao, Weijia Wang, Bo Ding, Huaimin Wang

AAAI 2024 Optimistic Model Rollouts for Pessimistic Offline Policy Optimization Yuanzhao Zhai, Yiying Li, Zijian Gao, Xudong Gong, Kele Xu, Dawei Feng, Bo Ding, Huaimin Wang

IJCAI 2024 Selective Learning for Sample-Efficient Training in Multi-Agent Sparse Reward Tasks (Extended Abstract) Xinning Chen, Xuan Liu, Yanwen Ba, Shigeng Zhang, Bo Ding, Kenli Li

IJCAI 2022 Goal Consistency: An Effective Multi-Agent Cooperative Method for Multistage Tasks Xinning Chen, Xuan Liu, Shigeng Zhang, Bo Ding, Kenli Li