Hu, Yujing

29 publications

NeurIPS 2025 Improving Reward Models with Proximal Policy Exploration for Preference-Based Reinforcement Learning Yiwen Zhu, Jinyi Liu, Pengjie Gu, Yifu Yuan, Zhenxing Ge, Wenya Wei, Zhou Fang, Yujing Hu, Bo An

ICLR 2025 Reinforcement Learning from Imperfect Corrective Actions and Proxy Rewards Zhaohui Jiang, Xuening Feng, Paul Weng, Yifei Zhu, Yan Song, Tianze Zhou, Yujing Hu, Tangjie Lv, Changjie Fan

ICLR 2024 AlignDiff: Aligning Diverse Human Preferences via Behavior-Customisable Diffusion Model Zibin Dong, Yifu Yuan, Jianye Hao, Fei Ni, Yao Mu, Yan Zheng, Yujing Hu, Tangjie Lv, Changjie Fan, Zhipeng Hu

ICML 2024 Bayesian Design Principles for Offline-to-Online Reinforcement Learning Hao Hu, Yiqin Yang, Jianing Ye, Chengjie Wu, Ziqing Mai, Yujing Hu, Tangjie Lv, Changjie Fan, Qianchuan Zhao, Chongjie Zhang

UAI 2024 Hybrid CtrlFormer: Learning Adaptive Search Space Partition for Hybrid Action Control via Transformer-Based Monte Carlo Tree Search Jiashun Liu, Xiaotian Hao, Jianye Hao, Yan Zheng, Yujing Hu, Changjie Fan, Tangjie Lv, Zhipeng Hu

ECCV 2024 Norface: Improving Facial Expression Analysis by Identity Normalization Hanwei Liu, Rudong An, Zhimeng Zhang, Bowen Ma, Wei Zhang, Yan Song, Yujing Hu, Chen Wei, Yu Ding

AAAI 2024 Optimistic Value Instructors for Cooperative Multi-Agent Reinforcement Learning Chao Li, Yupeng Zhang, Jianqi Wang, Yujing Hu, Shaokang Dong, Wenbin Li, Tangjie Lv, Changjie Fan, Yang Gao

NeurIPSW 2024 Optimizing Reward Models with Proximal Policy Exploration in Preference-Based Reinforcement Learning Yiwen Zhu, Jinyi Liu, Yifu Yuan, Wenya Wei, Zhenxing Ge, Qianyi Fu, Zhou Fang, Yujing Hu, Bo An

IJCAI 2024 STAR: Spatio-Temporal State Compression for Multi-Agent Tasks with Rich Observations Chao Li, Yujing Hu, Shangdong Yang, Tangjie Lv, Changjie Fan, Wenbin Li, Chongjie Zhang, Yang Gao

ICLR 2024 Stylized Offline Reinforcement Learning: Extracting Diverse High-Quality Behaviors from Heterogeneous Datasets Yihuan Mao, Chengjie Wu, Xi Chen, Hao Hu, Ji Jiang, Tianze Zhou, Tangjie Lv, Changjie Fan, Zhipeng Hu, Yi Wu, Yujing Hu, Chongjie Zhang

NeurIPS 2024 Unlock the Intermittent Control Ability of Model Free Reinforcement Learning Jiashun Liu, Jianye Hao, Xiaotian Hao, Yi Ma, Yan Zheng, Yujing Hu, Tangji Lv

IJCAI 2024 vMFER: Von Mises-Fisher Experience Resampling Based on Uncertainty of Gradient Directions for Policy Improvement Yiwen Zhu, Jinyi Liu, Wenya Wei, Qianyi Fu, Yujing Hu, Zhou Fang, Bo An, Jianye Hao, Tangjie Lv, Changjie Fan

NeurIPS 2023 Conservative Offline Policy Adaptation in Multi-Agent Games Chengjie Wu, Pingzhong Tang, Jun Yang, Yujing Hu, Tangjie Lv, Changjie Fan, Chongjie Zhang

ICLR 2023 EUCLID: Towards Efficient Unsupervised Reinforcement Learning with Multi-Choice Dynamics Model Yifu Yuan, Jianye Hao, Fei Ni, Yao Mu, Yan Zheng, Yujing Hu, Jinyi Liu, Yingfeng Chen, Changjie Fan

ICLR 2023 Neural Episodic Control with State Abstraction Zhuo Li, Derui Zhu, Yujing Hu, Xiaofei Xie, Lei Ma, Yan Zheng, Yan Song, Yingfeng Chen, Jianjun Zhao

NeurIPSW 2022 EUCLID: Towards Efficient Unsupervised Reinforcement Learning with Multi-Choice Dynamics Model Yifu Yuan, Jianye Hao, Fei Ni, Yao Mu, Yan Zheng, Yujing Hu, Jinyi Liu, Yingfeng Chen, Changjie Fan

ICML 2022 Individual Reward Assisted Multi-Agent Reinforcement Learning Li Wang, Yupeng Zhang, Yujing Hu, Weixun Wang, Chongjie Zhang, Yang Gao, Jianye Hao, Tangjie Lv, Changjie Fan

NeurIPSW 2022 Model and Method: Training-Time Attack for Cooperative Multi-Agent Reinforcement Learning Siyang Wu, Tonghan Wang, Xiaoran Wu, Jingfeng Zhang, Yujing Hu, Changjie Fan, Chongjie Zhang

NeurIPS 2021 An Efficient Transfer Learning Framework for Multiagent Reinforcement Learning Tianpei Yang, Weixun Wang, Hongyao Tang, Jianye Hao, Zhaopeng Meng, Hangyu Mao, Dong Li, Wulong Liu, Yingfeng Chen, Yujing Hu, Changjie Fan, Chengwei Zhang

NeurIPS 2021 Episodic Multi-Agent Reinforcement Learning with Curiosity-Driven Exploration Lulu Zheng, Jiarui Chen, Jianhao Wang, Jiamin He, Yujing Hu, Yingfeng Chen, Changjie Fan, Yang Gao, Chongjie Zhang

NeurIPS 2021 Towards Unifying Behavioral and Response Diversity for Open-Ended Learning in Zero-Sum Games Xiangyu Liu, Hangtian Jia, Ying Wen, Yujing Hu, Yingfeng Chen, Changjie Fan, Zhipeng Hu, Yaodong Yang

ICLR 2020 Action Semantics Network: Considering the Effects of Actions in Multiagent Systems Weixun Wang, Tianpei Yang, Yong Liu, Jianye Hao, Xiaotian Hao, Yujing Hu, Yingfeng Chen, Changjie Fan, Yang Gao

IJCAI 2020 Efficient Deep Reinforcement Learning via Adaptive Policy Transfer Tianpei Yang, Jianye Hao, Zhaopeng Meng, Zongzhang Zhang, Yujing Hu, Yingfeng Chen, Changjie Fan, Weixun Wang, Wulong Liu, Zhaodong Wang, Jiajie Peng

AAAI 2020 From Few to More: Large-Scale Dynamic Multiagent Curriculum Learning Weixun Wang, Tianpei Yang, Yong Liu, Jianye Hao, Xiaotian Hao, Yujing Hu, Yingfeng Chen, Changjie Fan, Yang Gao

NeurIPS 2020 Learning to Utilize Shaping Rewards: A New Approach of Reward Shaping Yujing Hu, Weixun Wang, Hangtian Jia, Yixiang Wang, Yingfeng Chen, Jianye Hao, Feng Wu, Changjie Fan

AAAI 2020 Multi-Agent Game Abstraction via Graph Attention Neural Network Yong Liu, Weixun Wang, Yujing Hu, Jianye Hao, Xingguo Chen, Yang Gao

ICML 2020 Q-Value Path Decomposition for Deep Multiagent Reinforcement Learning Yaodong Yang, Jianye Hao, Guangyong Chen, Hongyao Tang, Yingfeng Chen, Yujing Hu, Changjie Fan, Zhongyu Wei

IJCAI 2019 Explicitly Coordinated Policy Iteration Yujing Hu, Yingfeng Chen, Changjie Fan, Jianye Hao

IJCAI 2019 Value Function Transfer for Deep Multi-Agent Reinforcement Learning Based on N-Step Returns Yong Liu, Yujing Hu, Yang Gao, Yingfeng Chen, Changjie Fan