Zhao, Qianchuan

17 publications

NeurIPS 2025 DAIL: Beyond Task Ambiguity for Language-Conditioned Reinforcement Learning Runpeng Xie, Quanwei Wang, Hao Hu, Zherui Zhou, Ni Mu, Xiyun Li, Yiqin Yang, Shuang Xu, Qianchuan Zhao, Bo Xu

JAIR 2025 DSAC: Distributional Soft Actor-Critic for Risk-Sensitive Reinforcement Learning Xiaoteng Ma, Junyao Chen, Li Xia, Jun Yang, Qianchuan Zhao, Zhengyuan Zhou

ICLR 2025 Episodic Novelty Through Temporal Distance Yuhua Jiang, Qihan Liu, Yiqin Yang, Xiaoteng Ma, Dianyu Zhong, Hao Hu, Jun Yang, Bin Liang, Bo Xu, Chongjie Zhang, Qianchuan Zhao

ICLR 2025 Fewer May Be Better: Enhancing Offline Reinforcement Learning with Reduced Dataset Yiqin Yang, Quanwei Wang, Chenghao Li, Hao Hu, Chengjie Wu, Yuhua Jiang, Dianyu Zhong, Ziyou Zhang, Qianchuan Zhao, Chongjie Zhang, Bo Xu

ICML 2024 Bayesian Design Principles for Offline-to-Online Reinforcement Learning Hao Hu, Yiqin Yang, Jianing Ye, Chengjie Wu, Ziqing Mai, Yujing Hu, Tangjie Lv, Changjie Fan, Qianchuan Zhao, Chongjie Zhang

NeurIPSW 2024 Episodic Novelty Through Temporal Distance Yuhua Jiang, Qihan Liu, Yiqin Yang, Xiaoteng Ma, Dianyu Zhong, Bo Xu, Jun Yang, Bin Liang, Chongjie Zhang, Qianchuan Zhao

AAAI 2024 Learning Diverse Risk Preferences in Population-Based Self-Play Yuhua Jiang, Qihan Liu, Xiaoteng Ma, Chenghao Li, Yiqin Yang, Jun Yang, Bin Liang, Qianchuan Zhao

AAAI 2024 No Prior Mask: Eliminate Redundant Action for Deep Reinforcement Learning Dianyu Zhong, Yiqin Yang, Qianchuan Zhao

AAAI 2023 Flow to Control: Offline Reinforcement Learning with Lossless Primitive Discovery Yiqin Yang, Hao Hu, Wenzhe Li, Siyuan Li, Jun Yang, Qianchuan Zhao, Chongjie Zhang

IJCAI 2023 Mean-Semivariance Policy Optimization via Risk-Averse Reinforcement Learning (Extended Abstract) Xiaoteng Ma, Shuai Ma, Li Xia, Qianchuan Zhao

ICLR 2023 The Provable Benefit of Unsupervised Data Sharing for Offline Reinforcement Learning Hao Hu, Yiqin Yang, Qianchuan Zhao, Chongjie Zhang

JAIR 2022 Mean-Semivariance Policy Optimization via Risk-Averse Reinforcement Learning Xiaoteng Ma, Shuai Ma, Li Xia, Qianchuan Zhao

ICLR 2022 Offline Reinforcement Learning with Value-Based Episodic Memory Xiaoteng Ma, Yiqin Yang, Hao Hu, Jun Yang, Chongjie Zhang, Qianchuan Zhao, Bin Liang, Qihan Liu

ICML 2022 On the Role of Discount Factor in Offline Reinforcement Learning Hao Hu, Yiqin Yang, Qianchuan Zhao, Chongjie Zhang

IJCAI 2021 Average-Reward Reinforcement Learning with Trust Region Methods Xiaoteng Ma, Xiaohang Tang, Li Xia, Jun Yang, Qianchuan Zhao

NeurIPS 2021 Believe What You See: Implicit Constraint Approach for Offline Multi-Agent Reinforcement Learning Yiqin Yang, Xiaoteng Ma, Chenghao Li, Zewu Zheng, Qiyuan Zhang, Gao Huang, Jun Yang, Qianchuan Zhao

NeurIPS 2021 Celebrating Diversity in Shared Multi-Agent Reinforcement Learning Chenghao Li, Tonghan Wang, Chengjie Wu, Qianchuan Zhao, Jun Yang, Chongjie Zhang