Zhang, Qichao

6 publications

AAAI 2025 In-Dataset Trajectory Return Regularization for Offline Preference-Based Reinforcement Learning Songjun Tu, Jingbo Sun, Qichao Zhang, Yaocheng Zhang, Jia Liu, Ke Chen, Dongbin Zhao

NeurIPS 2025 Learning When to Think: Shaping Adaptive Reasoning in R1-Style Models via Multi-Stage RL Songjun Tu, Jiahao Lin, Qichao Zhang, Xiangyu Tian, Linjing Li, Xiangyuan Lan, Dongbin Zhao

CoRL 2025 ReasonPlan: Unified Scene Prediction and Decision Reasoning for Closed-Loop Autonomous Driving Xueyi Liu, Zuodong Zhong, Qichao Zhang, Yuxin Guo, Yupeng Zheng, Junli Wang, Dongbin Zhao, Yun-Fu Liu, Zhiguo Su, Yinfeng Gao, Qiao Lin, Chen Huiyong

ICLR 2025 Unsupervised Zero-Shot Reinforcement Learning via Dual-Value Forward-Backward Representation Jingbo Sun, Songjun Tu, Qichao Zhang, Haoran Li, Xin Liu, Yaran Chen, Ke Chen, Dongbin Zhao

ICCV 2025 World4Drive: End-to-End Autonomous Driving via Intention-Aware Physical Latent World Model Yupeng Zheng, Pengxuan Yang, Zebin Xing, Qichao Zhang, Yuhang Zheng, Yinfeng Gao, Pengfei Li, Teng Zhang, Zhongpu Xia, Peng Jia, XianPeng Lang, Dongbin Zhao

ICLRW 2023 Prototypical Context-Aware Dynamics Generalization for High-Dimensional Model-Based Reinforcement Learning Junjie Wang, Yao Mu, Dong Li, Qichao Zhang, Dongbin Zhao, Yuzheng Zhuang, Ping Luo, Bin Wang, Jianye Hao