Miao, Qinghai

2 publications

ICLR 2025 Scaling Offline Model-Based RL via Jointly-Optimized World-Action Model Pretraining Jie Cheng, Ruixi Qiao, Yingwei Ma, Binhua Li, Gang Xiong, Qinghai Miao, Yongbin Li, Yisheng Lv

ICML 2024 RIME: Robust Preference-Based Reinforcement Learning with Noisy Preferences Jie Cheng, Gang Xiong, Xingyuan Dai, Qinghai Miao, Yisheng Lv, Fei-Yue Wang