Sun, Yihao

11 publications

ICLR 2026 ADM-V2: Pursuing Full-Horizon Roll-Out in Dynamics Models for Offline Policy Learning and Evaluation Haoxin Lin, Siyuan Xiao, Yi-Chen Li, Zhilong Zhang, Yihao Sun, Chengxing Jia, Yang Yu

ICLR 2026 Hierarchical Value-Decomposed Offline Reinforcement Learning for Whole-Body Control Zhilong Zhang, Yunpeng Mei, Xinghao Du, Hongjie Cao, Haonan Wang, Pengyuan Min, Chenyu Wang, Pengfei Chen, Chenbo Xin, Yijie Wang, Wenyu Luo, Yihao Sun, Yidi Wang, Lei Yuan, Gang Wang, Yang Yu

ICLR 2025 Any-Step Dynamics Model Improves Future Predictions for Online and Offline Reinforcement Learning Haoxin Lin, Yu-Yan Xu, Yihao Sun, Zhilong Zhang, Yi-Chen Li, Chengxing Jia, Junyin Ye, Jiaji Zhang, Yang Yu

AAAI 2025 Column-Oriented Datalog on the GPU Yihao Sun, Sidharth Kumar, Thomas Gilray, Kristopher K. Micinski

ICML 2025 Improving Reward Model Generalization from Adversarial Process Enhanced Preferences Zhilong Zhang, Tian Xu, Xinghao Du, Xingchen Cao, Yihao Sun, Yang Yu

NeurIPS 2024 Assemblage: Automatic Binary Dataset Construction for Machine Learning Chang Liu, Rebecca Saul, Yihao Sun, Edward Raff, Maya Fuchs, Townsend Southard Pantano, James Holt, Kristopher Micinski

AAAI 2024 Episodic Return Decomposition by Difference of Implicitly Assigned Sub-Trajectory Reward Haoxin Lin, Hongqiu Wu, Jiaji Zhang, Yihao Sun, Junyin Ye, Yang Yu

ICLR 2024 Flow to Better: Offline Preference-Based Reinforcement Learning via Preferred Trajectory Generation Zhilong Zhang, Yihao Sun, Junyin Ye, Tian-Shuo Liu, Jiaji Zhang, Yang Yu

ICML 2024 Policy-Conditioned Environment Models Are More Generalizable Ruifeng Chen, Xiong-Hui Chen, Yihao Sun, Siyuan Xiao, Minhui Li, Yang Yu

NeurIPS 2024 Provably and Practically Efficient Adversarial Imitation Learning with General Function Approximation Tian Xu, Zhilong Zhang, Ruishuo Chen, Yihao Sun, Yang Yu

ICML 2023 Model-Bellman Inconsistency for Model-Based Offline Reinforcement Learning Yihao Sun, Jiaji Zhang, Chengxing Jia, Haoxin Lin, Junyin Ye, Yang Yu