Yuan, Yifu

18 publications

NeurIPS 2025 COLA: Towards Efficient Multi-Objective Reinforcement Learning with Conflict Objective Regularization in Latent Space Pengyi Li, Hongyao Tang, Yifu Yuan, Jianye Hao, Zibin Dong, Yan Zheng

ICLR 2025 Entropy-Based Activation Function Optimization: A Method on Searching Better Activation Functions Haoyuan Sun, Zihao Wu, Bo Xia, Pu Chang, Zibin Dong, Yifu Yuan, Yongzhe Chang, Xueqian Wang

NeurIPS 2025 Improving Reward Models with Proximal Policy Exploration for Preference-Based Reinforcement Learning Yiwen Zhu, Jinyi Liu, Pengjie Gu, Yifu Yuan, Zhenxing Ge, Wenya Wei, Zhou Fang, Yujing Hu, Bo An

ICML 2025 MODULI: Unlocking Preference Generalization via Diffusion Models for Offline Multi-Objective Reinforcement Learning Yifu Yuan, Zhenrui Zheng, Zibin Dong, Jianye Hao

ICML 2025 R*: Efficient Reward Design via Reward Structure Evolution and Parameter Alignment Optimization with Large Language Models Pengyi Li, Jianye Hao, Hongyao Tang, Yifu Yuan, Jinbin Qiao, Zibin Dong, Yan Zheng

NeurIPSW 2024 A Method on Searching Better Activation Functions Haoyuan Sun, Zihao Wu, Bo Xia, Pu Chang, Zibin Dong, Yifu Yuan, Yongzhe Chang, Xueqian Wang

ICLR 2024 AlignDiff: Aligning Diverse Human Preferences via Behavior-Customisable Diffusion Model Zibin Dong, Yifu Yuan, Jianye Hao, Fei Ni, Yao Mu, Yan Zheng, Yujing Hu, Tangjie Lv, Changjie Fan, Zhipeng Hu

NeurIPS 2024 CleanDiffuser: An Easy-to-Use Modularized Library for Diffusion Models in Decision Making Zibin Dong, Yifu Yuan, Jianye Hao, Fei Ni, Yi Ma, Pengyi Li, Yan Zheng

NeurIPS 2024 DiffuserLite: Towards Real-Time Diffusion Planning Zibin Dong, Jianye Hao, Yifu Yuan, Fei Ni, Yitian Wang, Pengyi Li, Yan Zheng

ICML 2024 KISA: A Unified Keyframe Identifier and Skill Annotator for Long-Horizon Robotics Demonstrations Longxin Kou, Fei Ni, Yan Zheng, Jinyi Liu, Yifu Yuan, Zibin Dong, Jianye Hao

NeurIPSW 2024 Optimizing Reward Models with Proximal Policy Exploration in Preference-Based Reinforcement Learning Yiwen Zhu, Jinyi Liu, Yifu Yuan, Wenya Wei, Zhenxing Ge, Qianyi Fu, Zhou Fang, Yujing Hu, Bo An

NeurIPS 2024 PERIA: Perceive, Reason, Imagine, Act via Holistic Language and Vision Planning for Manipulation Fei Ni, Jianye Hao, Shiguang Wu, Longxin Kou, Yifu Yuan, Zibin Dong, Jinyi Liu, Mingzhi Li, Yuzheng Zhuang, Yan Zheng

ICMLW 2024 SheetAgent: A Generalist Agent for Spreadsheet Reasoning and Manipulation via Large Language Models Yibin Chen, Yifu Yuan, Zeyu Zhang, Yan Zheng, Jinyi Liu, Fei Ni, Jianye Hao

ICLR 2024 Uni-RLHF: Universal Platform and Benchmark Suite for Reinforcement Learning with Diverse Human Feedback Yifu Yuan, Jianye Hao, Yi Ma, Zibin Dong, Hebin Liang, Jinyi Liu, Zhixin Feng, Kai Zhao, Yan Zheng

ICLR 2023 EUCLID: Towards Efficient Unsupervised Reinforcement Learning with Multi-Choice Dynamics Model Yifu Yuan, Jianye Hao, Fei Ni, Yao Mu, Yan Zheng, Yujing Hu, Jinyi Liu, Yingfeng Chen, Changjie Fan

ICML 2023 MetaDiffuser: Diffusion Model as Conditional Planner for Offline Meta-RL Fei Ni, Jianye Hao, Yao Mu, Yifu Yuan, Yan Zheng, Bin Wang, Zhixuan Liang

NeurIPSW 2022 Dissimilar Nodes Improve Graph Active Learning Zhicheng Ren, Yifu Yuan, Yuxin Wu, Xiaxuan Gao, Yewen Wang, Yizhou Sun

NeurIPSW 2022 EUCLID: Towards Efficient Unsupervised Reinforcement Learning with Multi-Choice Dynamics Model Yifu Yuan, Jianye Hao, Fei Ni, Yao Mu, Yan Zheng, Yujing Hu, Jinyi Liu, Yingfeng Chen, Changjie Fan