Dai, Juntao

8 publications

ICLR 2025 Mitigating Reward Over-Optimization in RLHF via Behavior-Supported Regularization Juntao Dai, Taiye Chen, Yaodong Yang, Qian Zheng, Gang Pan

NeurIPS 2025 Safe RLHF-V: Safe Reinforcement Learning from Multi-Modal Human Feedback Jiaming Ji, Xinyu Chen, Rui Pan, Han Zhu, Jiahao Li, Donghai Hong, Boyuan Chen, Jiayi Zhou, Kaile Wang, Juntao Dai, Chi-Min Chan, Sirui Han, Yike Guo, Yaodong Yang

NeurIPS 2024 Aligner: Efficient Alignment by Learning to Correct Jiaming Ji, Boyuan Chen, Hantao Lou, Donghai Hong, Borong Zhang, Xuehai Pan, Juntao Dai, Tianyi Qiu, Yaodong Yang

MLOSS 2024 OmniSafe: An Infrastructure for Accelerating Safe Reinforcement Learning Research Jiaming Ji, Jiayi Zhou, Borong Zhang, Juntao Dai, Xuehai Pan, Ruiyang Sun, Weidong Huang, Yiran Geng, Mickel Liu, Yaodong Yang

ICML 2024 Safe Reinforcement Learning Using Finite-Horizon Gradient-Based Estimation Juntao Dai, Yaodong Yang, Qian Zheng, Gang Pan

NeurIPS 2024 SafeSora: Towards Safety Alignment of Text2Video Generation via a Human Preference Dataset Juntao Dai, Tianle Chen, Xuyao Wang, Ziran Yang, Taiye Chen, Jiaming Ji, Yaodong Yang

AAAI 2023 Augmented Proximal Policy Optimization for Safe Reinforcement Learning Juntao Dai, Jiaming Ji, Long Yang, Qian Zheng, Gang Pan

NeurIPS 2022 Constrained Update Projection Approach to Safe Policy Optimization Long Yang, Jiaming Ji, Juntao Dai, Linrui Zhang, Binbin Zhou, Pengfei Li, Yaodong Yang, Gang Pan