Bai, Chenjia

34 publications

NeurIPS 2025 Adversarial Locomotion and Motion Imitation for Humanoid Policy Learning Jiyuan Shi, Xinzhe Liu, Dewei Wang, Ouyang Lu, Sören Schwertfeger, Chi Zhang, Fuchun Sun, Chenjia Bai, Xuelong Li

TMLR 2025 Decentralized Transformers with Centralized Aggregation Are Sample-Efficient Multi-Agent World Models Yang Zhang, Chenjia Bai, Bin Zhao, Junchi Yan, Xiu Li, Xuelong Li

ICLRW 2025 Decentralized Transformers with Centralized Aggregation Are Sample-Efficient Multi-Agent World Models Yang Zhang, Chenjia Bai, Bin Zhao, Junchi Yan, Xiu Li, Xuelong Li

ICLR 2025 Discriminator-Guided Embodied Planning for LLM Agent Haofu Qian, Chenjia Bai, Jiatao Zhang, Fei Wu, Wei Song, Xuelong Li

ICLR 2025 Exponential Topology-Enabled Scalable Communication in Multi-Agent Reinforcement Learning Xinran Li, Xiaolu Wang, Chenjia Bai, Jun Zhang

AAAI 2025 Forward KL Regularized Preference Optimization for Aligning Diffusion Policies Zhao Shan, Chenyou Fan, Shuang Qiu, Jiyuan Shi, Chenjia Bai

NeurIPS 2025 HumanoidGen: Data Generation for Bimanual Dexterous Manipulation via LLM Reasoning Zhi Jing, Siyuan Yang, Jicong Ao, Ting Xiao, Yu-Gang Jiang, Chenjia Bai

NeurIPS 2025 Information-Theoretic Reward Decomposition for Generalizable RLHF Liyuan Mao, Haoran Xu, Amy Zhang, Weinan Zhang, Chenjia Bai

NeurIPS 2025 KungfuBot: Physics-Based Humanoid Whole-Body Control for Learning Highly-Dynamic Skills Weiji Xie, Jinrui Han, Jiakun Zheng, Huanyu Li, Xinzhe Liu, Jiyuan Shi, Weinan Zhang, Chenjia Bai, Xuelong Li

ICLR 2025 Online Preference Alignment for Language Models via Count-Based Exploration Chenjia Bai, Yang Zhang, Shuang Qiu, Qiaosheng Zhang, Kang Xu, Xuelong Li

AAAI 2025 Radiology Report Generation via Multi-Objective Preference Optimization Ting Xiao, Lei Shi, Peng Liu, Zhe Wang, Chenjia Bai

NeurIPS 2025 Revisiting Multi-Agent World Modeling from a Diffusion-Inspired Perspective Yang Zhang, Xinran Li, Jianing Ye, Shuang Qiu, Delin Qu, Xiu Li, Chongjie Zhang, Chenjia Bai

ICML 2025 Task-Agnostic Pre-Training and Task-Guided Fine-Tuning for Versatile Diffusion Planner Chenyou Fan, Chenjia Bai, Zhao Shan, Haoran He, Yang Zhang, Zhen Wang

NeurIPS 2025 Towards Reliable LLM-Based Robots Planning via Combined Uncertainty Estimation Shiyuan Yin, Chenjia Bai, Zhang Zihao, Junwei Jin, Xinxin Zhang, Chi Zhang, Xuelong Li

CoRL 2024 Bridging the Sim-to-Real Gap from the Information Bottleneck Perspective Haoran He, Peilin Wu, Chenjia Bai, Hang Lai, Lingxiao Wang, Ling Pan, Xiaolin Hu, Weinan Zhang

ICML 2024 Constrained Ensemble Exploration for Unsupervised Skill Discovery Chenjia Bai, Rushuai Yang, Qiaosheng Zhang, Kang Xu, Yi Chen, Ting Xiao, Xuelong Li

ICML 2024 Contrastive Representation for Data Filtering in Cross-Domain Offline Reinforcement Learning Xiaoyu Wen, Chenjia Bai, Kang Xu, Xudong Yu, Yang Zhang, Xuelong Li, Zhen Wang

ICML 2024 Cross-Domain Policy Adaptation by Capturing Representation Mismatch Jiafei Lyu, Chenjia Bai, Jing-Wen Yang, Zongqing Lu, Xiu Li

ICML 2024 How Does Goal Relabeling Improve Sample Efficiency? Sirui Zheng, Chenjia Bai, Zhuoran Yang, Zhaoran Wang

NeurIPS 2024 Learning an Actionable Discrete Diffusion Policy via Large-Scale Actionless Video Pre-Training Haoran He, Chenjia Bai, Ling Pan, Weinan Zhang, Bin Zhao, Xuelong Li

NeurIPS 2024 ODRL: A Benchmark for Off-Dynamics Reinforcement Learning Jiafei Lyu, Kang Xu, Jiacheng Xu, Mengbei Yan, Jingwen Yang, Zongzhang Zhang, Chenjia Bai, Zongqing Lu, Xiu Li

AAAI 2024 OVD-Explorer: Optimism Should Not Be the Sole Pursuit of Exploration in Noisy Environments Jinyi Liu, Zhi Wang, Yan Zheng, Jianye Hao, Chenjia Bai, Junjie Ye, Zhen Wang, Haiyin Piao, Yang Sun

NeurIPS 2024 Regularized Conditional Diffusion Model for Multi-Task Preference Alignment Xudong Yu, Chenjia Bai, Haoran He, Changhong Wang, Xuelong Li

ICML 2024 SAM-E: Leveraging Visual Foundation Model with Sequence Imitation for Embodied Manipulation Junjie Zhang, Chenjia Bai, Haoran He, Zhigang Wang, Bin Zhao, Xiu Li, Xuelong Li

JAIR 2024 Towards Robust Offline-to-Online Reinforcement Learning via Uncertainty and Smoothness Xiaoyu Wen, Xudong Yu, Rui Yang, Haoyuan Chen, Chenjia Bai, Zhen Wang

ICML 2023 Behavior Contrastive Learning for Unsupervised Skill Discovery Rushuai Yang, Chenjia Bai, Hongyi Guo, Siyuan Li, Bin Zhao, Zhen Wang, Peng Liu, Xuelong Li

NeurIPS 2023 Cross-Domain Policy Adaptation via Value-Guided Data Filtering Kang Xu, Chenjia Bai, Xiaoteng Ma, Dong Wang, Bin Zhao, Zhen Wang, Xuelong Li, Wei Li

NeurIPS 2023 Diffusion Model Is an Effective Planner and Data Synthesizer for Multi-Task Reinforcement Learning Haoran He, Chenjia Bai, Kang Xu, Zhuoran Yang, Weinan Zhang, Dong Wang, Bin Zhao, Xuelong Li

ICML 2022 Contrastive UCB: Provably Efficient Contrastive Self-Supervised Learning in Online Reinforcement Learning Shuang Qiu, Lingxiao Wang, Chenjia Bai, Zhuoran Yang, Zhaoran Wang

ICLR 2022 Pessimistic Bootstrapping for Uncertainty-Driven Offline Reinforcement Learning Chenjia Bai, Lingxiao Wang, Zhuoran Yang, Zhi-Hong Deng, Animesh Garg, Peng Liu, Zhaoran Wang

NeurIPS 2022 RORL: Robust Offline Reinforcement Learning via Conservative Smoothing Rui Yang, Chenjia Bai, Xiaoteng Ma, Zhaoran Wang, Chongjie Zhang, Lei Han

NeurIPS 2021 Dynamic Bottleneck for Robust Self-Supervised Exploration Chenjia Bai, Lingxiao Wang, Lei Han, Animesh Garg, Jianye Hao, Peng Liu, Zhaoran Wang

NeurIPSW 2021 OVD-Explorer: A General Information-Theoretic Exploration Approach for Reinforcement Learning Jinyi Liu, Zhi Wang, Yan Zheng, Jianye Hao, Junjie Ye, Chenjia Bai, Pengyi Li

ICML 2021 Principled Exploration via Optimistic Bootstrapping and Backward Induction Chenjia Bai, Lingxiao Wang, Lei Han, Jianye Hao, Animesh Garg, Peng Liu, Zhaoran Wang