Yang, Yaodong

106 publications

ICLR 2025 Amulet: ReAlignment During Test Time for Personalized Preference Adaptation of LLMs Zhaowei Zhang, Fengshuo Bai, Qizhi Chen, Chengdong Ma, Mingzhi Wang, Haoran Sun, Zilong Zheng, Yaodong Yang

CoRL 2025 ClutterDexGrasp: A Sim-to-Real System for General Dexterous Grasping in Cluttered Scenes Zeyuan Chen, Qiyang Yan, Yuanpei Chen, Tianhao Wu, Jiyao Zhang, Zihan Ding, Jinzhou Li, Yaodong Yang, Hao Dong

NeurIPS 2025 DexFlyWheel: A Scalable and Self-Improving Data Generation Framework for Dexterous Manipulation Kefei Zhu, Fengshuo Bai, YuanHao Xiang, Yishuai Cai, Xinglin Chen, Ruochong Li, Xingtao Wang, Hao Dong, Yaodong Yang, Xiaopeng Fan, Yuanpei Chen

AAAI 2025 Differentiable Information Enhanced Model-Based Reinforcement Learning Xiaoyuan Zhang, Xinyan Cai, Bo Liu, Weidong Huang, Song-Chun Zhu, Siyuan Qi, Yaodong Yang

ICLR 2025 Emerging Safety Attack and Defense in Federated Instruction Tuning of Large Language Models Rui Ye, Jingyi Chai, Xiangrui Liu, Yaodong Yang, Yanfeng Wang, Siheng Chen

NeurIPS 2025 Empirical Study on Robustness and Resilience in Cooperative Multi-Agent Reinforcement Learning Simin Li, Zihao Mao, Hanxiao Li, Zonglei Jing, Zhuohang Bian, Jun Guo, Li Wang, Zhuoran Han, Ruixiao Xu, Xin Yu, Chengdong Ma, Yuqing Ma, Bo An, Yaodong Yang, Weifeng Lv, Xianglong Liu

ICML 2025 Falcon: Fast Visuomotor Policies via Partial Denoising Haojun Chen, Minghao Liu, Chengdong Ma, Xiaojian Ma, Zailin Ma, Huimin Wu, Yuanpei Chen, Yifan Zhong, Mingzhi Wang, Qing Li, Yaodong Yang

NeurIPS 2025 Generative RLHF-V: Learning Principles from Multi-Modal Human Preference Jiayi Zhou, Jiaming Ji, Boyuan Chen, Jiapeng Sun, Wenqi Chen, Donghai Hong, Sirui Han, Yike Guo, Yaodong Yang

ICLR 2025 In-Context Editing: Learning Knowledge from Self-Induced Distributions Siyuan Qi, Bangcheng Yang, Kailin Jiang, Xiaobo Wang, Jiaqi Li, Yifan Zhong, Yaodong Yang, Zilong Zheng

NeurIPS 2025 InterMT: Multi-Turn Interleaved Preference Alignment with Human Feedback Boyuan Chen, Donghai Hong, Jiaming Ji, Jiacheng Zheng, Bowen Dong, Jiayi Zhou, Kaile Wang, Josef Dai, Xuyao Wang, Wenqi Chen, Qirui Zheng, Wenxin Li, Sirui Han, Yike Guo, Yaodong Yang

ICLR 2025 Magnetic Preference Optimization: Achieving Last-Iterate Convergence for Language Model Alignment Mingzhi Wang, Chengdong Ma, Qizhi Chen, Linjian Meng, Yang Han, Jiancong Xiao, Zhaowei Zhang, Jing Huo, Weijie J Su, Yaodong Yang

ICLR 2025 Mitigating Reward Over-Optimization in RLHF via Behavior-Supported Regularization Juntao Dai, Taiye Chen, Yaodong Yang, Qian Zheng, Gang Pan

AAAI 2025 RAT: Adversarial Attacks on Deep Reinforcement Agents for Targeted Behaviors Fengshuo Bai, Runze Liu, Yali Du, Ying Wen, Yaodong Yang

MLJ 2025 ReDMan: Reliable Dexterous Manipulation with Safe Reinforcement Learning Yiran Geng, Jiaming Ji, Yuanpei Chen, Haoran Geng, Fangwei Zhong, Yaodong Yang

NeurIPS 2025 Risk-Aware Direct Preference Optimization Under Nested Risk Measure Lijun Zhang, Lin Li, Yajie Qi, Huizhong Song, Yaodong Yang, Jun Wang, Wei Wei

ICML 2025 SAE-V: Interpreting Multimodal Models for Enhanced Alignment Hantao Lou, Changye Li, Jiaming Ji, Yaodong Yang

NeurIPS 2025 STAR: Efficient Preference-Based Reinforcement Learning via Dual Regularization Fengshuo Bai, Rui Zhao, Hongming Zhang, Sijia Cui, Shao Zhang, Bo Xu, Lei Han, Ying Wen, Yaodong Yang

NeurIPS 2025 Safe RLHF-V: Safe Reinforcement Learning from Multi-Modal Human Feedback Jiaming Ji, Xinyu Chen, Rui Pan, Han Zhu, Jiahao Li, Donghai Hong, Boyuan Chen, Jiayi Zhou, Kaile Wang, Juntao Dai, Chi-Min Chan, Sirui Han, Yike Guo, Yaodong Yang

NeurIPS 2025 SafeVLA: Towards Safety Alignment of Vision-Language-Action Model via Constrained Learning Borong Zhang, Yuhao Zhang, Jiaming Ji, Yingshan Lei, Josef Dai, Yuanpei Chen, Yaodong Yang

AAAI 2025 Sequence to Sequence Reward Modeling: Improving RLHF by Language Feedback Jiayi Zhou, Jiaming Ji, Josef Dai, Yaodong Yang

NeurIPS 2025 Social World Model-Augmented Mechanism Design Policy Learning Xiaoyuan Zhang, Yizhe Huang, Chengdong Ma, Zhixun Chen, Long Ma, Yali Du, Song-Chun Zhu, Yaodong Yang, Xue Feng

AAAI 2025 Stream Aligner: Efficient Sentence-Level Alignment via Distribution Induction Hantao Lou, Jiaming Ji, Kaile Wang, Yaodong Yang

AAAI 2025 Towards Efficient Collaboration via Graph Modeling in Reinforcement Learning Wenzhe Fan, Zishun Yu, Chengdong Ma, Changye Li, Yaodong Yang, Xinhua Zhang

NeurIPS 2025 World Models Should Prioritize the Unification of Physical and Social Dynamics Xiaoyuan Zhang, Chengdong Ma, Yizhe Huang, Weidong Huang, Siyuan Qi, Song-Chun Zhu, Xue Feng, Yaodong Yang

AAAI 2024 A Perspective of Q-Value Estimation on Offline-to-Online Reinforcement Learning Yinmin Zhang, Jie Liu, Chuming Li, Yazhe Niu, Yaodong Yang, Yu Liu, Wanli Ouyang

NeurIPS 2024 Aligner: Efficient Alignment by Learning to Correct Jiaming Ji, Boyuan Chen, Hantao Lou, Donghai Hong, Borong Zhang, Xuehai Pan, Juntao Dai, Tianyi Qiu, Yaodong Yang

CVPR 2024 AnySkill: Learning Open-Vocabulary Physical Skill for Interactive Agents Jieming Cui, Tengyu Liu, Nian Liu, Yaodong Yang, Yixin Zhu, Siyuan Huang

ICLR 2024 Byzantine Robust Cooperative Multi-Agent Reinforcement Learning as a Bayesian Game Simin Li, Jun Guo, Jingqiao Xiu, Ruixiao Xu, Xin Yu, Jiakai Wang, Aishan Liu, Yaodong Yang, Xianglong Liu

ICLR 2024 CivRealm: A Learning and Reasoning Odyssey in Civilization for Decision-Making Agents Siyuan Qi, Shuo Chen, Yexin Li, Xiangyu Kong, Junqi Wang, Bangcheng Yang, Pring Wong, Yifan Zhong, Xiaoyuan Zhang, Zhaowei Zhang, Nian Liu, Yaodong Yang, Song-Chun Zhu

WACV 2024 DPPMask: Masked Image Modeling with Determinantal Point Processes Junde Xu, Zikai Lin, Donghao Zhou, Yaodong Yang, Xiangyun Liao, Qiong Wang, Bian Wu, Guangyong Chen, Pheng-Ann Heng

ICML 2024 Efficient Adaptation in Mixed-Motive Environments via Hierarchical Opponent Modeling and Planning Yizhe Huang, Anji Liu, Fanqi Kong, Yaodong Yang, Song-Chun Zhu, Xue Feng

NeurIPSW 2024 Emerging Safety Attack and Defense in Federated Instruction Tuning of Large Language Models Rui Ye, Jingyi Chai, Xiangrui Liu, Yaodong Yang, Yanfeng Wang, Siheng Chen

ICML 2024 End-to-End Neuro-Symbolic Reinforcement Learning with Textual Explanations Lirui Luo, Guoxi Zhang, Hongming Xu, Yaodong Yang, Cong Fang, Qing Li

NeurIPSW 2024 FPGA-Gym: An FPGA-Accelerated Reinforcement Learning Environment Simulation Framework Jiayi Li, Hongxiao Zhao, Wenshuo Yue, Yihan Fu, Daijing Shi, Anjunyi Fan, Qinghao Wang, Yaodong Yang, Bonan Yan

JMLR 2024 Heterogeneous-Agent Reinforcement Learning Yifan Zhong, Jakub Grudzien Kuba, Xidong Feng, Siyi Hu, Jiaming Ji, Yaodong Yang

NeurIPSW 2024 Language Models Resist Alignment Jiaming Ji, Kaile Wang, Tianyi Qiu, Boyuan Chen, Changye Li, Hantao Lou, Jiayi Zhou, Josef Dai, Yaodong Yang

TMLR 2024 MaskMA: Towards Zero-Shot Multi-Agent Decision Making with Mask-Based Collaborative Learning Jie Liu, Yinmin Zhang, Chuming Li, Zhiyuan You, Zhanhui Zhou, Chao Yang, Yaodong Yang, Yu Liu, Wanli Ouyang

ICLR 2024 Maximum Entropy Heterogeneous-Agent Reinforcement Learning Jiarong Liu, Yifan Zhong, Siyi Hu, Haobo Fu, Qiang Fu, Xiaojun Chang, Yaodong Yang

CoRL 2024 Neural Attention Field: Emerging Point Relevance in 3D Scenes for One-Shot Dexterous Grasping Qianxu Wang, Congyue Deng, Tyler Ga Wei Lum, Yuanpei Chen, Yaodong Yang, Jeannette Bohg, Yixin Zhu, Leonidas Guibas

CoRL 2024 Object-Centric Dexterous Manipulation from Human Motion Data Yuanpei Chen, Chen Wang, Yaodong Yang, Karen Liu

IJCAI 2024 Off-Agent Trust Region Policy Optimization Ruiqing Chen, Xiaoyuan Zhang, Yali Du, Yifan Zhong, Zheng Tian, Fanglei Sun, Yaodong Yang

MLOSS 2024 OmniSafe: An Infrastructure for Accelerating Safe Reinforcement Learning Research Jiaming Ji, Jiayi Zhou, Borong Zhang, Juntao Dai, Xuehai Pan, Ruiyang Sun, Weidong Huang, Yiran Geng, Mickel Liu, Yaodong Yang

NeurIPS 2024 Panacea: Pareto Alignment via Preference Adaptation for LLMs Yifan Zhong, Chengdong Ma, Xiaoyuan Zhang, Ziran Yang, Haojun Chen, Qingfu Zhang, Siyuan Qi, Yaodong Yang

AAAI 2024 ProAgent: Building Proactive Cooperative Agents with Large Language Models Ceyao Zhang, Kaijie Yang, Siyi Hu, Zihao Wang, Guanghe Li, Yihang Sun, Cheng Zhang, Zhaowei Zhang, Anji Liu, Song-Chun Zhu, Xiaojun Chang, Junge Zhang, Feng Yin, Yitao Liang, Yaodong Yang

NeurIPS 2024 ProgressGym: Alignment with a Millennium of Moral Progress Tianyi Qiu, Yang Zhang, Xuchuan Huang, Jasmine Xinze Li, Jiaming Ji, Yaodong Yang

AAAI 2024 STAS: Spatial-Temporal Return Decomposition for Solving Sparse Rewards Problems in Multi-Agent Reinforcement Learning Sirui Chen, Zhaowei Zhang, Yaodong Yang, Yali Du

ICLR 2024 Safe RLHF: Safe Reinforcement Learning from Human Feedback Josef Dai, Xuehai Pan, Ruiyang Sun, Jiaming Ji, Xinbo Xu, Mickel Liu, Yizhou Wang, Yaodong Yang

ICML 2024 Safe Reinforcement Learning Using Finite-Horizon Gradient-Based Estimation Juntao Dai, Yaodong Yang, Qian Zheng, Gang Pan

ICLR 2024 SafeDreamer: Safe Reinforcement Learning with World Models Weidong Huang, Jiaming Ji, Chunhe Xia, Borong Zhang, Yaodong Yang

NeurIPS 2024 SafeSora: Towards Safety Alignment of Text2Video Generation via a Human Preference Dataset Juntao Dai, Tianle Chen, Xuyao Wang, Ziran Yang, Taiye Chen, Jiaming Ji, Yaodong Yang

ICML 2024 Sample-Efficient Multiagent Reinforcement Learning with Reset Replay Yaodong Yang, Guangyong Chen, Jianye Hao, Pheng-Ann Heng

NeurIPS 2024 Scalable Constrained Policy Optimization for Safe Multi-Agent Reinforcement Learning Lijun Zhang, Lin Li, Wei Wei, Huizhong Song, Yaodong Yang, Jiye Liang

ICML 2023 A Game-Theoretic Framework for Managing Risk in Multi-Agent Systems Oliver Slumbers, David Henry Mguni, Stefano B Blumberg, Stephen Marcus Mcaleer, Yaodong Yang, Jun Wang

AAAI 2023 ACE: Cooperative Multi-Agent Q-Learning with Bidirectional Action-Dependency Chuming Li, Jie Liu, Yinmin Zhang, Yuhong Wei, Yazhe Niu, Yaodong Yang, Yu Liu, Wanli Ouyang

NeurIPS 2023 BeaverTails: Towards Improved Safety Alignment of LLM via a Human-Preference Dataset Jiaming Ji, Mickel Liu, Josef Dai, Xuehai Pan, Chi Zhang, Ce Bian, Boyuan Chen, Ruiyang Sun, Yizhou Wang, Yaodong Yang

ICLR 2023 Boosting Multiagent Reinforcement Learning via Permutation Invariant and Permutation Equivariant Networks Jianye Hao, Xiaotian Hao, Hangyu Mao, Weixun Wang, Yaodong Yang, Dong Li, Yan Zheng, Zhen Wang

CoRL 2023 Dynamic Handover: Throw and Catch with Bimanual Hands Binghao Huang, Yuanpei Chen, Tianyu Wang, Yuzhe Qin, Yaodong Yang, Nikolay Atanasov, Xiaolong Wang

ICML 2023 GEAR: A GPU-Centric Experience Replay System for Large Reinforcement Learning Models Hanjing Wang, Man-Kit Sit, Congjie He, Ying Wen, Weinan Zhang, Jun Wang, Yaodong Yang, Luo Mai

NeurIPS 2023 Hierarchical Multi-Agent Skill Discovery Mingyu Yang, Yaodong Yang, Zhenbo Lu, Wengang Zhou, Houqiang Li

TMLR 2023 JiangJun: Mastering Xiangqi by Tackling Non-Transitivity in Two-Player Zero-Sum Games Yang Li, Kun Xiong, Yingping Zhang, Jiangcheng Zhu, Stephen Marcus McAleer, Wei Pan, Jun Wang, Zonghong Dai, Yaodong Yang

AAAI 2023 Learning to Shape Rewards Using a Game of Two Partners David Mguni, Taher Jafferjee, Jianhong Wang, Nicolas Perez Nieves, Wenbin Song, Feifei Tong, Matthew E. Taylor, Tianpei Yang, Zipeng Dai, Hui Chen, Jiangcheng Zhu, Kun Shao, Jun Wang, Yaodong Yang

MLOSS 2023 MALib: A Parallel Framework for Population-Based Multi-Agent Reinforcement Learning Ming Zhou, Ziyu Wan, Hanjing Wang, Muning Wen, Runzhe Wu, Ying Wen, Yaodong Yang, Yong Yu, Jun Wang, Weinan Zhang

ICML 2023 MANSA: Learning Fast and Slow in Multi-Agent Systems David Henry Mguni, Haojun Chen, Taher Jafferjee, Jianhong Wang, Longfei Yue, Xidong Feng, Stephen Marcus Mcaleer, Feifei Tong, Jun Wang, Yaodong Yang

MLOSS 2023 MARLlib: A Scalable and Efficient Multi-Agent Reinforcement Learning Library Siyi Hu, Yifan Zhong, Minquan Gao, Weixun Wang, Hao Dong, Xiaodan Liang, Zhihui Li, Xiaojun Chang, Yaodong Yang

NeurIPS 2023 Multi-Agent First Order Constrained Optimization in Policy Space Youpeng Zhao, Yaodong Yang, Zhenbo Lu, Wengang Zhou, Houqiang Li

NeurIPS 2023 Policy Space Diversity for Non-Transitive Games Jian Yao, Weiming Liu, Haobo Fu, Yaodong Yang, Stephen McAleer, Qiang Fu, Wei Yang

ICLR 2023 Quality-Similar Diversity via Population Based Reinforcement Learning Shuang Wu, Jian Yao, Haobo Fu, Ye Tian, Chao Qian, Yaodong Yang, Qiang Fu, Yang Wei

ICML 2023 Regret-Minimizing Double Oracle for Extensive-Form Games Xiaohang Tang, Le Cong Dinh, Stephen Marcus Mcaleer, Yaodong Yang

NeurIPS 2023 Safety Gymnasium: A Unified Safe Reinforcement Learning Benchmark Jiaming Ji, Borong Zhang, Jiayi Zhou, Xuehai Pan, Weidong Huang, Ruiyang Sun, Yiran Geng, Yifan Zhong, Josef Dai, Yaodong Yang

AAAI 2023 Subspace-Aware Exploration for Sparse-Reward Multi-Agent Tasks Pei Xu, Junge Zhang, Qiyue Yin, Chao Yu, Yaodong Yang, Kaiqi Huang

NeurIPS 2023 Team-PSRO for Learning Approximate TMECor in Large Team Games via Cooperative Reinforcement Learning Stephen McAleer, Gabriele Farina, Gaoyue Zhou, Mingzhi Wang, Yaodong Yang, Tuomas Sandholm

MLOSS 2023 TorchOpt: An Efficient Library for Differentiable Optimization Jie Ren, Xidong Feng, Bo Liu, Xuehai Pan, Yao Fu, Luo Mai, Yaodong Yang

ICCV 2023 UniDexGrasp++: Improving Dexterous Grasping Policy Learning via Geometry-Aware Curriculum and Iterative Generalist-Specialist Learning Weikang Wan, Haoran Geng, Yun Liu, Zikang Shan, Yaodong Yang, Li Yi, He Wang

ICLRW 2022 A Game-Theoretic Approach for Improving Generalization Ability of TSP Solvers Chenguang Wang, Yaodong Yang, Oliver Slumbers, Congying Han, Tiande Guo, Haifeng Zhang, Jun Wang

NeurIPS 2022 A Theoretical Understanding of Gradient Bias in Meta-Reinforcement Learning Bo Liu, Xidong Feng, Jie Ren, Luo Mai, Rui Zhu, Haifeng Zhang, Jun Wang, Yaodong Yang

NeurIPS 2022 A Unified Diversity Measure for Multiagent Reinforcement Learning Zongkai Liu, Chao Yu, Yaodong Yang, Peng Sun, Zifan Wu, Yuan Li

NeurIPS 2022 Constrained Update Projection Approach to Safe Policy Optimization Long Yang, Jiaming Ji, Juntao Dai, Linrui Zhang, Binbin Zhou, Pengfei Li, Yaodong Yang, Gang Pan

NeurIPSW 2022 Contextual Transformer for Offline Meta Reinforcement Learning Runji Lin, Ye Li, Xidong Feng, Zhaowei Zhang, Xian Hong Wu Fung, Haifeng Zhang, Jun Wang, Yali Du, Yaodong Yang

ICLR 2022 LIGS: Learnable Intrinsic-Reward Generation Selection for Multi-Agent Learning David Henry Mguni, Taher Jafferjee, Jianhong Wang, Nicolas Perez-Nieves, Oliver Slumbers, Feifei Tong, Yang Li, Jiangcheng Zhu, Yaodong Yang, Jun Wang

NeurIPS 2022 MATE: Benchmarking Multi-Agent Reinforcement Learning in Distributed Target Coverage Control Xuehai Pan, Mickel Liu, Fangwei Zhong, Yaodong Yang, Song-Chun Zhu, Yizhou Wang

NeurIPS 2022 Meta-Reward-Net: Implicitly Differentiable Reward Learning for Preference-Based Reinforcement Learning Runze Liu, Fengshuo Bai, Yali Du, Yaodong Yang

NeurIPS 2022 Multi-Agent Reinforcement Learning Is a Sequence Modeling Problem Muning Wen, Jakub Kuba, Runji Lin, Weinan Zhang, Ying Wen, Jun Wang, Yaodong Yang

IJCAI 2022 On the Convergence of Fictitious Play: A Decomposition Approach Yurong Chen, Xiaotie Deng, Chenchen Li, David Mguni, Jun Wang, Xiang Yan, Yaodong Yang

TMLR 2022 Online Double Oracle Le Cong Dinh, Stephen Marcus McAleer, Zheng Tian, Nicolas Perez-Nieves, Oliver Slumbers, David Henry Mguni, Jun Wang, Haitham Bou Ammar, Yaodong Yang

NeurIPSW 2022 TorchOpt: An Efficient Library for Differentiable Optimization Jie Ren, Xidong Feng, Bo Liu, Xuehai Pan, Yao Fu, Luo Mai, Yaodong Yang

NeurIPS 2022 Towards Human-Level Bimanual Dexterous Manipulation with Reinforcement Learning Yuanpei Chen, Tianhao Wu, Shengjie Wang, Xidong Feng, Jiechuan Jiang, Zongqing Lu, Stephen McAleer, Hao Dong, Song-Chun Zhu, Yaodong Yang

NeurIPS 2022 Transformer-Based Working Memory for Multiagent Reinforcement Learning with Action Parsing Yaodong Yang, Guangyong Chen, Weixun Wang, Xiaotian Hao, Jianye Hao, Pheng-Ann Heng

ICLR 2022 Trust Region Policy Optimisation in Multi-Agent Reinforcement Learning Jakub Grudzien Kuba, Ruiqing Chen, Muning Wen, Ying Wen, Fanglei Sun, Jun Wang, Yaodong Yang

AAAI 2022 What About Inputting Policy in Value Function: Policy Representation and Policy-Extended Value Function Approximator Hongyao Tang, Zhaopeng Meng, Jianye Hao, Chen Chen, Daniel Graves, Dong Li, Changmin Yu, Hangyu Mao, Wulong Liu, Yaodong Yang, Wenyuan Tao, Li Wang

AAAI 2021 Foresee Then Evaluate: Decomposing Value Estimation with Latent Future Prediction Hongyao Tang, Zhaopeng Meng, Guangyong Chen, Pengfei Chen, Chen Chen, Yaodong Yang, Luo Zhang, Wulong Liu, Jianye Hao

ICML 2021 Learning in Nonzero-Sum Stochastic Games with Potentials David H Mguni, Yutong Wu, Yali Du, Yaodong Yang, Ziyi Wang, Minne Li, Ying Wen, Joel Jennings, Jun Wang

ICML 2021 Modelling Behavioural Diversity for Learning in Open-Ended Games Nicolas Perez-Nieves, Yaodong Yang, Oliver Slumbers, David H Mguni, Ying Wen, Jun Wang

NeurIPS 2021 Neural Auto-Curricula in Two-Player Zero-Sum Games Xidong Feng, Oliver Slumbers, Ziyu Wan, Bo Liu, Stephen McAleer, Ying Wen, Jun Wang, Yaodong Yang

NeurIPS 2021 Settling the Variance of Multi-Agent Policy Gradients Jakub Grudzien Kuba, Muning Wen, Linghui Meng, Shangding Gu, Haifeng Zhang, David Mguni, Jun Wang, Yaodong Yang

NeurIPS 2021 Towards Unifying Behavioral and Response Diversity for Open-Ended Learning in Zero-Sum Games Xiangyu Liu, Hangtian Jia, Ying Wen, Yujing Hu, Yingfeng Chen, Changjie Fan, Zhipeng Hu, Yaodong Yang

AAAI 2020 Bi-Level Actor-Critic for Multi-Agent Coordination Haifeng Zhang, Weizhe Chen, Zeren Huang, Minne Li, Yaodong Yang, Weinan Zhang, Jun Wang

IJCAI 2020 Modelling Bounded Rationality in Multi-Agent Interactions by Generalized Recursive Reasoning Ying Wen, Yaodong Yang, Jun Wang

ICML 2020 Multi-Agent Determinantal Q-Learning Yaodong Yang, Ying Wen, Jun Wang, Liheng Chen, Kun Shao, David Mguni, Weinan Zhang

ICML 2020 Q-Value Path Decomposition for Deep Multiagent Reinforcement Learning Yaodong Yang, Jianye Hao, Guangyong Chen, Hongyao Tang, Yingfeng Chen, Yujing Hu, Changjie Fan, Zhongyu Wei

NeurIPS 2020 Replica-Exchange Nos\'e-Hoover Dynamics for Bayesian Learning on Large Datasets Rui Luo, Qiang Zhang, Yaodong Yang, Jun Wang

CoRL 2020 SMARTS: An Open-Source Scalable Multi-Agent RL Training School for Autonomous Driving Ming Zhou, Jun Luo, Julian Villella, Yaodong Yang, David Rusu, Jiayu Miao, Weinan Zhang, Montgomery Alban, Iman Fadakar, Zheng Chen, Chongxi Huang, Ying Wen, Kimia Hassanzadeh, Daniel Graves, Zhengbang Zhu, Yihan Ni, Nhat Nguyen, Mohamed Elsayed, Haitham Ammar, Alexander Cowen-Rivers, Sanjeevan Ahilan, Zheng Tian, Daniel Palenicek, Kasra Rezaee, Peyman Yadmellat, Kun Shao, Dong Chen, Baokuan Zhang, Hongbo Zhang, Jianye Hao, Wulong Liu, Jun Wang

IJCAI 2019 Large-Scale Home Energy Management Using Entropy-Based Collective Multiagent Deep Reinforcement Learning Framework Yaodong Yang, Jianye Hao, Yan Zheng, Chao Yu

ICLR 2019 Probabilistic Recursive Reasoning for Multi-Agent Reinforcement Learning Ying Wen, Yaodong Yang, Rui Luo, Jun Wang, Wei Pan

ICML 2018 Mean Field Multi-Agent Reinforcement Learning Yaodong Yang, Rui Luo, Minne Li, Ming Zhou, Weinan Zhang, Jun Wang

IJCAI 2018 Recurrent Deep Multiagent Q-Learning for Autonomous Brokers in Smart Grid Yaodong Yang, Jianye Hao, Mingyang Sun, Zan Wang, Changjie Fan, Goran Strbac

NeurIPS 2018 Thermostat-Assisted Continuously-Tempered Hamiltonian Monte Carlo for Bayesian Learning Rui Luo, Jianhong Wang, Yaodong Yang, Jun Wang, Zhanxing Zhu