Liu, Shunyu

19 publications

AAAI 2025 Agent-Aware Training for Agent-Agnostic Action Advising in Deep Reinforcement Learning Yaoquan Wei, Shunyu Liu, Jie Song, Tongya Zheng, Kaixuan Chen, Mingli Song

IJCAI 2025 CADP: Towards Better Centralized Learning for Decentralized Execution in MARL Yihe Zhou, Shunyu Liu, Yunpeng Qing, Tongya Zheng, Kaixuan Chen, Jie Song, Mingli Song

NeurIPS 2025 Consistent Paths Lead to Truth: Self-Rewarding Reinforcement Learning for LLM Reasoning Kongcheng Zhang, Qi Yao, Shunyu Liu, Yingjie Wang, Baisheng Lai, Jieping Ye, Mingli Song, Dacheng Tao

AAAI 2025 Cooperative Policy Agreement: Learning Diverse Policy for Offline MARL Yihe Zhou, Yuxuan Zheng, Yue Hu, Kaixuan Chen, Tongya Zheng, Jie Song, Mingli Song, Shunyu Liu

AAAI 2025 Disentangled Table-Graph Representation for Interpretable Transmission Line Fault Location Na Yu, Yutong Deng, Shunyu Liu, Kaixuan Chen, Tongya Zheng, Mingli Song

ICLR 2025 From GNNs to Trees: Multi-Granular Interpretability for Graph Neural Networks Jie Yang, Yuwen Wang, Kaixuan Chen, Tongya Zheng, Yihe Zhou, Zhenbang Xiao, Ji Cao, Mingli Song, Shunyu Liu

AAAI 2025 Holistic Semantic Representation for Navigational Trajectory Generation Ji Cao, Tongya Zheng, Qinghong Guo, Yu Wang, Junshu Dai, Shunyu Liu, Jie Yang, Jie Song, Mingli Song

NeurIPS 2025 Mulberry: Empowering MLLM with O1-like Reasoning and Reflection via Collective Monte Carlo Tree Search Huanjin Yao, Jiaxing Huang, Wenhao Wu, Jingyi Zhang, Yibo Wang, Shunyu Liu, Yingjie Wang, YuXin Song, Haocheng Feng, Li Shen, Dacheng Tao

IJCAI 2025 Odyssey : Empowering Minecraft Agents with Open-World Skills Shunyu Liu, Yaoru Li, Kongcheng Zhang, Zhenyu Cui, Wenkai Fang, Yuxuan Zheng, Tongya Zheng, Mingli Song

ICCV 2025 R1-VL: Learning to Reason with Multimodal Large Language Models via Step-Wise Group Relative Policy Optimization Jingyi Zhang, Jiaxing Huang, Huanjin Yao, Shunyu Liu, Xikun Zhang, Shijian Lu, Dacheng Tao

NeurIPS 2025 SPAZER: Spatial-Semantic Progressive Reasoning Agent for Zero-Shot 3D Visual Grounding Zhao Jin, Rong-Cheng Tu, Jingyi Liao, Wenhao Sun, Xiao Luo, Shunyu Liu, Dacheng Tao

NeurIPS 2025 SeRL: Self-Play Reinforcement Learning for Large Language Models with Limited Data Wenkai Fang, Shunyu Liu, Yang Zhou, Kongcheng Zhang, Tongya Zheng, Kaixuan Chen, Mingli Song, Dacheng Tao

NeurIPS 2025 Tree of Preferences for Diversified Recommendation Hanyang Yuan, Ning Tang, Tongya Zheng, Jiarong Xu, Xintong Hu, Renhong Huang, Shunyu Liu, Jiacong Hu, Jiawei Chen, Mingli Song

NeurIPS 2025 VORTA: Efficient Video Diffusion via Routing Sparse Attention Wenhao Sun, Rong-Cheng Tu, Yifu Ding, Jingyi Liao, Zhao Jin, Shunyu Liu, Dacheng Tao

NeurIPS 2024 A2PO: Towards Effective Offline Reinforcement Learning from an Advantage-Aware Perspective Yunpeng Qing, Shunyu Liu, Jingyuan Cong, Kaixuan Chen, Yihe Zhou, Mingli Song

IJCAI 2024 Improving Adversarial Robustness via Feature Pattern Consistency Constraint Jiacong Hu, Jingwen Ye, Zunlei Feng, Jiazhen Yang, Shunyu Liu, Xiaotian Yu, Lingxiang Jia, Mingli Song

ECML-PKDD 2024 Simple Graph Condensation Zhenbang Xiao, Yu Wang, Shunyu Liu, Huiqiong Wang, Mingli Song, Tongya Zheng

AAAI 2023 Contrastive Identity-Aware Learning for Multi-Agent Value Decomposition Shunyu Liu, Yihe Zhou, Jie Song, Tongya Zheng, Kaixuan Chen, Tongtian Zhu, Zunlei Feng, Mingli Song

NeurIPS 2023 Lookaround Optimizer: $k$ Steps Around, 1 Step Average Jiangtao Zhang, Shunyu Liu, Jie Song, Tongtian Zhu, Zhengqi Xu, Mingli Song