Gu, Pengjie

14 publications

ICML 2025 Cradle: Empowering Foundation Agents Towards General Computer Control Weihao Tan, Wentao Zhang, Xinrun Xu, Haochong Xia, Ziluo Ding, Boyu Li, Bohan Zhou, Junpeng Yue, Jiechuan Jiang, Yewen Li, Ruyi An, Molei Qin, Chuqiao Zong, Longtao Zheng, Yujie Wu, Xiaoqiang Chai, Yifei Bi, Tianbao Xie, Pengjie Gu, Xiyun Li, Ceyao Zhang, Long Tian, Chaojie Wang, Xinrun Wang, Börje F. Karlsson, Bo An, Shuicheng Yan, Zongqing Lu

NeurIPS 2025 Improving Reward Models with Proximal Policy Exploration for Preference-Based Reinforcement Learning Yiwen Zhu, Jinyi Liu, Pengjie Gu, Yifu Yuan, Zhenxing Ge, Wenya Wei, Zhou Fang, Yujing Hu, Bo An

NeurIPS 2025 MTRec: Learning to Align with User Preferences via Mental Reward Models Mengchen Zhao, Yifan Gao, Yaqing Hou, Xiangyang Li, Pengjie Gu, Zhenhua Dong, Ruiming Tang, Yi Cai

NeurIPSW 2024 Cradle: Empowering Foundation Agents Towards General Computer Control Weihao Tan, Wentao Zhang, Xinrun Xu, Haochong Xia, Gang Ding, Boyu Li, Bohan Zhou, Junpeng Yue, Jiechuan Jiang, Yewen Li, Ruyi An, Molei Qin, Chuqiao Zong, Longtao Zheng, YuJie Wu, Xiaoqiang Chai, Yifei Bi, Tianbao Xie, Pengjie Gu, Xiyun Li, Ceyao Zhang, Long Tian, Chaojie Wang, Xinrun Wang, Börje F. Karlsson, Bo An, Shuicheng Yan, Zongqing Lu

CVPR 2024 Improving Unsupervised Hierarchical Representation with Reinforcement Learning Ruyi An, Yewen Li, Xu He, Pengjie Gu, Mengchen Zhao, Dong Li, Jianye Hao, Chaojie Wang, Bo An, Mingyuan Zhou

IJCAI 2024 PoRank: A Practical Framework for Learning to Rank Policies Pengjie Gu, Mengchen Zhao, Xu He, Yi Cai, Bo An

ICML 2024 Resisting Stochastic Risks in Diffusion Planners with the Trajectory Aggregation Tree Lang Feng, Pengjie Gu, Bo An, Gang Pan

ICLR 2024 Solving Homogeneous and Heterogeneous Cooperative Tasks with Greedy Sequential Execution Shanqi Liu, Dong Xing, Pengjie Gu, Xinrun Wang, Bo An, Yong Liu

ICLRW 2024 Towards General Computer Control: A Multimodal Agent for Red Dead Redemption II as a Case Study Weihao Tan, Ziluo Ding, Wentao Zhang, Boyu Li, Bohan Zhou, Junpeng Yue, Haochong Xia, Jiechuan Jiang, Longtao Zheng, Xinrun Xu, Yifei Bi, Pengjie Gu, Xinrun Wang, Börje F. Karlsson, Bo An, Zongqing Lu

ICML 2023 Controlling Type Confounding in Ad Hoc Teamwork with Instance-Wise Teammate Feedback Rectification Dong Xing, Pengjie Gu, Qian Zheng, Xinrun Wang, Shanqi Liu, Longtao Zheng, Bo An, Gang Pan

NeurIPS 2023 Offline RL with Discrete Proxy Representations for Generalizability in POMDPs Pengjie Gu, Xinyu Cai, Dong Xing, Xinrun Wang, Mengchen Zhao, Bo An

ICML 2022 Learning Pseudometric-Based Action Representations for Offline Reinforcement Learning Pengjie Gu, Mengchen Zhao, Chen Chen, Dong Li, Jianye Hao, Bo An

ICLR 2022 Online Ad Hoc Teamwork Under Partial Observability Pengjie Gu, Mengchen Zhao, Jianye Hao, Bo An

IJCAI 2019 STCA: Spatio-Temporal Credit Assignment with Delayed Feedback in Deep Spiking Neural Networks Pengjie Gu, Rong Xiao, Gang Pan, Huajin Tang