Ye, Junjie

17 publications

ICLR 2026 AgentGym-RL: An Open-Source Framework to Train LLM Agents for Long-Horizon Decision Making via Multi-Turn RL Zhiheng Xi, Jixuan Huang, Chenyang Liao, Baodai Huang, Jiaqi Liu, Honglin Guo, Yajie Yang, Rui Zheng, Junjie Ye, Jiazheng Zhang, Wenxiang Chen, Wei He, Yiwen Ding, Guanyu Li, Zehui Chen, Zhengyin Du, Xuesong Yao, Yufei Xu, Jiecao Chen, Tao Gui, Zuxuan Wu, Qi Zhang, Xuanjing Huang, Yu-Gang Jiang

ICLR 2026 Critique-RL: Training Language Models for Critiquing Through Two-Stage Reinforcement Learning Zhiheng Xi, Jixuan Huang, Xin Guo, Boyang Hong, Dingwen Yang, Xiaoran Fan, Shuo Li, Zehui Chen, Junjie Ye, Siyu Yuan, Zhengyin Du, Xuesong Yao, Yufei Xu, Jiecao Chen, Rui Zheng, Tao Gui, Qi Zhang, Xuanjing Huang

AAAI 2025 Alleviating Shifted Distribution in Human Preference Alignment Through Meta-Learning Shihan Dou, Yan Liu, Enyu Zhou, Songyang Gao, Tianlong Li, Limao Xiong, Xin Zhao, Haoxiang Jia, Junjie Ye, Rui Zheng, Tao Gui, Qi Zhang, Xuanjing Huang

ICML 2024 Linear Alignment: A Closed-Form Solution for Aligning Human Preferences Without Tuning and Feedback Songyang Gao, Qiming Ge, Wei Shen, Shihan Dou, Junjie Ye, Xiao Wang, Rui Zheng, Yicheng Zou, Zhi Chen, Hang Yan, Qi Zhang, Dahua Lin

AAAI 2024 OVD-Explorer: Optimism Should Not Be the Sole Pursuit of Exploration in Noisy Environments Jinyi Liu, Zhi Wang, Yan Zheng, Jianye Hao, Chenjia Bai, Junjie Ye, Zhen Wang, Haiyin Piao, Yang Sun

AAAI 2024 PreRoutGNN for Timing Prediction with Order Preserving Partition: Global Circuit Pre-Training, Local Delay Learning and Attentional Cell Modeling Ruizhe Zhong, Junjie Ye, Zhentao Tang, Shixiong Kai, Mingxuan Yuan, Jianye Hao, Junchi Yan

CoRL 2024 RAM: Retrieval-Based Affordance Transfer for Generalizable Zero-Shot Robotic Manipulation Yuxuan Kuang, Junjie Ye, Haoran Geng, Jiageng Mao, Congyue Deng, Leonidas Guibas, He Wang, Yue Wang

NeurIPSW 2023 GPT-Driver: Learning to Drive with GPT Jiageng Mao, Yuxi Qian, Junjie Ye, Hang Zhao, Yue Wang

ICLR 2023 Out-of-Distribution Detection with Implicit Outlier Transformation Qizhou Wang, Junjie Ye, Feng Liu, Quanyu Dai, Marcus Kalander, Tongliang Liu, Jianye Hao, Bo Han

ICCV 2023 PVT++: A Simple End-to-End Latency-Aware Visual Tracking Framework Bowen Li, Ziyuan Huang, Junjie Ye, Yiming Li, Sebastian Scherer, Hang Zhao, Changhong Fu

NeurIPS 2022 The Policy-Gradient Placement and Generative Routing Neural Networks for Chip Design Ruoyu Cheng, Xianglong Lyu, Yang Li, Junjie Ye, Jianye Hao, Junchi Yan

CVPR 2022 Unsupervised Domain Adaptation for Nighttime Aerial Tracking Junjie Ye, Changhong Fu, Guangze Zheng, Danda Pani Paudel, Guang Chen

AAAI 2021 Beyond Class-Conditional Assumption: A Primary Attempt to Combat Instance-Dependent Label Noise Pengfei Chen, Junjie Ye, Guangyong Chen, Jingwei Zhao, Pheng-Ann Heng

ICCV 2021 HiFT: Hierarchical Feature Transformer for Aerial Tracking Ziang Cao, Changhong Fu, Junjie Ye, Bowen Li, Yiming Li

ICLR 2021 Noise Against Noise: Stochastic Label Noise Helps Combat Inherent Label Noise Pengfei Chen, Guangyong Chen, Junjie Ye, Jingwei Zhao, Pheng-Ann Heng

NeurIPSW 2021 OVD-Explorer: A General Information-Theoretic Exploration Approach for Reinforcement Learning Jinyi Liu, Zhi Wang, Yan Zheng, Jianye Hao, Junjie Ye, Chenjia Bai, Pengyi Li

AAAI 2021 Robustness of Accuracy Metric and Its Inspirations in Learning with Noisy Labels Pengfei Chen, Junjie Ye, Guangyong Chen, Jingwei Zhao, Pheng-Ann Heng