Xiong, Wei

45 publications

ICLR 2025 Building Math Agents with Multi-Turn Iterative Preference Learning Wei Xiong, Chengshuai Shi, Jiaming Shen, Aviv Rosenberg, Zhen Qin, Daniele Calandriello, Misha Khalman, Rishabh Joshi, Bilal Piot, Mohammad Saleh, Chi Jin, Tong Zhang, Tianqi Liu

ICCV 2025 DIVE: Taming DINO for Subject-Driven Video Editing Yi Huang, Wei Xiong, He Zhang, Chaoqi Chen, Jianzhuang Liu, Mingfu Yan, Shifeng Chen

ICML 2025 DPO Meets PPO: Reinforced Token Optimization for RLHF Han Zhong, Zikang Shan, Guhao Feng, Wei Xiong, Xinle Cheng, Li Zhao, Di He, Jiang Bian, Liwei Wang

ICML 2025 LLM Alignment as Retriever Optimization: An Information Retrieval Perspective Bowen Jin, Jinsung Yoon, Zhen Qin, Ziqi Wang, Wei Xiong, Yu Meng, Jiawei Han, Sercan O Arik

ICML 2025 Logarithmic Regret for Online KL-Regularized Reinforcement Learning Heyang Zhao, Chenlu Ye, Wei Xiong, Quanquan Gu, Tong Zhang

NeurIPS 2025 MMIG-Bench: Towards Comprehensive and Explainable Evaluation of Multi-Modal Image Generation Models Hang Hua, Ziyun Zeng, Yizhi Song, Yunlong Tang, Liu He, Daniel Aliaga, Wei Xiong, Jiebo Luo

CVPR 2025 MetaShadow: Object-Centered Shadow Detection, Removal, and Synthesis Tianyu Wang, Jianming Zhang, Haitian Zheng, Zhihong Ding, Scott Cohen, Zhe Lin, Wei Xiong, Chi-Wing Fu, Luis Figueroa, Soo Ye Kim

NeurIPS 2025 Optimizing Chain-of-Thought Reasoners via Gradient Variance Minimization in Rejection Sampling and RL Jiarui Yao, Yifan Hao, Hanning Zhang, Hanze Dong, Wei Xiong, Nan Jiang, Tong Zhang

ICLR 2025 RRM: Robust Reward Model Training Mitigates Reward Hacking Tianqi Liu, Wei Xiong, Jie Ren, Lichang Chen, Junru Wu, Rishabh Joshi, Yang Gao, Jiaming Shen, Zhen Qin, Tianhe Yu, Daniel Sohn, Anastasia Makarova, Jeremiah Zhe Liu, Yuan Liu, Bilal Piot, Abe Ittycheriah, Aviral Kumar, Mohammad Saleh

ICLR 2025 Refine-by-Align: Reference-Guided Artifacts Refinement Through Semantic Alignment Yizhi Song, Liu He, Zhifei Zhang, Soo Ye Kim, He Zhang, Wei Xiong, Zhe Lin, Brian L. Price, Scott Cohen, Jianming Zhang, Daniel Aliaga

ICMLW 2024 DPO Meets PPO: Reinforced Token Optimization for RLHF Han Zhong, Guhao Feng, Wei Xiong, Xinle Cheng, Li Zhao, Di He, Jiang Bian, Liwei Wang

AAAI 2024 Earthfarsser: Versatile Spatio-Temporal Dynamical Systems Modeling in One Model Hao Wu, Yuxuan Liang, Wei Xiong, Zhengyang Zhou, Wei Huang, Shilong Wang, Kun Wang

CVPR 2024 IMPRINT: Generative Object Compositing by Learning Identity-Preserving Representation Yizhi Song, Zhifei Zhang, Zhe Lin, Scott Cohen, Brian Price, Jianming Zhang, Soo Ye Kim, He Zhang, Wei Xiong, Daniel Aliaga

CVPR 2024 InstantBooth: Personalized Text-to-Image Generation Without Test-Time Finetuning Jing Shi, Wei Xiong, Zhe Lin, Hyun Joon Jung

ICML 2024 Iterative Preference Learning from Human Feedback: Bridging Theory and Practice for RLHF Under KL-Constraint Wei Xiong, Hanze Dong, Chenlu Ye, Ziqi Wang, Han Zhong, Heng Ji, Nan Jiang, Tong Zhang

NeurIPS 2024 Online Iterative Reinforcement Learning from Human Feedback with General Preference Model Chenlu Ye, Wei Xiong, Yuheng Zhang, Hanze Dong, Nan Jiang, Tong Zhang

TMLR 2024 RLHF Workflow: From Reward Modeling to Online RLHF Hanze Dong, Wei Xiong, Bo Pang, Haoxiang Wang, Han Zhao, Yingbo Zhou, Nan Jiang, Doyen Sahoo, Caiming Xiong, Tong Zhang

CVPR 2024 Relightful Harmonization: Lighting-Aware Portrait Background Replacement Mengwei Ren, Wei Xiong, Jae Shin Yoon, Zhixin Shu, Jianming Zhang, HyunJoon Jung, Guido Gerig, He Zhang

ECCV 2024 Strengthening Multimodal Large Language Model with Bootstrapped Preference Optimization Renjie Pi, Tianyang Han, Wei Xiong, Jipeng Zhang, Runtao Liu, Rui Pan, Tong Zhang

ECCV 2024 SwapAnything: Enabling Arbitrary Object Swapping in Personalized Image Editing Jing Gu, Nanxuan Zhao, Wei Xiong, Qing Liu, Zhifei Zhang, He Zhang, Jianming Zhang, HyunJoon Jung, Yilin Wang, Xin Eric Wang

ECCV 2024 WAS: Dataset and Methods for Artistic Text Segmentation Xudong Xie, Yuzhe Li, Yang Liu, Zhifei Zhang, Zhaowen Wang, Wei Xiong, Xiang Bai

ICML 2023 Corruption-Robust Algorithms with Uncertainty Weighting for Nonlinear Contextual Bandits and Markov Decision Processes Chenlu Ye, Wei Xiong, Quanquan Gu, Tong Zhang

CVPRW 2023 LFNAT 2023 Challenge on Light Field Depth Estimation: Methods and Results Hao Sheng, Yebin Liu, Jingyi Yu, Gaochang Wu, Wei Xiong, Ruixuan Cong, Rongshan Chen, Longzhao Guo, Yanlin Xie, Shuo Zhang, Song Chang, Youfang Lin, Wentao Chao, Xuechun Wang, Guanghui Wang, Fuqing Duan, Tun Wang, Da Yang, Zhenglong Cui, Sizhe Wang, Mingyuan Zhao, Qiong Wang, Qianyu Chen, Zhengyu Liang, Yingqian Wang, Jungang Yang, Xueting Yang, Junli Deng

NeurIPS 2023 Maximize to Explore: One Objective Function Fusing Estimation, Planning, and Exploration Zhihan Liu, Miao Lu, Wei Xiong, Han Zhong, Hao Hu, Shenao Zhang, Sirui Zheng, Zhuoran Yang, Zhaoran Wang

ICLR 2023 Nearly Minimax Optimal Offline Reinforcement Learning with Linear Function Approximation: Single-Agent MDP and Markov Game Wei Xiong, Han Zhong, Chengshuai Shi, Cong Shen, Liwei Wang, Tong Zhang

NeurIPS 2023 PHOTOSWAP: Personalized Subject Swapping in Images Jing Gu, Yilin Wang, Nanxuan Zhao, Tsu-Jui Fu, Wei Xiong, Qing Liu, Zhifei Zhang, He Zhang, Jianming Zhang, HyunJoon Jung, Xin Eric Wang

ICML 2023 Provably Efficient Offline Reinforcement Learning with Perturbed Data Sources Chengshuai Shi, Wei Xiong, Cong Shen, Jing Yang

TMLR 2023 RAFT: Reward rAnked FineTuning for Generative Foundation Model Alignment Hanze Dong, Wei Xiong, Deepanshu Goyal, Yihan Zhang, Winnie Chow, Rui Pan, Shizhe Diao, Jipeng Zhang, KaShun Shum, Tong Zhang

ICML 2022 A Self-Play Posterior Sampling Algorithm for Zero-Sum Markov Games Wei Xiong, Han Zhong, Chengshuai Shi, Cong Shen, Tong Zhang

ICLRW 2022 A Self-Play Posterior Sampling Algorithm for Zero-Sum Markov Games Wei Xiong, Han Zhong, Chengshuai Shi, Cong Shen, Tong Zhang

CVPRW 2022 NTIRE 2022 Challenge on Efficient Super-Resolution: Methods and Results Yawei Li, Kai Zhang, Radu Timofte, Luc Van Gool, Fangyuan Kong, Mingxi Li, Songwei Liu, Zongcai Du, Ding Liu, Chenhui Zhou, Jingyi Chen, Qingrui Han, Zheyuan Li, Yingqi Liu, Xiangyu Chen, Haoming Cai, Yu Qiao, Chao Dong, Long Sun, Jinshan Pan, Yi Zhu, Zhikai Zong, Xiaoxiao Liu, Zheng Hui, Tao Yang, Peiran Ren, Xuansong Xie, Xian-Sheng Hua, Yanbo Wang, Xiaozhong Ji, Chuming Lin, Donghao Luo, Ying Tai, Chengjie Wang, Zhizhong Zhang, Yuan Xie, Shen Cheng, Ziwei Luo, Lei Yu, Zhihong Wen, Qi Wu, Youwei Li, Haoqiang Fan, Jian Sun, Shuaicheng Liu, Yuanfei Huang, Meiguang Jin, Hua Huang, Jing Liu, Xinjian Zhang, Yan Wang, Lingshun Long, Gen Li, Yuanfan Zhang, Zuowei Cao, Lei Sun, Panaetov Alexander, Yucong Wang, Minjie Cai, Li Wang, Lu Tian, Zheyuan Wang, Hongbing Ma, Jie Liu, Chao Chen, Yidong Cai, Jie Tang, Gangshan Wu, Weiran Wang, Shirui Huang, Honglei Lu, Huan Liu, Keyan Wang, Jun Chen, Shi Chen, Yuchun Miao, Zimo Huang, Lefei Zhang, Mustafa Ayazoglu, Wei Xiong, Chengyi Xiong, Fei Wang, Hao Li, Ruimian Wen, Zhijing Yang, Wenbin Zou, Weixin Zheng, Tian Ye, Yuncheng Zhang, Xiangzhen Kong, Aditya Arora, Syed Waqas Zamir, Salman H. Khan, Munawar Hayat, Fahad Shahbaz Khan, Dandan Gao, Dengwen Zhou, Qian Ning, Jingzhu Tang, Han Huang, Yufei Wang, Zhangheng Peng, Haobo Li, Wenxue Guan, Shenghua Gong, Xin Li, Jun Liu, Wanjun Wang, Kun Zeng, Hanjiang Lin, Xinyu Chen, Jinsheng Fang

ICML 2022 Pessimistic Minimax Value Iteration: Provably Efficient Equilibrium Learning from Offline Datasets Han Zhong, Wei Xiong, Jiyuan Tan, Liwei Wang, Tong Zhang, Zhaoran Wang, Zhuoran Yang

ICLRW 2022 Pessimistic Minimax Value Iteration: Provably Efficient Equilibrium Learning from Offline Datasets Han Zhong, Wei Xiong, Jiyuan Tan, Liwei Wang, Tong Zhang, Zhaoran Wang, Zhuoran Yang

NeurIPS 2021 (Almost) Free Incentivized Exploration from Decentralized Learning Agents Chengshuai Shi, Haifeng Xu, Wei Xiong, Cong Shen

NeurIPS 2021 Distributional Reinforcement Learning for Multi-Dimensional Reward Functions Pushi Zhang, Xiaoyu Chen, Li Zhao, Wei Xiong, Tao Qin, Tie-Yan Liu

NeurIPS 2021 Heterogeneous Multi-Player Multi-Armed Bandits: Closing the Gap and Generalization Chengshuai Shi, Wei Xiong, Cong Shen, Jing Yang

AISTATS 2020 Decentralized Multi-Player Multi-Armed Bandits with No Collision Information Chengshuai Shi, Wei Xiong, Cong Shen, Jing Yang

ECCV 2020 Example-Guided Image Synthesis Using Masked Spatial-Channel Attention and Self-Supervision Haitian Zheng, Haofu Liao, Lele Chen, Wei Xiong, Tianlang Chen, Jiebo Luo

ECCV 2018 Focus, Segment and Erase: An Efficient Network for Multi-Label Brain Tumor Segmentation Xuan Chen, Jun Hao Liew, Wei Xiong, Chee-Kong Chui, Sim-Heng Ong

ICCV 2017 Regional Interactive Image Segmentation Networks Jun Hao Liew, Yunchao Wei, Wei Xiong, Sim-Heng Ong, Jiashi Feng

ECCV 2016 From On-Road to Off: Transfer Learning Within a Deep Convolutional Neural Network for Segmentation and Classification of Off-Road Scenes Christopher J. Holder, Toby P. Breckon, Wei Xiong

ECCVW 2016 From On-Road to Off: Transfer Learning Within a Deep Convolutional Neural Network for Segmentation and Classification of Off-Road Scenes Christopher J. Holder, Toby P. Breckon, Wei Xiong

ICCV 2007 Moving Object Extraction with a Hand-Held Camera Guofeng Zhang, Jiaya Jia, Wei Xiong, Tien-Tsin Wong, Pheng-Ann Heng, Hujun Bao

ICCV 2007 Rotational Motion Deblurring of a Rigid Object from a Single Image Qi Shan, Wei Xiong, Jiaya Jia

CVPR 2007 Stereo Matching on Objects with Fractional Boundary Wei Xiong, Jiaya Jia