Zhang, Weitong

26 publications

ICLR 2025 Anyprefer: An Agentic Framework for Preference Data Synthesis Yiyang Zhou, Zhaoyang Wang, Tianle Wang, Shangyu Xing, Peng Xia, Bo Li, Kaiyuan Zheng, Zijian Zhang, Zhaorun Chen, Wenhao Zheng, Xuchao Zhang, Chetan Bansal, Weitong Zhang, Ying Wei, Mohit Bansal, Huaxiu Yao

ICLRW 2025 BiD: Behavioral Agents in Dynamic Auctions Weitong Zhang, Chengqi Zang, Mark Schmidt, Richard Blythman

ICLR 2025 CREAM: Consistency Regularized Self-Rewarding Language Models Zhaoyang Wang, Weilei He, Zhiyuan Liang, Xuchao Zhang, Chetan Bansal, Ying Wei, Weitong Zhang, Huaxiu Yao

ICLR 2025 Energy-Weighted Flow Matching for Offline Reinforcement Learning Shiyuan Zhang, Weitong Zhang, Quanquan Gu

NeurIPS 2025 From Self-Check to Consensus: Bayesian Strategic Decoding in Large Language Models Weitong Zhang, Chengqi Zang, Bernhard Kainz

CVPR 2025 Image Generation Diversity Issues and How to Tame Them Mischa Dombrowski, Weitong Zhang, Sarah Cechnicka, Hadrien Reynaud, Bernhard Kainz

ICML 2025 Mitigating Object Hallucination in Large Vision-Language Models via Image-Grounded Guidance Linxi Zhao, Yihe Deng, Weitong Zhang, Quanquan Gu

ICLRW 2025 Strategic LLM Decoding Through Bayesian Games Weitong Zhang, Chengqi Zang, Bernhard Kainz

NeurIPS 2024 Achieving Constant Regret in Linear Markov Decision Processes Weitong Zhang, Zhiyuan Fan, Jiafan He, Quanquan Gu

NeurIPSW 2024 AnyPrefer: An Automatic Framework for Preference Data Synthesis Yiyang Zhou, Zhaoyang Wang, Tianle Wang, Shangyu Xing, Peng Xia, Bo Li, Kaiyuan Zheng, Zijian Zhang, Zhaorun Chen, Wenhao Zheng, Xuchao Zhang, Chetan Bansal, Weitong Zhang, Ying Wei, Mohit Bansal, Huaxiu Yao

NeurIPSW 2024 CITER: Collaborative Inference for Efficient Large Language Model Decoding with Token-Level Routing Wenhao Zheng, Yixiao Chen, Weitong Zhang, Souvik Kundu, Yun Li, Zhengzhong Liu, Eric P. Xing, Hongyi Wang, Huaxiu Yao

NeurIPSW 2024 Cream: Consistency Regularized Self-Rewarding Language Models Zhaoyang Wang, Weilei He, Zhiyuan Liang, Xuchao Zhang, Chetan Bansal, Ying Wei, Weitong Zhang, Huaxiu Yao

ECCVW 2024 Data-Efficient Generation for Dataset Distillation Zhe Li, Weitong Zhang, Sarah Cechnicka, Bernhard Kainz

ICLR 2024 Horizon-Free Reinforcement Learning in Adversarial Linear Mixture MDPs Kaixuan Ji, Qingyue Zhao, Jiafan He, Weitong Zhang, Quanquan Gu

NeurIPSW 2024 Mitigating Object Hallucination in Large Vision-Language Models via Image-Grounded Guidance Linxi Zhao, Yihe Deng, Weitong Zhang, Quanquan Gu

NeurIPS 2024 Stability and Generalizability in SDE Diffusion Models with Measure-Preserving Dynamics Weitong Zhang, Chengqi Zang, Liu Li, Sarah Cechnicka, Cheng Ouyang, Bernhard Kainz

ICML 2024 Uncertainty-Aware Reward-Free Exploration with General Function Approximation Junkai Zhang, Weitong Zhang, Dongruo Zhou, Quanquan Gu

NeurIPSW 2023 Causal Graph ODE: Continuous Treatment Effect Modeling in Multi-Agent Dynamical Systems Zijie Huang, Jeehyun Hwang, Junkai Zhang, Jinwoo Baik, Weitong Zhang, Dominik Wodarz, Yizhou Sun, Quanquan Gu, Wei Wang

ICMLW 2023 DiffMol: 3D Structured Molecule Generation with Discrete Denoising Diffusion Probabilistic Models Weitong Zhang, Xiaoyun Wang, Justin Smith, Joe Eaton, Brad Rees, Quanquan Gu

NeurIPSW 2023 MoleculeGPT: Instruction Following Large Language Models for Molecular Property Prediction Weitong Zhang, Xiaoyun Wang, Weili Nie, Joe Eaton, Brad Rees, Quanquan Gu

ICML 2023 On the Interplay Between Misspecification and Sub-Optimality Gap in Linear Contextual Bandits Weitong Zhang, Jiafan He, Zhiyuan Fan, Quanquan Gu

ICML 2023 Optimal Horizon-Free Reward-Free Exploration for Linear Mixture MDPs Junkai Zhang, Weitong Zhang, Quanquan Gu

ICLR 2022 Learning Neural Contextual Bandits Through Perturbed Rewards Yiling Jia, Weitong Zhang, Dongruo Zhou, Quanquan Gu, Hongning Wang

ICLR 2021 Neural Thompson Sampling Weitong Zhang, Dongruo Zhou, Lihong Li, Quanquan Gu

NeurIPS 2021 Reward-Free Model-Based Reinforcement Learning with Linear Function Approximation Weitong Zhang, Dongruo Zhou, Quanquan Gu

NeurIPS 2020 A Finite-Time Analysis of Two Time-Scale Actor-Critic Methods Yue Frank Wu, Weitong Zhang, Pan Xu, Quanquan Gu