Wang, Zhaoran

143 publications

ICML 2025 An Instrumental Value for Data Production and Its Application to Data Pricing Rui Ai, Boxiang Lyu, Zhaoran Wang, Zhuoran Yang, Haifeng Xu

ICLR 2025 Are Transformers Able to Reason by Connecting Separated Knowledge in Training Data? Yutong Yin, Zhaoran Wang

ICML 2025 BRiTE: Bootstrapping Reinforced Thinking Process to Enhance Language Model Reasoning Han Zhong, Yutong Yin, Shenao Zhang, Xiaojun Xu, Yuanxin Liu, Yifei Zuo, Zhihan Liu, Boyi Liu, Sirui Zheng, Hongyi Guo, Liwei Wang, Mingyi Hong, Zhaoran Wang

ICML 2025 Reward-Augmented Data Enhances Direct Preference Alignment of LLMs Shenao Zhang, Zhihan Liu, Boyi Liu, Yufeng Zhang, Yingxiang Yang, Yongfei Liu, Liyu Chen, Tao Sun, Zhaoran Wang

ICLRW 2025 Reward-Augmented Data Enhances Direct Preference Alignment of LLMs Shenao Zhang, Zhihan Liu, Boyi Liu, Yufeng Zhang, Yingxiang Yang, Yongfei Liu, Liyu Chen, Tao Sun, Zhaoran Wang

TMLR 2025 Self-Exploring Language Models: Active Preference Elicitation for Online Alignment Shenao Zhang, Donghan Yu, Hiteshi Sharma, Han Zhong, Zhihan Liu, Ziyi Yang, Shuohang Wang, Hany Hassan Awadalla, Zhaoran Wang

ICML 2025 The Sample Complexity of Online Strategic Decision Making with Information Asymmetry and Knowledge Transportability Jiachen Hu, Rui Ai, Han Zhong, Xiaoyu Chen, Liwei Wang, Zhaoran Wang, Zhuoran Yang

AISTATS 2025 What and How Does In-Context Learning Learn? Bayesian Model Averaging, Parameterization, and Generalization Yufeng Zhang, Fengzhuo Zhang, Zhuoran Yang, Zhaoran Wang

ICML 2024 A General Framework for Sequential Decision-Making Under Adaptivity Constraints Nuoya Xiong, Zhaoran Wang, Zhuoran Yang

ICML 2024 Adaptive-Gradient Policy Optimization: Enhancing Policy Learning in Non-Smooth Differentiable Simulations Feng Gao, Liangzhi Shi, Shenao Zhang, Zhaoran Wang, Yi Wu

MLJ 2024 Dynamic Datasets and Market Environments for Financial Reinforcement Learning Xiao-Yang Liu, Ziyi Xia, Hongyang Yang, Jiechao Gao, Daochen Zha, Ming Zhu, Christina Dan Wang, Zhaoran Wang, Jian Guo

ICLRW 2024 Empowering Autonomous Driving with Large Language Models: A Safety Perspective Yixuan Wang, Ruochen Jiao, Simon Sinong Zhan, Chengtian Lang, Chao Huang, Zhaoran Wang, Zhuoran Yang, Qi Zhu

ICML 2024 How Does Goal Relabeling Improve Sample Efficiency? Sirui Zheng, Chenjia Bai, Zhuoran Yang, Zhaoran Wang

JMLR 2024 Instrumental Variable Value Iteration for Causal Offline Reinforcement Learning Luofeng Liao, Zuyue Fu, Zhuoran Yang, Yixin Wang, Dingli Ma, Mladen Kolar, Zhaoran Wang

JMLR 2024 Learning Dynamic Mechanisms in Unknown Environments: A Reinforcement Learning Approach Shuang Qiu, Boxiang Lyu, Qinglin Meng, Zhaoran Wang, Zhuoran Yang, Michael I. Jordan

JMLR 2024 Learning Regularized Graphon Mean-Field Games with Unknown Graphons Fengzhuo Zhang, Vincent Y. F. Tan, Zhaoran Wang, Zhuoran Yang

ICLR 2024 Let Models Speak Ciphers: Multiagent Debate Through Embeddings Chau Pham, Boyi Liu, Yingxiang Yang, Zhengyu Chen, Tianyi Liu, Jianbo Yuan, Bryan A. Plummer, Zhaoran Wang, Hongxia Yang

NeurIPS 2024 Provably Mitigating Overoptimization in RLHF: Your SFT Loss Is Implicitly an Adversarial Regularizer Zhihan Liu, Miao Lu, Shenao Zhang, Boyi Liu, Hongyi Guo, Yingxiang Yang, Jose Blanchet, Zhaoran Wang

ICMLW 2024 Provably Mitigating Overoptimization in RLHF: Your SFT Loss Is Implicitly an Adversarial Regularizer Zhihan Liu, Miao Lu, Shenao Zhang, Boyi Liu, Hongyi Guo, Yingxiang Yang, Jose Blanchet, Zhaoran Wang

ICML 2024 Reason for Future, Act for Now: A Principled Architecture for Autonomous LLM Agents Zhihan Liu, Hao Hu, Shenao Zhang, Hongyi Guo, Shuqi Ke, Boyi Liu, Zhaoran Wang

ICLR 2024 Sample-Efficient Multi-Agent RL: An Optimization Perspective Nuoya Xiong, Zhihan Liu, Zhaoran Wang, Zhuoran Yang

ICMLW 2024 Self-Exploring Language Models: Active Preference Elicitation for Online Alignment Shenao Zhang, Donghan Yu, Hiteshi Sharma, Ziyi Yang, Shuohang Wang, Hany Hassan Awadalla, Zhaoran Wang

ICML 2023 Achieving Hierarchy-Free Approximation for Bilevel Programs with Equilibrium Constraints Jiayang Li, Jing Yu, Boyi Liu, Yu Nie, Zhaoran Wang

ICML 2023 Adaptive Barrier Smoothing for First-Order Policy Gradient with Contact Dynamics Shenao Zhang, Wanxin Jin, Zhaoran Wang

JMLR 2023 Can Reinforcement Learning Find Stackelberg-Nash Equilibria in General-Sum Markov Games with Myopically Rational Followers? Han Zhong, Zhuoran Yang, Zhaoran Wang, Michael I. Jordan

JMLR 2023 Double Duality: Variational Primal-Dual Policy Optimization for Constrained Reinforcement Learning Zihao Li, Boyi Liu, Zhuoran Yang, Zhaoran Wang, Mengdi Wang

ICML 2023 Enforcing Hard Constraints with Soft Barriers: Safe Reinforcement Learning in Unknown Stochastic Environments Yixuan Wang, Simon Sinong Zhan, Ruochen Jiao, Zhilu Wang, Wanxin Jin, Zhuoran Yang, Zhaoran Wang, Chao Huang, Qi Zhu

AISTATS 2023 Finding Regularized Competitive Equilibria of Heterogeneous Agent Macroeconomic Models via Reinforcement Learning Ruitu Xu, Yifei Min, Tianhao Wang, Michael I. Jordan, Zhaoran Wang, Zhuoran Yang

ICLR 2023 Latent Variable Representation for Reinforcement Learning Tongzheng Ren, Chenjun Xiao, Tianjun Zhang, Na Li, Zhaoran Wang, Sujay Sanghavi, Dale Schuurmans, Bo Dai

NeurIPS 2023 Learning Regularized Monotone Graphon Mean-Field Games Fengzhuo Zhang, Vincent Tan, Zhaoran Wang, Zhuoran Yang

ICML 2023 Local Optimization Achieves Global Optimality in Multi-Agent Reinforcement Learning Yulai Zhao, Zhuoran Yang, Zhaoran Wang, Jason D. Lee

NeurIPS 2023 Maximize to Explore: One Objective Function Fusing Estimation, Planning, and Exploration Zhihan Liu, Miao Lu, Wei Xiong, Han Zhong, Hao Hu, Shenao Zhang, Sirui Zheng, Zhuoran Yang, Zhaoran Wang

NeurIPS 2023 Model-Based Reparameterization Policy Gradient Methods: Theory and Practical Algorithms Shenao Zhang, Boyi Liu, Zhaoran Wang, Tuo Zhao

ICLR 2023 Offline RL with No OOD Actions: In-Sample Learning via Implicit Value Regularization Haoran Xu, Li Jiang, Jianxiong Li, Zhuoran Yang, Zhaoran Wang, Victor Wai Kin Chan, Xianyuan Zhan

ICLR 2023 Optimistic Exploration with Learned Features Provably Solves Markov Decision Processes with Neural Dynamics Sirui Zheng, Lingxiao Wang, Shuang Qiu, Zuyue Fu, Zhuoran Yang, Csaba Szepesvari, Zhaoran Wang

ICLR 2023 Pessimism in the Face of Confounders: Provably Efficient Offline Reinforcement Learning in Partially Observable Markov Decision Processes Miao Lu, Yifei Min, Zhaoran Wang, Zhuoran Yang

NeurIPS 2023 Posterior Sampling for Competitive RL: Function Approximation and Partial Observation Shuang Qiu, Ziyu Dai, Han Zhong, Zhaoran Wang, Zhuoran Yang, Tong Zhang

L4DC 2023 Provably Efficient Generalized Lagrangian Policy Optimization for Safe Multi-Agent Reinforcement Learning Dongsheng Ding, Xiaohan Wei, Zhuoran Yang, Zhaoran Wang, Mihailo Jovanovic

NeurIPSW 2023 Reason for Future, Act for Now: A Principled Architecture for Autonomous LLM Agents Zhihan Liu, Hao Hu, Shenao Zhang, Hongyi Guo, Shuqi Ke, Boyi Liu, Zhaoran Wang

ICLR 2023 Represent to Control Partially Observed Systems: Representation Learning with Provable Sample Efficiency Lingxiao Wang, Qi Cai, Zhuoran Yang, Zhaoran Wang

AISTATS 2022 Gap-Dependent Bounds for Two-Player Markov Games Zehao Dou, Zhuoran Yang, Zhaoran Wang, Simon Du

NeurIPS 2022 A Unifying Framework of Off-Policy General Value Function Evaluation Tengyu Xu, Zhuoran Yang, Zhaoran Wang, Yingbin Liang

ICML 2022 Adaptive Model Design for Markov Decision Process Siyu Chen, Donglin Yang, Jiayang Li, Senmiao Wang, Zhuoran Yang, Zhaoran Wang

ICLRW 2022 Can Reinforcement Learning Efficiently Find Stackelberg-Nash Equilibria in General-Sum Markov Games with Myopic Followers？ Han Zhong, Zhuoran Yang, Zhaoran Wang, Michael Jordan

ICML 2022 Contrastive UCB: Provably Efficient Contrastive Self-Supervised Learning in Online Reinforcement Learning Shuang Qiu, Lingxiao Wang, Chenjia Bai, Zhuoran Yang, Zhaoran Wang

NeurIPS 2022 Exponential Family Model-Based Reinforcement Learning via Score Matching Gene Li, Junbo Li, Anmol Kabra, Nati Srebro, Zhaoran Wang, Zhuoran Yang

NeurIPS 2022 FinRL-Meta: Market Environments and Benchmarks for Data-Driven Financial Reinforcement Learning Xiao-Yang Liu, Ziyi Xia, Jingyang Rui, Jiechao Gao, Hongyang Yang, Ming Zhu, Christina Wang, Zhaoran Wang, Jian Guo

ICML 2022 Human-in-the-Loop: Provably Efficient Preference-Based Reinforcement Learning with General Function Approximation Xiaoyu Chen, Han Zhong, Zhuoran Yang, Zhaoran Wang, Liwei Wang

NeurIPS 2022 Inducing Equilibria via Incentives: Simultaneous Design-and-Play Ensures Global Convergence Boyi Liu, Jiayang Li, Zhuoran Yang, Hoi-To Wai, Mingyi Hong, Yu Nie, Zhaoran Wang

NeurIPS 2022 Learn to Match with No Regret: Reinforcement Learning in Markov Matching Markets Yifei Min, Tianhao Wang, Ruitu Xu, Zhaoran Wang, Michael I. Jordan, Zhuoran Yang

ICML 2022 Learning from Demonstration: Provably Efficient Adversarial Policy Imitation with Linear Function Approximation Zhihan Liu, Yufeng Zhang, Zuyue Fu, Zhuoran Yang, Zhaoran Wang

ICML 2022 Pessimism Meets VCG: Learning Dynamic Mechanism Design via Offline Reinforcement Learning Boxiang Lyu, Zhaoran Wang, Mladen Kolar, Zhuoran Yang

ICLR 2022 Pessimistic Bootstrapping for Uncertainty-Driven Offline Reinforcement Learning Chenjia Bai, Lingxiao Wang, Zhuoran Yang, Zhi-Hong Deng, Animesh Garg, Peng Liu, Zhaoran Wang

ICML 2022 Pessimistic Minimax Value Iteration: Provably Efficient Equilibrium Learning from Offline Datasets Han Zhong, Wei Xiong, Jiyuan Tan, Liwei Wang, Tong Zhang, Zhaoran Wang, Zhuoran Yang

ICLRW 2022 Pessimistic Minimax Value Iteration: Provably Efficient Equilibrium Learning from Offline Datasets Han Zhong, Wei Xiong, Jiyuan Tan, Liwei Wang, Tong Zhang, Zhaoran Wang, Zhuoran Yang

ICML 2022 Provably Efficient Offline Reinforcement Learning for Partially Observable Markov Decision Processes Hongyi Guo, Qi Cai, Yufeng Zhang, Zhuoran Yang, Zhaoran Wang

NeurIPS 2022 RORL: Robust Offline Reinforcement Learning via Conservative Smoothing Rui Yang, Chenjia Bai, Xiaoteng Ma, Zhaoran Wang, Chongjie Zhang, Lei Han

ICML 2022 Reinforcement Learning from Partial Observation: Linear Function Approximation with Provable Sample Efficiency Qi Cai, Zhuoran Yang, Zhaoran Wang

NeurIPS 2022 Relational Reasoning via Set Transformers: Provable Efficiency and Applications to MARL Fengzhuo Zhang, Boyi Liu, Kaixin Wang, Vincent Tan, Zhuoran Yang, Zhaoran Wang

NeurIPSW 2022 Sparse Q-Learning: Offline Reinforcement Learning with Implicit Value Regularization Haoran Xu, Li Jiang, Jianxiong Li, Zhuoran Yang, Zhaoran Wang, Xianyuan Zhan

ICLR 2022 Towards General Function Approximation in Zero-Sum Markov Games Baihe Huang, Jason D. Lee, Zhaoran Wang, Zhuoran Yang

ICML 2022 Welfare Maximization in Competitive Equilibrium: Reinforcement Learning for Markov Exchange Economy Zhihan Liu, Miao Lu, Zhaoran Wang, Michael Jordan, Zhuoran Yang

AISTATS 2021 Provably Efficient Safe Exploration via Primal-Dual Policy Optimization Dongsheng Ding, Xiaohan Wei, Zhuoran Yang, Zhaoran Wang, Mihailo Jovanovic

AISTATS 2021 Provably Eﬃcient Actor-Critic for Risk-Sensitive and Robust Adversarial RL: A Linear-Quadratic Case Yufeng Zhang, Zhuoran Yang, Zhaoran Wang

AISTATS 2021 Sample Elicitation Jiaheng Wei, Zuyue Fu, Yang Liu, Xingyu Li, Zhuoran Yang, Zhaoran Wang

NeurIPS 2021 A Near-Optimal Algorithm for Stochastic Bilevel Optimization via Double-Momentum Prashant Khanduri, Siliang Zeng, Mingyi Hong, Hoi-To Wai, Zhaoran Wang, Zhuoran Yang

NeurIPS 2021 BooVI: Provably Efficient Bootstrapped Value Iteration Boyi Liu, Qi Cai, Zhuoran Yang, Zhaoran Wang

ICML 2021 Decentralized Single-Timescale Actor-Critic on Zero-Sum Two-Player Stochastic Games Hongyi Guo, Zuyue Fu, Zhuoran Yang, Zhaoran Wang

ICML 2021 Doubly Robust Off-Policy Actor-Critic: Convergence and Optimality Tengyu Xu, Zhuoran Yang, Zhaoran Wang, Yingbin Liang

NeurIPS 2021 Dynamic Bottleneck for Robust Self-Supervised Exploration Chenjia Bai, Lingxiao Wang, Lei Han, Animesh Garg, Jianye Hao, Peng Liu, Zhaoran Wang

NeurIPSW 2021 ElegantRL-Podracer: Scalable and Elastic Library for Cloud-Native Deep Reinforcement Learning Xiao-Yang Liu, Zechu Li, Zhuoran Yang, Jiahao Zheng, Zhaoran Wang, Anwar Walid, Jian Guo, Michael Jordan

NeurIPS 2021 Exponential Bellman Equation and Improved Regret Bounds for Risk-Sensitive Reinforcement Learning Yingjie Fei, Zhuoran Yang, Yudong Chen, Zhaoran Wang

NeurIPSW 2021 Exponential Family Model-Based Reinforcement Learning via Score Matching Gene Li, Junbo Li, Nathan Srebro, Zhaoran Wang, Zhuoran Yang

ICML 2021 Global Convergence of Policy Gradient for Linear-Quadratic Mean-Field Control/Game in Continuous Time Weichen Wang, Jiequn Han, Zhuoran Yang, Zhaoran Wang

ICML 2021 Infinite-Dimensional Optimization for Zero-Sum Games via Variational Transport Lewis Liu, Yufeng Zhang, Zhuoran Yang, Reza Babanezhad, Zhaoran Wang

ICML 2021 Is Pessimism Provably Efficient for Offline RL? Ying Jin, Zhuoran Yang, Zhaoran Wang

ICML 2021 Learning While Playing in Mean-Field Games: Convergence and Optimality Qiaomin Xie, Zhuoran Yang, Zhaoran Wang, Andreea Minca

NeurIPS 2021 Offline Constrained Multi-Objective Reinforcement Learning via Pessimistic Dual Value Iteration Runzhe Wu, Yufeng Zhang, Zhuoran Yang, Zhaoran Wang

ICML 2021 On Reward-Free RL with Kernel and Neural Function Approximations: Single-Agent MDP and Markov Game Shuang Qiu, Jieping Ye, Zhaoran Wang, Zhuoran Yang

NeurIPS 2021 Pessimism Meets Invariance: Provably Efficient Offline Mean-Field Multi-Agent RL Minshuo Chen, Yan Li, Ethan Wang, Zhuoran Yang, Zhaoran Wang, Tuo Zhao

ICML 2021 Principled Exploration via Optimistic Bootstrapping and Backward Induction Chenjia Bai, Lingxiao Wang, Lei Han, Jianye Hao, Animesh Garg, Peng Liu, Zhaoran Wang

NeurIPS 2021 Provably Efficient Causal Reinforcement Learning with Confounded Observational Data Lingxiao Wang, Zhuoran Yang, Zhaoran Wang

ICML 2021 Provably Efficient Fictitious Play Policy Optimization for Zero-Sum Markov Games with Structured Transitions Shuang Qiu, Xiaohan Wei, Jieping Ye, Zhaoran Wang, Zhuoran Yang

L4DC 2021 Provably Sample Efficient Reinforcement Learning in Competitive Linear Quadratic Systems Jingwei Zhang, Zhuoran Yang, Zhengyuan Zhou, Zhaoran Wang

ICML 2021 Randomized Exploration in Reinforcement Learning with General Value Function Approximation Haque Ishfaq, Qiwen Cui, Viet Nguyen, Alex Ayoub, Zhuoran Yang, Zhaoran Wang, Doina Precup, Lin Yang

ICML 2021 Risk-Sensitive Reinforcement Learning with Function Approximation: A Debiasing Approach Yingjie Fei, Zhuoran Yang, Zhaoran Wang

ICLR 2021 Single-Timescale Actor-Critic Provably Finds Globally Optimal Policy Zuyue Fu, Zhuoran Yang, Zhaoran Wang

NeurIPS 2021 Wasserstein Flow Meets Replicator Dynamics: A Mean-Field Analysis of Representation Learning in Actor-Critic Yufeng Zhang, Siyu Chen, Zhuoran Yang, Michael I. Jordan, Zhaoran Wang

L4DC 2020 A Theoretical Analysis of Deep Q-Learning Jianqing Fan, Zhaoran Wang, Yuchen Xie, Zhuoran Yang

ICLR 2020 Actor-Critic Provably Finds Nash Equilibria of Linear-Quadratic Mean-Field Games Zuyue Fu, Zhuoran Yang, Yongxin Chen, Zhaoran Wang

JMLR 2020 Agnostic Estimation for Phase Retrieval Matey Neykov, Zhaoran Wang, Han Liu

ICML 2020 Breaking the Curse of Many Agents: Provable Mean Embedding Q-Iteration for Mean-Field Reinforcement Learning Lingxiao Wang, Zhuoran Yang, Zhaoran Wang

NeurIPS 2020 Can Temporal-Diﬀerence and Q-Learning Learn Representation? a Mean-Field Theory Yufeng Zhang, Qi Cai, Zhuoran Yang, Yongxin Chen, Zhaoran Wang

ICML 2020 Computational and Statistical Tradeoffs in Inferring Combinatorial Structures of Ising Model Ying Jin, Zhaoran Wang, Junwei Lu

ICML 2020 Deep Reinforcement Learning with Robust and Smooth Policy Qianli Shen, Yan Li, Haoming Jiang, Zhaoran Wang, Tuo Zhao

NeurIPS 2020 Dynamic Regret of Policy Optimization in Non-Stationary Environments Yingjie Fei, Zhuoran Yang, Zhaoran Wang, Qiaomin Xie

NeurIPS 2020 End-to-End Learning and Intervention in Games Jiayang Li, Jing Yu, Yu Nie, Zhaoran Wang

ICML 2020 Generative Adversarial Imitation Learning with Neural Network Parameterization: Global Optimality and Convergence Rate Yufeng Zhang, Qi Cai, Zhuoran Yang, Zhaoran Wang

COLT 2020 Learning Zero-Sum Simultaneous-Move Markov Games Using Function Approximation and Correlated Equilibrium Qiaomin Xie, Yudong Chen, Zhaoran Wang, Zhuoran Yang

ICLR 2020 Neural Policy Gradient Methods: Global Optimality and Rates of Convergence Lingxiao Wang, Qi Cai, Zhuoran Yang, Zhaoran Wang

ICLR 2020 On Computation and Generalization of Generative Adversarial Imitation Learning Minshuo Chen, Yizhou Wang, Tianyi Liu, Zhuoran Yang, Xingguo Li, Zhaoran Wang, Tuo Zhao

ICML 2020 On the Global Optimality of Model-Agnostic Meta-Learning Lingxiao Wang, Qi Cai, Zhuoran Yang, Zhaoran Wang

NeurIPS 2020 Pontryagin Differentiable Programming: An End-to-End Learning and Control Framework Wanxin Jin, Zhaoran Wang, Zhuoran Yang, Shaoshuai Mou

ICML 2020 Provably Efficient Exploration in Policy Optimization Qi Cai, Zhuoran Yang, Chi Jin, Zhaoran Wang

NeurIPS 2020 Provably Efficient Neural Estimation of Structural Equation Models: An Adversarial Approach Luofeng Liao, You-Lin Chen, Zhuoran Yang, Bo Dai, Mladen Kolar, Zhaoran Wang

NeurIPS 2020 Provably Efficient Neural GTD for Off-Policy Learning Hoi-To Wai, Zhuoran Yang, Zhaoran Wang, Mingyi Hong

NeurIPS 2020 Provably Efficient Reinforcement Learning with Kernel and Neural Function Approximations Zhuoran Yang, Chi Jin, Zhaoran Wang, Mengdi Wang, Michael I. Jordan

COLT 2020 Provably Efficient Reinforcement Learning with Linear Function Approximation Chi Jin, Zhuoran Yang, Zhaoran Wang, Michael I Jordan

NeurIPS 2020 Risk-Sensitive Reinforcement Learning: Near-Optimal Risk-Sample Tradeoff in Regret Yingjie Fei, Zhuoran Yang, Yudong Chen, Zhaoran Wang, Qiaomin Xie

ICML 2020 Semiparametric Nonlinear Bipartite Graph Representation Learning with Provable Guarantees Sen Na, Yuwei Luo, Zhuoran Yang, Zhaoran Wang, Mladen Kolar

NeurIPS 2020 Upper Confidence Primal-Dual Reinforcement Learning for CMDP with Adversarial Loss Shuang Qiu, Xiaohan Wei, Zhuoran Yang, Jieping Ye, Zhaoran Wang

ICLR 2019 Accelerating Nonconvex Learning via Replica Exchange Langevin Diffusion Yi Chen, Jinglin Chen, Jing Dong, Jian Peng, Zhaoran Wang

NeurIPS 2019 Convergent Policy Optimization for Safe Reinforcement Learning Ming Yu, Zhuoran Yang, Mladen Kolar, Zhaoran Wang

JMLR 2019 High-Dimensional Varying Index Coefficient Models via Stein's Identity Sen Na, Zhuoran Yang, Zhaoran Wang, Mladen Kolar

NeurIPS 2019 Neural Temporal-Difference Learning Converges to Global Optima Qi Cai, Zhuoran Yang, Jason Lee, Zhaoran Wang

NeurIPS 2019 Neural Trust Region/Proximal Policy Optimization Attains Globally Optimal Policy Boyi Liu, Qi Cai, Zhuoran Yang, Zhaoran Wang

ICLR 2019 Off-Policy Evaluation and Learning from Logged Bandit Feedback: Error Reduction via Surrogate Policy Yuan Xie, Boyi Liu, Qiang Liu, Zhaoran Wang, Yuan Zhou, Jian Peng

ICML 2019 On the Statistical Rate of Nonlinear Recovery in Generative Models with Heavy-Tailed Data Xiaohan Wei, Zhuoran Yang, Zhaoran Wang

NeurIPS 2019 Provably Global Convergence of Actor-Critic: A Case for Linear Quadratic Regulator with Ergodic Cost Zhuoran Yang, Yongxin Chen, Mingyi Hong, Zhaoran Wang

NeurIPS 2019 Statistical-Computational Tradeoff in Single Index Models Lingxiao Wang, Zhuoran Yang, Zhaoran Wang

NeurIPS 2019 Variance Reduced Policy Evaluation with Smooth Function Approximation Hoi-To Wai, Mingyi Hong, Zhuoran Yang, Zhaoran Wang, Kexin Tang

NeurIPS 2018 Contrastive Learning from Pairwise Measurements Yi Chen, Zhuoran Yang, Yuchen Xie, Zhaoran Wang

AISTATS 2018 Minimax-Optimal Privacy-Preserving Sparse PCA in Distributed Systems Jason Ge, Zhaoran Wang, Mengdi Wang, Han Liu

NeurIPS 2018 Multi-Agent Reinforcement Learning via Double Averaging Primal-Dual Optimization Hoi-To Wai, Zhuoran Yang, Zhaoran Wang, Mingyi Hong

AISTATS 2018 Nonlinear Structured Signal Estimation in High Dimensions via Iterative Hard Thresholding Kaiqing Zhang, Zhuoran Yang, Zhaoran Wang

NeurIPS 2018 Provable Gaussian Embedding with One Observation Ming Yu, Zhuoran Yang, Tuo Zhao, Mladen Kolar, Zhaoran Wang

ICML 2018 The Edge Density Barrier: Computational-Statistical Tradeoffs in Combinatorial Inference Hao Lu, Yuan Cao, Zhuoran Yang, Junwei Lu, Han Liu, Zhaoran Wang

NeurIPS 2017 Estimating High-Dimensional Non-Gaussian Multiple Index Models via Stein’s Lemma Zhuoran Yang, Krishnakumar Balasubramanian, Zhaoran Wang, Han Liu

NeurIPS 2016 Agnostic Estimation for Misspecified Phase Retrieval Models Matey Neykov, Zhaoran Wang, Han Liu

NeurIPS 2016 Blind Attacks on Machine Learners Alex Beatson, Zhaoran Wang, Han Liu

AISTATS 2016 Low-Rank and Sparse Structure Pursuit via Alternating Minimization Quanquan Gu, Zhaoran Wang, Han Liu

NeurIPS 2016 More Supervision, Less Computation: Statistical-Computational Tradeoffs in Weakly Supervised Learning Xinyang Yi, Zhaoran Wang, Zhuoran Yang, Constantine Caramanis, Han Liu

NeurIPS 2016 NESTT: A Nonconvex Primal-Dual Splitting Method for Distributed and Stochastic Optimization Davood Hajinezhad, Mingyi Hong, Tuo Zhao, Zhaoran Wang

ICML 2016 On the Statistical Limits of Convex Relaxations Zhaoran Wang, Quanquan Gu, Han Liu

NeurIPS 2016 Online ICA: Understanding Global Dynamics of Nonconvex Optimization via Diffusion Processes Chris Junchi Li, Zhaoran Wang, Han Liu

ICML 2016 Sparse Nonlinear Regression: Parameter Estimation Under Nonconvexity Zhuoran Yang, Zhaoran Wang, Han Liu, Yonina Eldar, Tong Zhang

NeurIPS 2015 A Nonconvex Optimization Framework for Low Rank Matrix Estimation Tuo Zhao, Zhaoran Wang, Han Liu

NeurIPS 2015 High Dimensional EM Algorithm: Statistical Optimization and Asymptotic Normality Zhaoran Wang, Quanquan Gu, Yang Ning, Han Liu

NeurIPS 2015 Non-Convex Statistical Optimization for Sparse Tensor Graphical Model Wei Sun, Zhaoran Wang, Han Liu, Guang Cheng

NeurIPS 2015 Optimal Linear Estimation Under Unknown Nonlinear Transform Xinyang Yi, Zhaoran Wang, Constantine Caramanis, Han Liu

NeurIPS 2014 Sparse PCA with Oracle Property Quanquan Gu, Zhaoran Wang, Han Liu

NeurIPS 2014 Tighten After Relax: Minimax-Optimal Sparse PCA in Polynomial Time Zhaoran Wang, Huanran Lu, Han Liu

AISTATS 2013 Sparse Principal Component Analysis for High Dimensional Multivariate Time Series Zhaoran Wang, Fang Han, Han Liu