Mao, Yixiu

9 publications

NeurIPS 2025 Adaptive Neighborhood-Constrained Q Learning for Offline Reinforcement Learning Yixiu Mao, Yun Qu, Cheems Wang, Xiangyang Ji

ICML 2025 Fast and Robust: Task Sampling with Posterior and Diversity Synergies for Adaptive Decision-Makers in Randomized Environments Yun Qu, Cheems Wang, Yixiu Mao, Yiqin Lv, Xiangyang Ji

AAAI 2025 Latent Reward: LLM-Empowered Credit Assignment in Episodic Reinforcement Learning Yun Qu, Yuhang Jiang, Boyuan Wang, Yixiu Mao, Cheems Wang, Chang Liu, Xiangyang Ji

NeurIPS 2024 Doubly Mild Generalization for Offline Reinforcement Learning Yixiu Mao, Qi Wang, Yun Qu, Yuhang Jiang, Xiangyang Ji

NeurIPS 2024 Offline Reinforcement Learning with OOD State Correction and OOD Action Suppression Yixiu Mao, Qi Wang, Chen Chen, Yun Qu, Xiangyang Ji

ICLR 2023 In-Sample Actor Critic for Offline Reinforcement Learning Hongchang Zhang, Yixiu Mao, Boyuan Wang, Shuncheng He, Yi Xu, Xiangyang Ji

ICML 2023 Supported Trust Region Optimization for Offline Reinforcement Learning Yixiu Mao, Hongchang Zhang, Chen Chen, Yi Xu, Xiangyang Ji

NeurIPS 2023 Supported Value Regularization for Offline Reinforcement Learning Yixiu Mao, Hongchang Zhang, Chen Chen, Yi Xu, Xiangyang Ji

ICLR 2021 A Hypergradient Approach to Robust Regression Without Correspondence Yujia Xie, Yixiu Mao, Simiao Zuo, Hongteng Xu, Xiaojing Ye, Tuo Zhao, Hongyuan Zha