Wang, Huaimin

15 publications

AAAI 2025 Enhancing Decision-Making for LLM Agents via Step-Level Q-Value Models Yuanzhao Zhai, Tingkai Yang, Kele Xu, Dawei Feng, Cheng Yang, Bo Ding, Huaimin Wang

ICML 2025 Improving the Continuity of Goal-Achievement Ability via Policy Self-Regularization for Goal-Conditioned Reinforcement Learning Xudong Gong, Sen Yang, Feng Dawei, Kele Xu, Bo Ding, Huaimin Wang, Yong Dou

CVPR 2025 Knowledge Memorization and Rumination for Pre-Trained Model-Based Class-Incremental Learning Zijian Gao, Wangwang Jia, Xingxing Zhang, Dulan Zhou, Kele Xu, Feng Dawei, Yong Dou, Xinjun Mao, Huaimin Wang

AAAI 2025 Maintaining Fairness in Logit-Based Knowledge Distillation for Class-Incremental Learning Zijian Gao, Shanhao Han, Xingxing Zhang, Kele Xu, Dulan Zhou, Xinjun Mao, Yong Dou, Huaimin Wang

ICLR 2025 VVC-Gym: A Fixed-Wing UAV Reinforcement Learning Environment for Multi-Goal Long-Horizon Problems Xudong Gong, Feng Dawei, Kele Xu, Weijia Wang, Zhangjun Sun, Xing Zhou, Si Zheng, Bo Ding, Huaimin Wang

NeurIPS 2024 Goal-Conditioned On-Policy Reinforcement Learning Xudong Gong, Dawei Feng, Kele Xu, Bo Ding, Huaimin Wang

ICML 2024 Iterative Regularized Policy Optimization with Imperfect Demonstrations Gong Xudong, Feng Dawei, Kele Xu, Yuanzhao Zhai, Chengkang Yao, Weijia Wang, Bo Ding, Huaimin Wang

AAAI 2024 Optimistic Model Rollouts for Pessimistic Offline Policy Optimization Yuanzhao Zhai, Yiying Li, Zijian Gao, Xudong Gong, Kele Xu, Dawei Feng, Bo Ding, Huaimin Wang

NeurIPS 2024 Stabilizing Zero-Shot Prediction: A Novel Antidote to Forgetting in Continual Vision-Language Tasks Zijian Gao, Xingxing Zhang, Kele Xu, Xinjun Mao, Huaimin Wang

IJCAI 2022 Unsupervised Voice-Face Representation Learning by Cross-Modal Prototype Contrast Boqing Zhu, Kele Xu, Changjian Wang, Zheng Qin, Tao Sun, Huaimin Wang, Yuxing Peng

NeurIPS 2020 Online Meta-Critic Learning for Off-Policy Actor-Critic Methods Wei Zhou, Yiying Li, Yongxin Yang, Huaimin Wang, Timothy Hospedales

IJCAI 2019 A Mobile Application for Sound Event Detection Yingwei Fu, Kele Xu, Haibo Mi, Huaimin Wang, Dezhi Wang, Boqing Zhu

IJCAI 2019 A Quantitative Analysis Platform for PD-L1 Immunohistochemistry Based on Point-Level Supervision Model Haibo Mi, Kele Xu, Yang Xiang, Yulin He, Dawei Feng, Huaimin Wang, Chun Wu, Yanming Song, Xiaolei Sun

UAI 2017 Triply Stochastic Gradients on Multiple Kernel Learning Xiang Li, Bin Gu, Shuang Ao, Huaimin Wang, Charles X. Ling

IJCAI 2015 Data Sparseness in Linear SVM Xiang Li, Huaimin Wang, Bin Gu, Charles X. Ling