Hu, Shengchao

12 publications

ICLR 2026 Rethinking Data Curation in LLM Training: Online Reweighting Offers Better Generalization than Offline Methods Wanru Zhao, Yihong Chen, Yuzhi Tang, Wentao Ma, Shengchao Hu, Shell Xu Hu, Alex Iacob, Abhinav Mehrotra, Nicholas D. Lane

ICLR 2026 The State of Reinforcement Finetuning for Transformer-Based Agents Shengchao Hu, Peng Wang, Guozheng Ma, Shi Fu, Li Shen, Ya Zhang, Dacheng Tao

ICLR 2026 Understanding the Dynamics of Forgetting and Generalization in Continual Learning via the Neural Tangent Kernel Guodong Zheng, Peng Wang, Shengchao Hu, Quan Zheng, Li Shen

NeurIPS 2025 Analytic Energy-Guided Policy Optimization for Offline Reinforcement Learning Jifeng Hu, Sili Huang, Zhejian Yang, Shengchao Hu, Li Shen, Hechang Chen, Lichao Sun, Yi Chang, Dacheng Tao

ICLR 2025 Combatting Dimensional Collapse in LLM Pre-Training Data via Submodular File Selection Ziqing Fan, Siyuan Du, Shengchao Hu, Pingjie Wang, Li Shen, Ya Zhang, Dacheng Tao, Yanfeng Wang

NeurIPS 2025 Tackling Continual Offline RL Through Selective Weights Activation on Aligned Spaces Jifeng Hu, Sili Huang, Li Shen, Zhejian Yang, Shengchao Hu, Shisong Tang, Hechang Chen, Lichao Sun, Yi Chang, Dacheng Tao

ICML 2024 HarmoDT: Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning Shengchao Hu, Ziqing Fan, Li Shen, Ya Zhang, Yanfeng Wang, Dacheng Tao

NeurIPS 2024 Is Mamba Compatible with Trajectory Optimization in Offline Reinforcement Learning? Yang Dai, Oubo Ma, Longfei Zhang, Xingxing Liang, Shengchao Hu, Mengzhu Wang, Shouling Ji, Jincai Huang, Li Shen

ICLR 2024 Learning Multi-Agent Communication from Graph Modeling Perspective Shengchao Hu, Li Shen, Ya Zhang, Dacheng Tao

ICML 2024 Locally Estimated Global Perturbations Are Better than Local Perturbations for Federated Sharpness-Aware Minimization Ziqing Fan, Shengchao Hu, Jiangchao Yao, Gang Niu, Ya Zhang, Masashi Sugiyama, Yanfeng Wang

ICML 2024 Q-Value Regularized Transformer for Offline Reinforcement Learning Shengchao Hu, Ziqing Fan, Chaoqin Huang, Li Shen, Ya Zhang, Yanfeng Wang, Dacheng Tao

ECCV 2022 ST-P3: End-to-End Vision-Based Autonomous Driving via Spatial-Temporal Feature Learning Shengchao Hu, Li Chen, Penghao Wu, Hongyang Li, Junchi Yan, Dacheng Tao