Wang, Shuohuan

5 publications

ICLR 2025 MA-RLHF: Reinforcement Learning from Human Feedback with Macro Actions Yekun Chai, Haoran Sun, Huang Fang, Shuohuan Wang, Yu Sun, Hua Wu

ICML 2025 Mixture of Hidden-Dimensions: Not All Hidden-States’ Dimensions Are Needed in Transformer Yilong Chen, Junyuan Shang, Zhenyu Zhang, Jiawei Sheng, Tingwen Liu, Shuohuan Wang, Yu Sun, Hua Wu, Haifeng Wang

NeurIPS 2024 DHA: Learning Decoupled-Head Attention from Transformer Checkpoints via Adaptive Heads Fusion Yilong Chen, Linhao Zhang, Junyuan Shang, Zhenyu Zhang, Tingwen Liu, Shuohuan Wang, Yu Sun

ICLR 2024 Tool-Augmented Reward Modeling Lei Li, Yekun Chai, Shuohuan Wang, Yu Sun, Hao Tian, Ningyu Zhang, Hua Wu

AAAI 2020 ERNIE 2.0: A Continual Pre-Training Framework for Language Understanding Yu Sun, Shuohuan Wang, Yu-Kun Li, Shikun Feng, Hao Tian, Hua Wu, Haifeng Wang