Huang, Shaohan

20 publications

JMLR 2025 BitNet: 1-Bit Pre-Training for Large Language Models Hongyu Wang, Shuming Ma, Lingxiao Ma, Lei Wang, Wenhui Wang, Li Dong, Shaohan Huang, Huaijie Wang, Jilong Xue, Ruiping Wang, Yi Wu, Furu Wei

ICCV 2025 Rethinking DPO-Style Diffusion Aligning Frameworks Xun Wu, Shaohan Huang, Lingjie Jiang, Furu Wei

NeurIPS 2025 Reward Reasoning Models Jiaxin Guo, Zewen Chi, Li Dong, Qingxiu Dong, Xun Wu, Shaohan Huang, Furu Wei

TMLR 2025 Synthetic Data (Almost) from Scratch: Generalized Instruction Tuning for Language Models Haoran Li, Qingxiu Dong, Zhengyang Tang, Chaojun Wang, Xingxing Zhang, Haoyang Huang, Shaohan Huang, Xiaolong Huang, Zeqiang Huang, Dongdong Zhang, Yuxian Gu, Xin Cheng, Xun Wang, Si-Qing Chen, Li Dong, Wei Lu, Zhifang Sui, Benyou Wang, Wai Lam, Furu Wei

NeurIPS 2025 Think Only When You Need with Large Hybrid-Reasoning Models Lingjie Jiang, Xun Wu, Shaohan Huang, Qingxiu Dong, Zewen Chi, Li Dong, Xingxing Zhang, Tengchao Lv, Lei Cui, Furu Wei

ICLR 2024 Adapting Large Language Models via Reading Comprehension Daixuan Cheng, Shaohan Huang, Furu Wei

NeurIPS 2024 Boosting Text-to-Video Generative Model with MLLMs Feedback Xun Wu, Shaohan Huang, Guolong Wang, Jing Xiong, Furu Wei

ICLR 2024 Grounding Multimodal Large Language Models to the World Zhiliang Peng, Wenhui Wang, Li Dong, Yaru Hao, Shaohan Huang, Shuming Ma, Qixiang Ye, Furu Wei

ICLR 2024 Kosmos-G: Generating Images in Context with Multimodal Large Language Models Xichen Pan, Li Dong, Shaohan Huang, Zhiliang Peng, Wenhu Chen, Furu Wei

ICLR 2024 Mixture of LoRA Experts Xun Wu, Shaohan Huang, Furu Wei

NeurIPS 2024 Multi-Head Mixture-of-Experts Xun Wu, Shaohan Huang, Wenhui Wang, Shuming Ma, Li Dong, Furu Wei

NeurIPS 2024 Multimodal Large Language Models Make Text-to-Image Generative Models Align Better Xun Wu, Shaohan Huang, Guolong Wang, Jing Xiong, Furu Wei

AAAI 2024 Text Diffusion with Reinforced Conditioning Yuxuan Liu, Tianchi Yang, Shaohan Huang, Zihan Zhang, Haizhen Huang, Furu Wei, Weiwei Deng, Feng Sun, Qi Zhang

NeurIPS 2024 You Only Cache Once: Decoder-Decoder Architectures for Language Models Yutao Sun, Li Dong, Yi Zhu, Shaohan Huang, Wenhui Wang, Shuming Ma, Quanlu Zhang, Jianyong Wang, Furu Wei

NeurIPS 2023 Language Is Not All You Need: Aligning Perception with Language Models Shaohan Huang, Li Dong, Wenhui Wang, Yaru Hao, Saksham Singhal, Shuming Ma, Tengchao Lv, Lei Cui, Owais Khan Mohammed, Barun Patra, Qiang Liu, Kriti Aggarwal, Zewen Chi, Nils Bjorck, Vishrav Chaudhary, Subhojit Som, Xia Song, Furu Wei

ICML 2023 Magneto: A Foundation Transformer Hongyu Wang, Shuming Ma, Shaohan Huang, Li Dong, Wenhui Wang, Zhiliang Peng, Yu Wu, Payal Bajaj, Saksham Singhal, Alon Benhaim, Barun Patra, Zhun Liu, Vishrav Chaudhary, Xia Song, Furu Wei

AAAI 2023 MoEC: Mixture of Expert Clusters Yuan Xie, Shaohan Huang, Tianyu Chen, Furu Wei

NeurIPS 2022 On the Representation Collapse of Sparse Mixture of Experts Zewen Chi, Li Dong, Shaohan Huang, Damai Dai, Shuming Ma, Barun Patra, Saksham Singhal, Payal Bajaj, Xia Song, Xian-Ling Mao, Heyan Huang, Furu Wei

AAAI 2019 Dictionary-Guided Editing Networks for Paraphrase Generation Shaohan Huang, Yu Wu, Furu Wei, Zhongzhi Luan

AAAI 2019 Response Generation by Context-Aware Prototype Editing Yu Wu, Furu Wei, Shaohan Huang, Yunli Wang, Zhoujun Li, Ming Zhou