Dong, Li

49 publications

JMLR 2025 BitNet: 1-Bit Pre-Training for Large Language Models Hongyu Wang, Shuming Ma, Lingxiao Ma, Lei Wang, Wenhui Wang, Li Dong, Shaohan Huang, Huaijie Wang, Jilong Xue, Ruiping Wang, Yi Wu, Furu Wei

ICLR 2025 Data Selection via Optimal Control for Language Models Yuxian Gu, Li Dong, Hongning Wang, Yaru Hao, Qingxiu Dong, Furu Wei, Minlie Huang

ICLR 2025 Differential Transformer Tianzhu Ye, Li Dong, Yuqing Xia, Yutao Sun, Yi Zhu, Gao Huang, Furu Wei

ICML 2025 Imagine While Reasoning in Space: Multimodal Visualization-of-Thought Chengzu Li, Wenshan Wu, Huanyu Zhang, Yan Xia, Shaoguang Mao, Li Dong, Ivan Vulić, Furu Wei

ICCV 2025 Learning Robust Image Watermarking with Lossless Cover Recovery Jiale Chen, Wei Wang, Chongyang Shi, Li Dong, Xiping Hu

NeurIPS 2025 MoE-CAP: Benchmarking Cost, Accuracy and Performance of Sparse Mixture-of-Experts Systems Yinsicheng Jiang, Yao Fu, Yeqi Huang, Ping Nie, Zhan Lu, Leyang Xue, Congjie He, Man-Kit Sit, Jilong Xue, Li Dong, Ziming Miao, DaYou Du, Tairan Xu, Kai Zou, Edoardo Ponti, Luo Mai

AISTATS 2025 New User Event Prediction Through the Lens of Causal Inference Henry Yuchi, Shixiang Zhu, Li Dong, Yigit M. Arisoy, Matthew C. Spencer

NeurIPS 2025 Reward Reasoning Models Jiaxin Guo, Zewen Chi, Li Dong, Qingxiu Dong, Xun Wu, Shaohan Huang, Furu Wei

ICLR 2025 Self-Boosting Large Language Models with Synthetic Preference Data Qingxiu Dong, Li Dong, Xingxing Zhang, Zhifang Sui, Furu Wei

ICLR 2025 Semi-Parametric Retrieval via Binary Bag-of-Tokens Index Jiawei Zhou, Li Dong, Furu Wei, Lei Chen

TMLR 2025 Synthetic Data (Almost) from Scratch: Generalized Instruction Tuning for Language Models Haoran Li, Qingxiu Dong, Zhengyang Tang, Chaojun Wang, Xingxing Zhang, Haoyang Huang, Shaohan Huang, Xiaolong Huang, Zeqiang Huang, Dongdong Zhang, Yuxian Gu, Xin Cheng, Xun Wang, Si-Qing Chen, Li Dong, Wei Lu, Zhifang Sui, Benyou Wang, Wai Lam, Furu Wei

NeurIPS 2025 Think Only When You Need with Large Hybrid-Reasoning Models Lingjie Jiang, Xun Wu, Shaohan Huang, Qingxiu Dong, Zewen Chi, Li Dong, Xingxing Zhang, Tengchao Lv, Lei Cui, Furu Wei

CVPR 2024 BioCLIP: A Vision Foundation Model for the Tree of Life Samuel Stevens, Jiaman Wu, Matthew J Thompson, Elizabeth G Campolongo, Chan Hee Song, David Edward Carlyn, Li Dong, Wasila M Dahdul, Charles Stewart, Tanya Berger-Wolf, Wei-Lun Chao, Yu Su

ICLR 2024 Grounding Multimodal Large Language Models to the World Zhiliang Peng, Wenhui Wang, Li Dong, Yaru Hao, Shaohan Huang, Shuming Ma, Qixiang Ye, Furu Wei

ICLR 2024 Kosmos-G: Generating Images in Context with Multimodal Large Language Models Xichen Pan, Li Dong, Shaohan Huang, Zhiliang Peng, Wenhu Chen, Furu Wei

NeurIPS 2024 Mind's Eye of LLMs: Visualization-of-Thought Elicits Spatial Reasoning in Large Language Models Wenshan Wu, Shaoguang Mao, Yadong Zhang, Yan Xia, Li Dong, Lei Cui, Furu Wei

ICLR 2024 MiniLLM: Knowledge Distillation of Large Language Models Yuxian Gu, Li Dong, Furu Wei, Minlie Huang

NeurIPS 2024 Multi-Head Mixture-of-Experts Xun Wu, Shaohan Huang, Wenhui Wang, Shuming Ma, Li Dong, Furu Wei

NeurIPS 2024 You Only Cache Once: Decoder-Decoder Architectures for Language Models Yutao Sun, Li Dong, Yi Zhu, Shaohan Huang, Wenhui Wang, Shuming Ma, Quanlu Zhang, Jianyong Wang, Furu Wei

TMLR 2023 A Unified View of Masked Image Modeling Zhiliang Peng, Li Dong, Hangbo Bao, Furu Wei, Qixiang Ye

NeurIPS 2023 Augmenting Language Models with Long-Term Memory Weizhi Wang, Li Dong, Hao Cheng, Xiaodong Liu, Xifeng Yan, Jianfeng Gao, Furu Wei

ICLR 2023 Corrupted Image Modeling for Self-Supervised Visual Pre-Training Yuxin Fang, Li Dong, Hangbo Bao, Xinggang Wang, Furu Wei

NeurIPS 2023 Extensible Prompts for Language Models on Zero-Shot Language Style Customization Tao Ge, Hu Jing, Li Dong, Shaoguang Mao, Yan Xia, Xun Wang, Si-Qing Chen, Furu Wei

CVPR 2023 Generic-to-Specific Distillation of Masked Autoencoders Wei Huang, Zhiliang Peng, Li Dong, Furu Wei, Jianbin Jiao, Qixiang Ye

CVPR 2023 Image as a Foreign Language: BEiT Pretraining for Vision and Vision-Language Tasks Wenhui Wang, Hangbo Bao, Li Dong, Johan Bjorck, Zhiliang Peng, Qiang Liu, Kriti Aggarwal, Owais Khan Mohammed, Saksham Singhal, Subhojit Som, Furu Wei

NeurIPS 2023 Language Is Not All You Need: Aligning Perception with Language Models Shaohan Huang, Li Dong, Wenhui Wang, Yaru Hao, Saksham Singhal, Shuming Ma, Tengchao Lv, Lei Cui, Owais Khan Mohammed, Barun Patra, Qiang Liu, Kriti Aggarwal, Zewen Chi, Nils Bjorck, Vishrav Chaudhary, Subhojit Som, Xia Song, Furu Wei

ICML 2023 Magneto: A Foundation Transformer Hongyu Wang, Shuming Ma, Shaohan Huang, Li Dong, Wenhui Wang, Zhiliang Peng, Yu Wu, Payal Bajaj, Saksham Singhal, Alon Benhaim, Barun Patra, Zhun Liu, Vishrav Chaudhary, Xia Song, Furu Wei

CVPR 2023 Non-Contrastive Learning Meets Language-Image Pre-Training Jinghao Zhou, Li Dong, Zhe Gan, Lijuan Wang, Furu Wei

NeurIPS 2023 Optimizing Prompts for Text-to-Image Generation Yaru Hao, Zewen Chi, Li Dong, Furu Wei

ICLR 2023 Prototypical Calibration for Few-Shot Learning of Language Models Zhixiong Han, Yaru Hao, Li Dong, Yutao Sun, Furu Wei

ICML 2023 Semi-Offline Reinforcement Learning for Optimized Text Generation Changyu Chen, Xiting Wang, Yiqiao Jin, Victor Ye Dong, Li Dong, Jie Cao, Yi Liu, Rui Yan

ICLR 2023 Visually-Augmented Language Modeling Weizhi Wang, Li Dong, Hao Cheng, Haoyu Song, Xiaodong Liu, Xifeng Yan, Jianfeng Gao, Furu Wei

ICLRW 2023 Why Can GPT Learn In-Context? Language Models Implicitly Perform Gradient Descent as Meta-Optimizers Damai Dai, Yutao Sun, Li Dong, Yaru Hao, Shuming Ma, Zhifang Sui, Furu Wei

ICLR 2022 BEiT: BERT Pre-Training of Image Transformers Hangbo Bao, Li Dong, Songhao Piao, Furu Wei

NeurIPS 2022 On the Representation Collapse of Sparse Mixture of Experts Zewen Chi, Li Dong, Shaohan Huang, Damai Dai, Shuming Ma, Barun Patra, Saksham Singhal, Payal Bajaj, Xia Song, Xian-Ling Mao, Heyan Huang, Furu Wei

CVPR 2022 Swin Transformer V2: Scaling up Capacity and Resolution Ze Liu, Han Hu, Yutong Lin, Zhuliang Yao, Zhenda Xie, Yixuan Wei, Jia Ning, Yue Cao, Zheng Zhang, Li Dong, Furu Wei, Baining Guo

NeurIPS 2022 VLMo: Unified Vision-Language Pre-Training with Mixture-of-Modality-Experts Hangbo Bao, Wenhui Wang, Li Dong, Qiang Liu, Owais Khan Mohammed, Kriti Aggarwal, Subhojit Som, Songhao Piao, Furu Wei

AAAI 2021 Self-Attention Attribution: Interpreting Information Interactions Inside Transformer Yaru Hao, Li Dong, Furu Wei, Ke Xu

AAAI 2020 Cross-Lingual Natural Language Generation via Pre-Training Zewen Chi, Li Dong, Furu Wei, Wenhui Wang, Xian-Ling Mao, Heyan Huang

NeurIPS 2020 MiniLM: Deep Self-Attention Distillation for Task-Agnostic Compression of Pre-Trained Transformers Wenhui Wang, Furu Wei, Li Dong, Hangbo Bao, Nan Yang, Ming Zhou

ECCV 2020 Oscar: Object-Semantics Aligned Pre-Training for Vision-Language Tasks Xiujun Li, Xi Yin, Chunyuan Li, Pengchuan Zhang, Xiaowei Hu, Lei Zhang, Lijuan Wang, Houdong Hu, Li Dong, Furu Wei, Yejin Choi, Jianfeng Gao

ICML 2020 UniLMv2: Pseudo-Masked Language Models for Unified Language Model Pre-Training Hangbo Bao, Li Dong, Furu Wei, Wenhui Wang, Nan Yang, Xiaodong Liu, Yu Wang, Jianfeng Gao, Songhao Piao, Ming Zhou, Hsiao-Wuen Hon

AAAI 2019 Data-to-Text Generation with Content Selection and Planning Ratish Puduppully, Li Dong, Mirella Lapata

NeurIPS 2019 Unified Language Model Pre-Training for Natural Language Understanding and Generation Li Dong, Nan Yang, Wenhui Wang, Furu Wei, Xiaodong Liu, Yu Wang, Jianfeng Gao, Ming Zhou, Hsiao-Wuen Hon

IJCAI 2016 Unsupervised Word and Dependency Path Embeddings for Aspect Term Extraction Yichun Yin, Furu Wei, Li Dong, Kaimeng Xu, Ming Zhang, Ming Zhou

IJCAI 2015 A Hybrid Neural Model for Type Classification of Entity Mentions Li Dong, Furu Wei, Hong Sun, Ming Zhou, Ke Xu

AAAI 2015 Ranking with Recursive Neural Networks and Its Application to Multi-Document Summarization Ziqiang Cao, Furu Wei, Li Dong, Sujian Li, Ming Zhou

AAAI 2014 Adaptive Multi-Compositionality for Recursive Neural Models with Applications to Sentiment Analysis Li Dong, Furu Wei, Ming Zhou, Ke Xu

AAAI 2013 The Automated Acquisition of Suggestions from Tweets Li Dong, Furu Wei, Yajuan Duan, Xiaohua Liu, Ming Zhou, Ke Xu