Wei, Furu

96 publications

ICLR 2025 ARLON: Boosting Diffusion Transformers with Autoregressive Models for Long Video Generation Zongyi Li, Shujie Hu, Shujie Liu, Long Zhou, Jeongsoo Choi, Lingwei Meng, Xun Guo, Jinyu Li, Hefei Ling, Furu Wei

ICLRW 2025 Assessing Dialect Fairness and Robustness of Large Language Models in Reasoning Tasks Fangru Lin, Shaoguang Mao, Emanuele La Malfa, Valentin Hofmann, Adrian de Wynter, Xun Wang, Si-Qing Chen, Michael J. Wooldridge, Janet B. Pierrehumbert, Furu Wei

JMLR 2025 BitNet: 1-Bit Pre-Training for Large Language Models Hongyu Wang, Shuming Ma, Lingxiao Ma, Lei Wang, Wenhui Wang, Li Dong, Shaohan Huang, Huaijie Wang, Jilong Xue, Ruiping Wang, Yi Wu, Furu Wei

NeurIPS 2025 Chain-of-Retrieval Augmented Generation Liang Wang, Haonan Chen, Nan Yang, Xiaolong Huang, Zhicheng Dou, Furu Wei

ICLR 2025 Data Selection via Optimal Control for Language Models Yuxian Gu, Li Dong, Hongning Wang, Yaru Hao, Qingxiu Dong, Furu Wei, Minlie Huang

ICLR 2025 Differential Transformer Tianzhu Ye, Li Dong, Yuqing Xia, Yutao Sun, Yi Zhu, Gao Huang, Furu Wei

ICLR 2025 Generative Representational Instruction Tuning Niklas Muennighoff, Hongjin Su, Liang Wang, Nan Yang, Furu Wei, Tao Yu, Amanpreet Singh, Douwe Kiela

ICML 2025 Imagine While Reasoning in Space: Multimodal Visualization-of-Thought Chengzu Li, Wenshan Wu, Huanyu Zhang, Yan Xia, Shaoguang Mao, Li Dong, Ivan Vulić, Furu Wei

CVPR 2025 PEACE: Empowering Geologic mAP Holistic Understanding with MLLMs Yangyu Huang, Tianyi Gao, Haoran Xu, Qihao Zhao, Yang Song, Zhipeng Gui, Tengchao Lv, Hao Chen, Lei Cui, Scarlett Li, Furu Wei

ICLR 2025 Preference Optimization for Reasoning with Pseudo Feedback Fangkai Jiao, Geyang Guo, Xingxing Zhang, Nancy F. Chen, Shafiq Joty, Furu Wei

ICCV 2025 Rethinking DPO-Style Diffusion Aligning Frameworks Xun Wu, Shaohan Huang, Lingjie Jiang, Furu Wei

NeurIPS 2025 Reward Reasoning Models Jiaxin Guo, Zewen Chi, Li Dong, Qingxiu Dong, Xun Wu, Shaohan Huang, Furu Wei

ICLR 2025 Scaling Optimal LR Across Token Horizons Johan Bjorck, Alon Benhaim, Vishrav Chaudhary, Furu Wei, Xia Song

ICLR 2025 Self-Boosting Large Language Models with Synthetic Preference Data Qingxiu Dong, Li Dong, Xingxing Zhang, Zhifang Sui, Furu Wei

ICLR 2025 Semi-Parametric Retrieval via Binary Bag-of-Tokens Index Jiawei Zhou, Li Dong, Furu Wei, Lei Chen

TMLR 2025 Synthetic Data (Almost) from Scratch: Generalized Instruction Tuning for Language Models Haoran Li, Qingxiu Dong, Zhengyang Tang, Chaojun Wang, Xingxing Zhang, Haoyang Huang, Shaohan Huang, Xiaolong Huang, Zeqiang Huang, Dongdong Zhang, Yuxian Gu, Xin Cheng, Xun Wang, Si-Qing Chen, Li Dong, Wei Lu, Zhifang Sui, Benyou Wang, Wai Lam, Furu Wei

NeurIPS 2025 Think Only When You Need with Large Hybrid-Reasoning Models Lingjie Jiang, Xun Wu, Shaohan Huang, Qingxiu Dong, Zewen Chi, Li Dong, Xingxing Zhang, Tengchao Lv, Lei Cui, Furu Wei

NeurIPS 2025 Towards Thinking-Optimal Scaling of Test-Time Compute for LLM Reasoning Wenkai Yang, Shuming Ma, Yankai Lin, Furu Wei

ICLR 2024 Adapting Large Language Models via Reading Comprehension Daixuan Cheng, Shaohan Huang, Furu Wei

NeurIPS 2024 Boosting Text-to-Video Generative Model with MLLMs Feedback Xun Wu, Shaohan Huang, Guolong Wang, Jing Xiong, Furu Wei

ICLRW 2024 Generative Representational Instruction Tuning Niklas Muennighoff, Hongjin Su, Liang Wang, Nan Yang, Furu Wei, Tao Yu, Amanpreet Singh, Douwe Kiela

ICLR 2024 Grounding Multimodal Large Language Models to the World Zhiliang Peng, Wenhui Wang, Li Dong, Yaru Hao, Shaohan Huang, Shuming Ma, Qixiang Ye, Furu Wei

ICLR 2024 In-Context Autoencoder for Context Compression in a Large Language Model Tao Ge, Hu Jing, Lei Wang, Xun Wang, Si-Qing Chen, Furu Wei

ICLR 2024 Kosmos-G: Generating Images in Context with Multimodal Large Language Models Xichen Pan, Li Dong, Shaohan Huang, Zhiliang Peng, Wenhu Chen, Furu Wei

AAAI 2024 Learning to Rank in Generative Retrieval Yongqi Li, Nan Yang, Liang Wang, Furu Wei, Wenjie Li

ICML 2024 MathScale: Scaling Instruction Tuning for Mathematical Reasoning Zhengyang Tang, Xingxing Zhang, Benyou Wang, Furu Wei

NeurIPS 2024 Mind's Eye of LLMs: Visualization-of-Thought Elicits Spatial Reasoning in Large Language Models Wenshan Wu, Shaoguang Mao, Yadong Zhang, Yan Xia, Li Dong, Lei Cui, Furu Wei

ICLR 2024 MiniLLM: Knowledge Distillation of Large Language Models Yuxian Gu, Li Dong, Furu Wei, Minlie Huang

ICLR 2024 Mixture of LoRA Experts Xun Wu, Shaohan Huang, Furu Wei

NeurIPS 2024 Multi-Head Mixture-of-Experts Xun Wu, Shaohan Huang, Wenhui Wang, Shuming Ma, Li Dong, Furu Wei

NeurIPS 2024 Multimodal Large Language Models Make Text-to-Image Generative Models Align Better Xun Wu, Shaohan Huang, Guolong Wang, Jing Xiong, Furu Wei

ICLR 2024 PoSE: Efficient Context Window Extension of LLMs via Positional Skip-Wise Training Dawei Zhu, Nan Yang, Liang Wang, Yifan Song, Wenhao Wu, Furu Wei, Sujian Li

AAAI 2024 Text Diffusion with Reinforced Conditioning Yuxuan Liu, Tianchi Yang, Shaohan Huang, Zihan Zhang, Haizhen Huang, Furu Wei, Weiwei Deng, Feng Sun, Qi Zhang

ECCV 2024 TextDiffuser-2: Unleashing the Power of Language Models for Text Rendering Jingye Chen, Yupan Huang, Tengchao Lv, Lei Cui, Qifeng Chen, Furu Wei

NeurIPSW 2024 VALL-E R: Robust and Efficient Zero-Shot Text-to-Speech Synthesis via Monotonic Alignment Bing Han, Long Zhou, Shujie Liu, Sanyuan Chen, Lingwei Meng, Yanmin Qian, Eric Liu, Sheng Zhao, Jinyu Li, Furu Wei

NeurIPS 2024 You Only Cache Once: Decoder-Decoder Architectures for Language Models Yutao Sun, Li Dong, Yi Zhu, Shaohan Huang, Wenhui Wang, Shuming Ma, Quanlu Zhang, Jianyong Wang, Furu Wei

NeurIPS 2024 xRAG: Extreme Context Compression for Retrieval-Augmented Generation with One Token Xin Cheng, Xun Wang, Xingxing Zhang, Tao Ge, Si-Qing Chen, Furu Wei, Huishuai Zhang, Dongyan Zhao

TMLR 2023 A Unified View of Masked Image Modeling Zhiliang Peng, Li Dong, Hangbo Bao, Furu Wei, Qixiang Ye

ICLR 2023 Are More Layers Beneficial to Graph Transformers? Haiteng Zhao, Shuming Ma, Dongdong Zhang, Zhi-Hong Deng, Furu Wei

NeurIPS 2023 Augmenting Language Models with Long-Term Memory Weizhi Wang, Li Dong, Hao Cheng, Xiaodong Liu, Xifeng Yan, Jianfeng Gao, Furu Wei

ICML 2023 BEATs: Audio Pre-Training with Acoustic Tokenizers Sanyuan Chen, Yu Wu, Chengyi Wang, Shujie Liu, Daniel Tompkins, Zhuo Chen, Wanxiang Che, Xiangzhan Yu, Furu Wei

ICLR 2023 Corrupted Image Modeling for Self-Supervised Visual Pre-Training Yuxin Fang, Li Dong, Hangbo Bao, Xinggang Wang, Furu Wei

NeurIPS 2023 Extensible Prompts for Language Models on Zero-Shot Language Style Customization Tao Ge, Hu Jing, Li Dong, Shaoguang Mao, Yan Xia, Xun Wang, Si-Qing Chen, Furu Wei

CVPR 2023 Generic-to-Specific Distillation of Masked Autoencoders Wei Huang, Zhiliang Peng, Li Dong, Furu Wei, Jianbin Jiao, Qixiang Ye

CVPR 2023 Image as a Foreign Language: BEiT Pretraining for Vision and Vision-Language Tasks Wenhui Wang, Hangbo Bao, Li Dong, Johan Bjorck, Zhiliang Peng, Qiang Liu, Kriti Aggarwal, Owais Khan Mohammed, Saksham Singhal, Subhojit Som, Furu Wei

NeurIPS 2023 Language Is Not All You Need: Aligning Perception with Language Models Shaohan Huang, Li Dong, Wenhui Wang, Yaru Hao, Saksham Singhal, Shuming Ma, Tengchao Lv, Lei Cui, Owais Khan Mohammed, Barun Patra, Qiang Liu, Kriti Aggarwal, Zewen Chi, Nils Bjorck, Vishrav Chaudhary, Subhojit Som, Xia Song, Furu Wei

ICML 2023 Magneto: A Foundation Transformer Hongyu Wang, Shuming Ma, Shaohan Huang, Li Dong, Wenhui Wang, Zhiliang Peng, Yu Wu, Payal Bajaj, Saksham Singhal, Alon Benhaim, Barun Patra, Zhun Liu, Vishrav Chaudhary, Xia Song, Furu Wei

AAAI 2023 MoEC: Mixture of Expert Clusters Yuan Xie, Shaohan Huang, Tianyu Chen, Furu Wei

CVPR 2023 Non-Contrastive Learning Meets Language-Image Pre-Training Jinghao Zhou, Li Dong, Zhe Gan, Lijuan Wang, Furu Wei

NeurIPS 2023 On the Pareto Front of Multilingual Neural Machine Translation Liang Chen, Shuming Ma, Dongdong Zhang, Furu Wei, Baobao Chang

NeurIPS 2023 Optimizing Prompts for Text-to-Image Generation Yaru Hao, Zewen Chi, Li Dong, Furu Wei

ICLR 2023 Prototypical Calibration for Few-Shot Learning of Language Models Zhixiong Han, Yaru Hao, Li Dong, Yutao Sun, Furu Wei

NeurIPS 2023 TextDiffuser: Diffusion Models as Text Painters Jingye Chen, Yupan Huang, Tengchao Lv, Lei Cui, Qifeng Chen, Furu Wei

AAAI 2023 TrOCR: Transformer-Based Optical Character Recognition with Pre-Trained Models Minghao Li, Tengchao Lv, Jingye Chen, Lei Cui, Yijuan Lu, Dinei A. F. Florêncio, Cha Zhang, Zhoujun Li, Furu Wei

ICLR 2023 Visually-Augmented Language Modeling Weizhi Wang, Li Dong, Hao Cheng, Haoyu Song, Xiaodong Liu, Xifeng Yan, Jianfeng Gao, Furu Wei

ICLRW 2023 Why Can GPT Learn In-Context? Language Models Implicitly Perform Gradient Descent as Meta-Optimizers Damai Dai, Yutao Sun, Li Dong, Yaru Hao, Shuming Ma, Zhifang Sui, Furu Wei

IJCAI 2022 A Unified Strategy for Multilingual Grammatical Error Correction with Pre-Trained Cross-Lingual Language Model Xin Sun, Tao Ge, Shuming Ma, Jingjing Li, Furu Wei, Houfeng Wang

ICLR 2022 BEiT: BERT Pre-Training of Image Transformers Hangbo Bao, Li Dong, Songhao Piao, Furu Wei

IJCAI 2022 High-Resource Language-Specific Training for Multilingual Neural Machine Translation Jian Yang, Yuwei Yin, Shuming Ma, Dongdong Zhang, Zhoujun Li, Furu Wei

NeurIPS 2022 On the Representation Collapse of Sparse Mixture of Experts Zewen Chi, Li Dong, Shaohan Huang, Damai Dai, Shuming Ma, Barun Patra, Saksham Singhal, Payal Bajaj, Xia Song, Xian-Ling Mao, Heyan Huang, Furu Wei

AAAI 2022 Sequence Level Contrastive Learning for Text Summarization Shusheng Xu, Xingxing Zhang, Yi Wu, Furu Wei

CVPR 2022 Swin Transformer V2: Scaling up Capacity and Resolution Ze Liu, Han Hu, Yutong Lin, Zhuliang Yao, Zhenda Xie, Yixuan Wei, Jia Ning, Yue Cao, Zheng Zhang, Li Dong, Furu Wei, Baining Guo

IJCAI 2022 UM4: Unified Multilingual Multiple Teacher-Student Model for Zero-Resource Neural Machine Translation Jian Yang, Yuwei Yin, Shuming Ma, Dongdong Zhang, Shuangzhi Wu, Hongcheng Guo, Zhoujun Li, Furu Wei

NeurIPS 2022 VLMo: Unified Vision-Language Pre-Training with Mixture-of-Modality-Experts Hangbo Bao, Wenhui Wang, Li Dong, Qiang Liu, Owais Khan Mohammed, Kriti Aggarwal, Subhojit Som, Songhao Piao, Furu Wei

AAAI 2021 Self-Attention Attribution: Interpreting Information Interactions Inside Transformer Yaru Hao, Li Dong, Furu Wei, Ke Xu

ICML 2021 UniSpeech: Unified Speech Representation Learning with Labeled and Unlabeled Data Chengyi Wang, Yu Wu, Yao Qian, Kenichi Kumatani, Shujie Liu, Furu Wei, Michael Zeng, Xuedong Huang

NeurIPS 2020 BERT Loses Patience: Fast and Robust Inference with Early Exit Wangchunshu Zhou, Canwen Xu, Tao Ge, Julian McAuley, Ke Xu, Furu Wei

AAAI 2020 Cross-Lingual Natural Language Generation via Pre-Training Zewen Chi, Li Dong, Furu Wei, Wenhui Wang, Xian-Ling Mao, Heyan Huang

AAAI 2020 Fact-Aware Sentence Split and Rephrase with Permutation Invariant Training Yinuo Guo, Tao Ge, Furu Wei

NeurIPS 2020 MiniLM: Deep Self-Attention Distillation for Task-Agnostic Compression of Pre-Trained Transformers Wenhui Wang, Furu Wei, Li Dong, Hangbo Bao, Nan Yang, Ming Zhou

ECCV 2020 Oscar: Object-Semantics Aligned Pre-Training for Vision-Language Tasks Xiujun Li, Xi Yin, Chunyuan Li, Pengchuan Zhang, Xiaowei Hu, Lei Zhang, Lijuan Wang, Houdong Hu, Li Dong, Furu Wei, Yejin Choi, Jianfeng Gao

ICLR 2020 Self-Adversarial Learning with Comparative Discrimination for Text Generation Wangchunshu Zhou, Tao Ge, Ke Xu, Furu Wei, Ming Zhou

ICML 2020 UniLMv2: Pseudo-Masked Language Models for Unified Language Model Pre-Training Hangbo Bao, Li Dong, Furu Wei, Wenhui Wang, Nan Yang, Xiaodong Liu, Yu Wang, Jianfeng Gao, Songhao Piao, Ming Zhou, Hsiao-Wuen Hon

ICLR 2020 VL-BERT: Pre-Training of Generic Visual-Linguistic Representations Weijie Su, Xizhou Zhu, Yue Cao, Bin Li, Lewei Lu, Furu Wei, Jifeng Dai

AAAI 2019 Dictionary-Guided Editing Networks for Paraphrase Generation Shaohan Huang, Yu Wu, Furu Wei, Zhongzhi Luan

AAAI 2019 LiveBot: Generating Live Video Comments Based on Visual and Textual Contexts Shuming Ma, Lei Cui, Damai Dai, Furu Wei, Xu Sun

AAAI 2019 Read + Verify: Machine Reading Comprehension with Unanswerable Questions Minghao Hu, Furu Wei, Yuxing Peng, Zhen Huang, Nan Yang, Dongsheng Li

AAAI 2019 Response Generation by Context-Aware Prototype Editing Yu Wu, Furu Wei, Shaohan Huang, Yunli Wang, Zhoujun Li, Ming Zhou

NeurIPS 2019 Unified Language Model Pre-Training for Natural Language Understanding and Generation Li Dong, Nan Yang, Wenhui Wang, Furu Wei, Xiaodong Liu, Yu Wang, Jianfeng Gao, Ming Zhou, Hsiao-Wuen Hon

IJCAI 2018 Attention-Fused Deep Matching Network for Natural Language Inference Chaoqun Duan, Lei Cui, Xinchi Chen, Furu Wei, Conghui Zhu, Tiejun Zhao

AAAI 2018 Faithful to the Original: Fact Aware Neural Abstractive Summarization Ziqiang Cao, Furu Wei, Wenjie Li, Sujian Li

AAAI 2018 Hierarchical Attention Flow for Multiple-Choice Reading Comprehension Haichao Zhu, Furu Wei, Bing Qin, Ting Liu

IJCAI 2018 Multiway Attention Networks for Modeling Sentence Pairs Chuanqi Tan, Furu Wei, Wenhui Wang, Weifeng Lv, Ming Zhou

IJCAI 2018 Reinforced Mnemonic Reader for Machine Reading Comprehension Minghao Hu, Yuxing Peng, Zhen Huang, Xipeng Qiu, Furu Wei, Ming Zhou

AAAI 2018 S-Net: From Answer Extraction to Answer Synthesis for Machine Reading Comprehension Chuanqi Tan, Furu Wei, Nan Yang, Bowen Du, Weifeng Lv, Ming Zhou

AAAI 2018 Sequential Copying Networks Qingyu Zhou, Nan Yang, Furu Wei, Ming Zhou

AAAI 2017 Improving Multi-Document Summarization via Text Classification Ziqiang Cao, Wenjie Li, Sujian Li, Furu Wei

AAAI 2016 TGSum: Build Tweet Guided Multi-Document Summarization Dataset Ziqiang Cao, Chengyao Chen, Wenjie Li, Sujian Li, Furu Wei, Ming Zhou

IJCAI 2016 Unsupervised Word and Dependency Path Embeddings for Aspect Term Extraction Yichun Yin, Furu Wei, Li Dong, Kaimeng Xu, Ming Zhang, Ming Zhou

IJCAI 2015 A Hybrid Neural Model for Type Classification of Entity Mentions Li Dong, Furu Wei, Hong Sun, Ming Zhou, Ke Xu

AAAI 2015 Ranking with Recursive Neural Networks and Its Application to Multi-Document Summarization Ziqiang Cao, Furu Wei, Li Dong, Sujian Li, Ming Zhou

AAAI 2014 Adaptive Multi-Compositionality for Recursive Neural Models with Applications to Sentiment Analysis Li Dong, Furu Wei, Ming Zhou, Ke Xu

AAAI 2013 The Automated Acquisition of Suggestions from Tweets Li Dong, Furu Wei, Yajuan Duan, Xiaohua Liu, Ming Zhou, Ke Xu

AAAI 2012 Collective Nominal Semantic Role Labeling for Tweets Xiaohua Liu, Zhongyang Fu, Furu Wei, Ming Zhou

AAAI 2012 Exacting Social Events for Tweets Using a Factor Graph Xiaohua Liu, Xiangyang Zhou, Zhongyang Fu, Furu Wei, Ming Zhou

AAAI 2010 Constrained Coclustering for Textual Documents Yangqiu Song, Shimei Pan, Shixia Liu, Furu Wei, Michelle X. Zhou, Weihong Qian