Yih, Wen-Tau

32 publications

NeurIPS 2025 FlexOLMo: Open Language Models for Flexible Data Use Weijia Shi, Akshita Bhagia, Kevin Farhat, Niklas Muennighoff, Jacob Morrison, Evan Pete Walsh, Dustin Schwenk, Shayne Longpre, Jake Poznanski, Allyson Ettinger, Daogao Liu, Margaret Li, Mike Lewis, Wen-tau Yih, Dirk Groeneveld, Luca Soldaini, Kyle Lo, Noah A. Smith, Luke Zettlemoyer, Pang Wei Koh, Hannaneh Hajishirzi, Ali Farhadi, Sewon Min

NeurIPS 2025 Group-Level Data Selection for Efficient Pretraining Zichun Yu, Fei Peng, Jie Lei, Arnold Overwijk, Wen-tau Yih, Chenyan Xiong

ICML 2025 Memory Layers at Scale Vincent-Pierre Berges, Barlas Oguz, Daniel Haziza, Wen-Tau Yih, Luke Zettlemoyer, Gargi Ghosh

NeurIPS 2025 Meta CLIP 2: A Worldwide Scaling Recipe Yung-Sung Chuang, Yang Li, Dong Wang, Ching-Feng Yeh, Kehan Lyu, Ramya Raghavendra, James R. Glass, Lifei Huang, Jason E Weston, Luke Zettlemoyer, Xinlei Chen, Zhuang Liu, Saining Xie, Wen-tau Yih, Shang-Wen Li, Hu Xu

TMLR 2025 Mixture-of-Transformers: A Sparse and Scalable Architecture for Multi-Modal Foundation Models Weixin Liang, Lili Yu, Liang Luo, Srini Iyer, Ning Dong, Chunting Zhou, Gargi Ghosh, Mike Lewis, Wen-tau Yih, Luke Zettlemoyer, Xi Victoria Lin

ICLRW 2025 Mixture-of-Transformers: A Sparse and Scalable Architecture for Multi-Modal Foundation Models Weixin Liang, Lili Yu, Liang Luo, Srini Iyer, Ning Dong, Chunting Zhou, Gargi Ghosh, Mike Lewis, Wen-tau Yih, Luke Zettlemoyer, Xi Victoria Lin

ICML 2025 SelfCite: Self-Supervised Alignment for Context Attribution in Large Language Models Yung-Sung Chuang, Benjamin Cohen-Wang, Zejiang Shen, Zhaofeng Wu, Hu Xu, Xi Victoria Lin, James R. Glass, Shang-Wen Li, Wen-Tau Yih

NeurIPS 2024 CRAG - Comprehensive RAG Benchmark Xiao Yang, Kai Sun, Hao Xin, Yushi Sun, Nikita Bhalla, Xiangsen Chen, Sajal Choudhary, Rongze Daniel Gui, Ziran Will Jiang, Ziyu Jiang, Lingkun Kong, Brian Moran, Jiaqi Wang, Yifan Ethan Xu, An Yan, Chenyu Yang, Eting Yuan, Hanwen Zha, Nan Tang, Lei Chen, Nicolas Scheffer, Yue Liu, Nirav Shah, Rakesh Wanga, Anuj Kumar, Wen-tau Yih, Xin Luna Dong

NeurIPS 2024 FLAME : Factuality-Aware Alignment for Large Language Models Sheng-Chieh Lin, Luyu Gao, Barlas Oguz, Wenhan Xiong, Jimmy Lin, Wen-tau Yih, Xilun Chen

ICLR 2024 In-Context Pretraining: Language Modeling Beyond Document Boundaries Weijia Shi, Sewon Min, Maria Lomeli, Chunting Zhou, Margaret Li, Xi Victoria Lin, Noah A. Smith, Luke Zettlemoyer, Wen-tau Yih, Mike Lewis

CVPR 2024 MoDE: CLIP Data Experts via Clustering Jiawei Ma, Po-Yao Huang, Saining Xie, Shang-Wen Li, Luke Zettlemoyer, Shih-Fu Chang, Wen-Tau Yih, Hu Xu

NeurIPS 2024 Nearest Neighbor Speculative Decoding for LLM Generation and Attribution Minghan Li, Xilun Chen, Ari Holtzman, Beidi Chen, Jimmy Lin, Wen-tau Yih, Xi Victoria Lin

ICLR 2024 RA-DIT: Retrieval-Augmented Dual Instruction Tuning Xi Victoria Lin, Xilun Chen, Mingda Chen, Weijia Shi, Maria Lomeli, Richard James, Pedro Rodriguez, Jacob Kahn, Gergely Szilvasy, Mike Lewis, Luke Zettlemoyer, Wen-tau Yih

ICML 2023 Coder Reviewer Reranking for Code Generation Tianyi Zhang, Tao Yu, Tatsunori Hashimoto, Mike Lewis, Wen-Tau Yih, Daniel Fried, Sida Wang

ICML 2023 DS-1000: A Natural and Reliable Benchmark for Data Science Code Generation Yuhang Lai, Chengxi Li, Yiming Wang, Tianyi Zhang, Ruiqi Zhong, Luke Zettlemoyer, Wen-Tau Yih, Daniel Fried, Sida Wang, Tao Yu

NeurIPSW 2023 FActScore: Fine-Grained Atomic Evaluation of Factual Precision in Long Form Text Generation Sewon Min, Kalpesh Krishna, Xinxi Lyu, Mike Lewis, Wen-tau Yih, Pang Wei Koh, Mohit Iyyer, Luke Zettlemoyer, Hannaneh Hajishirzi

ICML 2023 LEVER: Learning to Verify Language-to-Code Generation with Execution Ansong Ni, Srini Iyer, Dragomir Radev, Veselin Stoyanov, Wen-Tau Yih, Sida Wang, Xi Victoria Lin

ICML 2023 Retrieval-Augmented Multimodal Language Modeling Michihiro Yasunaga, Armen Aghajanyan, Weijia Shi, Richard James, Jure Leskovec, Percy Liang, Mike Lewis, Luke Zettlemoyer, Wen-Tau Yih

NeurIPS 2020 Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks Patrick Lewis, Ethan Perez, Aleksandra Piktus, Fabio Petroni, Vladimir Karpukhin, Naman Goyal, Heinrich Küttler, Mike Lewis, Wen-tau Yih, Tim Rocktäschel, Sebastian Riedel, Douwe Kiela

ICLR 2019 FlowQA: Grasping Flow in History for Conversational Machine Comprehension Hsin-Yuan Huang, Eunsol Choi, Wen-tau Yih

AAAI 2019 QUAREL: A Dataset and Models for Answering Questions About Qualitative Relationships Oyvind Tafjord, Peter Clark, Matt Gardner, Wen-tau Yih, Ashish Sabharwal

AAAI 2018 A Knowledge-Grounded Neural Conversation Model Marjan Ghazvininejad, Chris Brockett, Ming-Wei Chang, Bill Dolan, Jianfeng Gao, Wen-tau Yih, Michel Galley

ICLR 2016 Reasoning in Vector Space: An Exploratory Study of Question Answering Moontae Lee, Xiaodong He, Wen-tau Yih, Jianfeng Gao, Li Deng, Paul Smolensky

ICLR 2015 Embedding Entities and Relations for Learning and Inference in Knowledge Bases Bishan Yang, Wen-tau Yih, Xiaodong He, Jianfeng Gao, Li Deng

IJCAI 2011 Domain Adaptation with Ensemble of Feature Groups Rajhans Samdani, Wen-tau Yih

AAAI 2007 Improving Similarity Measures for Short Segments of Text Wen-tau Yih, Christopher Meek

IJCAI 2007 Multi-Document Summarization by Maximizing Informative Content-Words Wen-tau Yih, Joshua Goodman, Lucy Vanderwende, Hisami Suzuki

ICML 2005 Integer Linear Programming Inference for Conditional Random Fields Dan Roth, Wen-tau Yih

IJCAI 2005 Learning and Inference over Constrained Output Vasin Punyakanok, Dan Roth, Wen-tau Yih, Dav Zimak

IJCAI 2005 The Necessity of Syntactic Parsing for Semantic Role Labeling Vasin Punyakanok, Dan Roth, Wen-tau Yih

IJCAI 2001 Relational Learning via Propositional Algorithms: An Information Extraction Case Study Dan Roth, Wen-tau Yih

AAAI 1997 Template-Based Information Mining from HTML Documents Jane Yung-jen Hsu, Wen-tau Yih