Fu, Yao

28 publications

ICLR 2025 DuoAttention: Efficient Long-Context LLM Inference with Retrieval and Streaming Heads Guangxuan Xiao, Jiaming Tang, Jingwei Zuo, Junxian Guo, Shang Yang, Haotian Tang, Yao Fu, Song Han

NeurIPS 2025 MoE-CAP: Benchmarking Cost, Accuracy and Performance of Sparse Mixture-of-Experts Systems Yinsicheng Jiang, Yao Fu, Yeqi Huang, Ping Nie, Zhan Lu, Leyang Xue, Congjie He, Man-Kit Sit, Jilong Xue, Li Dong, Ziming Miao, DaYou Du, Tairan Xu, Kai Zou, Edoardo Ponti, Luo Mai

NeurIPS 2025 RAM-W600: A Multi-Task Wrist Dataset and Benchmark for Rheumatoid Arthritis Songxiao Yang, Haolin Wang, Yao Fu, Ye Tian, Tamotsu Kamishima, Masayuki Ikebe, Yafei Ou, Masatoshi Okutomi

ICLR 2025 Retrieval Head Mechanistically Explains Long-Context Factuality Wenhao Wu, Yizhong Wang, Guangxuan Xiao, Hao Peng, Yao Fu

NeurIPS 2024 AutoGuide: Automated Generation and Selection of Context-Aware Guidelines for Large Language Model Agents Yao Fu, Dong-Ki Kim, Jaekyeom Kim, Sungryull Sohn, Lajanugen Logeswaran, Kyunghoon Bae, Honglak Lee

ICMLW 2024 AutoGuide: Automated Generation and Selection of Context-Aware Guidelines for Large Language Model Agents Yao Fu, Dong-Ki Kim, Jaekyeom Kim, Sungryull Sohn, Lajanugen Logeswaran, Kyunghoon Bae, Honglak Lee

ICML 2024 Data Engineering for Scaling Language Models to 128k Context Yao Fu, Rameswar Panda, Xinyao Niu, Xiang Yue, Hannaneh Hajishirzi, Yoon Kim, Hao Peng

ICLR 2024 MAmmoTH: Building Math Generalist Models Through Hybrid Instruction Tuning Xiang Yue, Xingwei Qu, Ge Zhang, Yao Fu, Wenhao Huang, Huan Sun, Yu Su, Wenhu Chen

ICML 2024 OpenMoE: An Early Effort on Open Mixture-of-Experts Language Models Fuzhao Xue, Zian Zheng, Yao Fu, Jinjie Ni, Zangwei Zheng, Wangchunshu Zhou, Yang You

ICMLW 2024 SkillAct: Using Skill Abstractions Improves LLM Agents Anthony Zhe Liu, Jongwook Choi, Sungryull Sohn, Yao Fu, Jaekyeom Kim, Dong-Ki Kim, Xinhe Wang, Jaewon Yoo, Honglak Lee

NeurIPS 2023 C-Eval: A Multi-Level Multi-Discipline Chinese Evaluation Suite for Foundation Models Yuzhen Huang, Yuzhuo Bai, Zhihao Zhu, Junlei Zhang, Jinghan Zhang, Tangjun Su, Junteng Liu, Chuancheng Lv, Yikai Zhang, Jiayi Lei, Yao Fu, Maosong Sun, Junxian He

ICMLW 2023 Chain-of-Thought Hub: A Continuous Effort to Measure Large Language Models’ Reasoning Performance Yao Fu, Litu Ou, Yuhao Wan, Mingyu Chen, Hao Peng, Tushar Khot

ICLR 2023 Complexity-Based Prompting for Multi-Step Reasoning Yao Fu, Hao Peng, Ashish Sabharwal, Peter Clark, Tushar Khot

ICLR 2023 Decomposed Prompting: A Modular Approach for Solving Complex Tasks Tushar Khot, Harsh Trivedi, Matthew Finlayson, Yao Fu, Kyle Richardson, Peter Clark, Ashish Sabharwal

ICML 2023 Go Beyond Imagination: Maximizing Episodic Reachability with World Models Yao Fu, Run Peng, Honglak Lee

ICML 2023 Specializing Smaller Language Models Towards Multi-Step Reasoning Yao Fu, Hao Peng, Litu Ou, Ashish Sabharwal, Tushar Khot

NeurIPS 2023 To Repeat or Not to Repeat: Insights from Scaling LLM Under Token-Crisis Fuzhao Xue, Yao Fu, Wangchunshu Zhou, Zangwei Zheng, Yang You

MLOSS 2023 TorchOpt: An Efficient Library for Differentiable Optimization Jie Ren, Xidong Feng, Bo Liu, Xuehai Pan, Yao Fu, Luo Mai, Yaodong Yang

NeurIPSW 2022 Learning Exploration Policies with View-Based Intrinsic Rewards Yijie Guo, Yao Fu, Run Peng, Honglak Lee

NeurIPSW 2022 Learning Exploration Policies with View-Based Intrinsic Rewards Yijie Guo, Yao Fu, Run Peng, Honglak Lee

ICML 2022 Scaling Structured Inference with Randomization Yao Fu, John Cunningham, Mirella Lapata

NeurIPSW 2022 TorchOpt: An Efficient Library for Differentiable Optimization Jie Ren, Xidong Feng, Bo Liu, Xuehai Pan, Yao Fu, Luo Mai, Yaodong Yang

NeurIPS 2021 Analyzing the Confidentiality of Undistillable Teachers in Knowledge Distillation Souvik Kundu, Qirui Sun, Yao Fu, Massoud Pedram, Peter Beerel

AAAI 2021 Nested Named Entity Recognition with Partially-Observed TreeCRFs Yao Fu, Chuanqi Tan, Mosha Chen, Songfang Huang, Fei Huang

ICLR 2021 Probing BERT in Hyperbolic Spaces Boli Chen, Yao Fu, Guangwei Xu, Pengjun Xie, Chuanqi Tan, Mosha Chen, Liping Jing

ICLR 2021 Prototypical Representation Learning for Relation Extraction Ning Ding, Xiaobin Wang, Yao Fu, Guangwei Xu, Rui Wang, Pengjun Xie, Ying Shen, Fei Huang, Hai-Tao Zheng, Rui Zhang

NeurIPS 2020 Latent Template Induction with Gumbel-CRFs Yao Fu, Chuanqi Tan, Bin Bi, Mosha Chen, Yansong Feng, Alexander Rush

NeurIPS 2019 Paraphrase Generation with Latent Bag of Words Yao Fu, Yansong Feng, John P. Cunningham