Fu, Yichao

10 publications

NeurIPS 2025 Efficiently Scaling LLM Reasoning Programs with Certaindex Yichao Fu, Junda Chen, Siqi Zhu, Zheyu Fu, Zhongdongming Dai, Yonghao Zhuang, Yian Ma, Aurick Qiao, Tajana Rosing, Ion Stoica, Hao Zhang

IJCAI 2025 Mat-Instructions: A Large-Scale Inorganic Material Instruction Dataset for Large Language Models Ke Liu, Shangde Gao, Yichao Fu, Xiaoliang Wu, Shuo Tong, Ajitha Rajan, Hao Xu

ICLRW 2025 Reasoning Without Self-Doubt: More Efficient Chain-of-Thought Through Certainty Probing Yichao Fu, Junda Chen, Yonghao Zhuang, Zheyu Fu, Ion Stoica, Hao Zhang

NeurIPS 2025 Rebalancing Return Coverage for Conditional Sequence Modeling in Offline Reinforcement Learning Wensong Bai, Chufan Chen, Yichao Fu, Qihang Xu, Chao Zhang, Hui Qian

NeurIPS 2025 Scaling Speculative Decoding with Lookahead Reasoning Yichao Fu, Rui Ge, Zelei Shao, Zhijie Deng, Hao Zhang

NeurIPS 2025 Towards Generalizable Retina Vessel Segmentation with Deformable Graph Priors Ke Liu, Shangde Gao, Yichao Fu, Shangqi Gao

ICML 2024 Break the Sequential Dependency of LLM Inference Using Lookahead Decoding Yichao Fu, Peter Bailis, Ion Stoica, Hao Zhang

NeurIPS 2024 Efficient LLM Scheduling by Learning to Rank Yichao Fu, Siqi Zhu, Runlong Su, Aurick Qiao, Ion Stoica, Hao Zhang

NeurIPS 2024 ShiftAddLLM: Accelerating Pretrained LLMs via Post-Training Multiplication-Less Reparameterization Haoran You, Yipin Guo, Yichao Fu, Wei Zhou, Huihong Shi, Xiaofan Zhang, Souvik Kundu, Amir Yazdanbakhsh, Yingyan Lin

ICML 2024 When Linear Attention Meets Autoregressive Decoding: Towards More Effective and Efficient Linearized Large Language Models Haoran You, Yichao Fu, Zheng Wang, Amir Yazdanbakhsh, Yingyan Celine Lin