Lai, Fan

6 publications

NeurIPS 2025 Act Only When It Pays: Efficient Reinforcement Learning for LLM Reasoning via Selective Rollouts Haizhong Zheng, Yang Zhou, Brian R. Bartoldson, Bhavya Kailkhura, Fan Lai, Jiawei Zhao, Beidi Chen

NeurIPS 2025 HyGen: Efficient LLM Serving via Elastic Online-Offline Request Co-Location Ting Sun, Penghan Wang, Fan Lai

NeurIPS 2025 Inv-Entropy: A Fully Probabilistic Framework for Uncertainty Quantification in Language Models Haoyi Song, Ruihan Ji, Naichen Shi, Fan Lai, Raed Al Kontar

NeurIPS 2024 Learn to Be Efficient: Build Structured Sparsity in Large Language Models Haizhong Zheng, Xiaoyan Bai, Xueshen Liu, Z. Morley Mao, Beidi Chen, Fan Lai, Atul Prakash

ICLR 2023 Coverage-Centric Coreset Selection for High Pruning Rates Haizhong Zheng, Rui Liu, Fan Lai, Atul Prakash

ICML 2022 FedScale: Benchmarking Model and System Performance of Federated Learning at Scale Fan Lai, Yinwei Dai, Sanjay Singapuram, Jiachen Liu, Xiangfeng Zhu, Harsha Madhyastha, Mosharaf Chowdhury