Cai, Tianle

27 publications

ICML 2025 CommVQ: Commutative Vector Quantization for KV Cache Compression Junyan Li, Yang Zhang, Muhammad Yusuf Hassan, Talha Chafekar, Tianle Cai, Zhile Ren, Pengsheng Guo, Foroozan Karimzadeh, Colorado Reed, Chong Wang, Chuang Gan

ICLRW 2025 MATH-Perturb: Benchmarking LLMs' Math Reasoning Abilities Against Hard Perturbations Kaixuan Huang, Jiacheng Guo, Zihao Li, Xiang Ji, Jiawei Ge, Wenzhe Li, Yingqing Guo, Tianle Cai, Hui Yuan, Runzhe Wang, Yue Wu, Ming Yin, Shange Tang, Yangsibo Huang, Chi Jin, Xinyun Chen, Chiyuan Zhang, Mengdi Wang

ICML 2025 MATH-Perturb: Benchmarking LLMs’ Math Reasoning Abilities Against Hard Perturbations Kaixuan Huang, Jiacheng Guo, Zihao Li, Xiang Ji, Jiawei Ge, Wenzhe Li, Yingqing Guo, Tianle Cai, Hui Yuan, Runzhe Wang, Yue Wu, Ming Yin, Shange Tang, Yangsibo Huang, Chi Jin, Xinyun Chen, Chiyuan Zhang, Mengdi Wang

NeurIPS 2025 Radial Attention: $\mathcal{O}(n\log N)$ Sparse Attention with Energy Decay for Long Video Generation Xingyang Li, Muyang Li, Tianle Cai, Haocheng Xi, Shuo Yang, Yujun Lin, Lvmin Zhang, Songlin Yang, Jinbo Hu, Kelly Peng, Maneesh Agrawala, Ion Stoica, Kurt Keutzer, Song Han

ICLR 2025 SVDQuant: Absorbing Outliers by Low-Rank Component for 4-Bit Diffusion Models Muyang Li, Yujun Lin, Zhekai Zhang, Tianle Cai, Xiuyu Li, Junxian Guo, Enze Xie, Chenlin Meng, Jun-Yan Zhu, Song Han

ICLR 2025 Training-Free Activation Sparsity in Large Language Models James Liu, Pragaash Ponnusamy, Tianle Cai, Han Guo, Yoon Kim, Ben Athiwaratkun

ICML 2025 Unnatural Languages Are Not Bugs but Features for LLMs Keyu Duan, Yiran Zhao, Zhili Feng, Jinjie Ni, Tianyu Pang, Qian Liu, Tianle Cai, Longxu Dou, Kenji Kawaguchi, Anirudh Goyal, J Zico Kolter, Michael Qizhe Shieh

ICLRW 2025 Unnatural Languages Are Not Bugs but Features for LLMs Keyu Duan, Yiran Zhao, Zhili Feng, Jinjie Ni, Tianyu Pang, Qian Liu, Tianle Cai, Longxu Dou, Kenji Kawaguchi, Anirudh Goyal, J Zico Kolter, Michael Qizhe Shieh

NeurIPS 2024 Accelerating Greedy Coordinate Gradient and General Prompt Optimization via Probe Sampling Yiran Zhao, Wenyue Zheng, Tianle Cai, Xuan Long Do, Kenji Kawaguchi, Anirudh Goyal, Michael Qizhe Shieh

NeurIPS 2024 BitDelta: Your Fine-Tune May Only Be Worth One Bit James Liu, Guangxuan Xiao, Kai Li, Jason D. Lee, Song Han, Tri Dao, Tianle Cai

CVPR 2024 DistriFusion: Distributed Parallel Inference for High-Resolution Diffusion Models Muyang Li, Tianle Cai, Jiaxin Cao, Qinsheng Zhang, Han Cai, Junjie Bai, Yangqing Jia, Kai Li, Song Han

ECCV 2024 FlexAttention for Efficient High-Resolution Vision-Language Models Junyan Li, Delin Chen, Tianle Cai, Peihao Chen, Yining Hong, Zhenfang Chen, Yikang Shen, Chuang Gan

ICLR 2024 Large Language Models as Tool Makers Tianle Cai, Xuezhi Wang, Tengyu Ma, Xinyun Chen, Denny Zhou

ICML 2024 Medusa: Simple LLM Inference Acceleration Framework with Multiple Decoding Heads Tianle Cai, Yuhong Li, Zhengyang Geng, Hongwu Peng, Jason D. Lee, Deming Chen, Tri Dao

NeurIPS 2024 SnapKV: LLM Knows What You Are Looking for Before Generation Yuhong Li, Yingbing Huang, Bowen Yang, Bharat Venkitesh, Acyr Locatelli, Hanchen Ye, Tianle Cai, Patrick Lewis, Deming Chen

ICMLW 2023 Reward Collapse in Aligning Large Language Models: A Prompt-Aware Approach to Preference Rankings Ziang Song, Tianle Cai, Jason D. Lee, Weijie J Su

ICMLW 2023 Scaling In-Context Demonstrations with Structured Attention Tianle Cai, Kaixuan Huang, Jason D. Lee, Mengdi Wang

ICLR 2023 What Makes Convolutional Models Great on Long Sequence Modeling? Yuhong Li, Tianle Cai, Yi Zhang, Deming Chen, Debadeepta Dey

ICML 2021 A Theory of Label Propagation for Subpopulation Shift Tianle Cai, Ruiqi Gao, Jason Lee, Qi Lei

NeurIPS 2021 Do Transformers Really Perform Badly for Graph Representation? Chengxuan Ying, Tianle Cai, Shengjie Luo, Shuxin Zheng, Guolin Ke, Di He, Yanming Shen, Tie-Yan Liu

ICML 2021 GraphNorm: A Principled Approach to Accelerating Graph Neural Network Training Tianle Cai, Shengjie Luo, Keyulu Xu, Di He, Tie-Yan Liu, Liwei Wang

NeurIPS 2021 Stable, Fast and Accurate: Kernelized Attention with Relative Positional Encoding Shengjie Luo, Shanda Li, Tianle Cai, Di He, Dinglan Peng, Shuxin Zheng, Guolin Ke, Liwei Wang, Tie-Yan Liu

ICML 2021 Towards Certifying L-Infinity Robustness Using Neural Networks with L-Inf-Dist Neurons Bohang Zhang, Tianle Cai, Zhou Lu, Di He, Liwei Wang

NeurIPS 2021 Towards a Theoretical Framework of Out-of-Distribution Generalization Haotian Ye, Chuanlong Xie, Tianle Cai, Ruichen Li, Zhenguo Li, Liwei Wang

NeurIPS 2020 Locally Differentially Private (Contextual) Bandits Learning Kai Zheng, Tianle Cai, Weiran Huang, Zhenguo Li, Liwei Wang

NeurIPS 2020 Sanity-Checking Pruning Methods: Random Tickets Can Win the Jackpot Jingtong Su, Yihang Chen, Tianle Cai, Tianhao Wu, Ruiqi Gao, Liwei Wang, Jason Lee

NeurIPS 2019 Convergence of Adversarial Training in Overparametrized Neural Networks Ruiqi Gao, Tianle Cai, Haochuan Li, Cho-Jui Hsieh, Liwei Wang, Jason Lee