Li, Jonathan Lingjie

3 publications

ICLRW 2025 LLMs Know What to Drop: Self-Attention Guided KV Cache Eviction for Efficient Long-Context Inference Guangtao Wang, Shubhangi Upasani, Chen Wu, Darshan Gandhi, Jonathan Lingjie Li, Changran Hu, Bo Li, Urmish Thakker

ICLRW 2025 Training Domain Draft Models for Speculative Decoding: Best Practices and Insights Fenglu Hong, Ravi Shanker Raju, Jonathan Lingjie Li, Bo Li, Urmish Thakker, Avinash Ravichandran, Swayambhoo Jain, Changran Hu

ICLR 2021 MONGOOSE: A Learnable LSH Framework for Efficient Neural Network Training Beidi Chen, Zichang Liu, Binghui Peng, Zhaozhuo Xu, Jonathan Lingjie Li, Tri Dao, Zhao Song, Anshumali Shrivastava, Christopher Re