Gan, Shaoduo

3 publications

ICLR 2025 SqueezeAttention: 2D Management of KV-Cache in LLM Inference via Layer-Wise Optimal Budget Zihao Wang, Bin Cui, Shaoduo Gan

ICML 2021 1-Bit Adam: Communication Efficient Large-Scale Training with Adam’s Convergence Speed Hanlin Tang, Shaoduo Gan, Ammar Ahmad Awan, Samyam Rajbhandari, Conglong Li, Xiangru Lian, Ji Liu, Ce Zhang, Yuxiong He

NeurIPS 2018 Communication Compression for Decentralized Training Hanlin Tang, Shaoduo Gan, Ce Zhang, Tong Zhang, Ji Liu