Xu, Zukang

5 publications

ICLR 2025 MambaQuant: Quantizing the Mamba Family with Variance Aligned Rotation Methods Zukang Xu, Yuxuan Yue, Xing Hu, Dawei Yang, Zhihang Yuan, Zixu Jiang, Zhixuan Chen, JiangyongYu, Xuchen, Sifan Zhou

ICML 2025 MoEQuant: Enhancing Quantization for Mixture-of-Experts Large Language Models via Expert-Balanced Sampling and Affinity Guidance Zhixuan Chen, Xing Hu, Dawei Yang, Zukang Xu, Xu Chen, Zhihang Yuan, Sifan Zhou, Jiangyong Yu

ICLR 2025 OSTQuant: Refining Large Language Model Quantization with Orthogonal and Scaling Transformations for Better Distribution Fitting Xing Hu, Yuan Cheng, Dawei Yang, Zhixuan Chen, Zukang Xu, JiangyongYu, Xuchen, Zhihang Yuan, Zhe Jiang, Sifan Zhou

NeurIPS 2025 RSAVQ: Riemannian Sensitivity-Aware Vector Quantization for Large Language Models Zukang Xu, Xing Hu, Qiang Wu, Dawei Yang

ICML 2025 RWKVQuant: Quantizing the RWKV Family with Proxy Guided Hybrid of Scalar and Vector Quantization Chen Xu, Yuxuan Yue, Zukang Xu, Xing Hu, Jiangyong Yu, Zhixuan Chen, Sifan Zhou, Zhihang Yuan, Dawei Yang