Zheng, Xuegui

1 publications

ICLR 2026 FlexLinearAttention: Compiling a Unified Abstraction into Scalable Kernels for Linear Attention Haojie Duanmu, Size Zheng, Ningxin Zheng, Jianqiao Lu, Xuegui Zheng, Xingcheng Zhang, Li-Wen Chang, Xin Liu, Dahua Lin