Chen, Zhuoen

1 publications

ICLR 2026 LycheeDecode: Accelerating Long-Context LLM Inference via Hybrid-Head Sparse Decoding Gang Lin, Dongfang Li, Zhuoen Chen, Yukun Shi, Xuhui Chen, Baotian Hu, Min Zhang