Lai, Guokun

3 publications

NeurIPS 2025 MoBA: Mixture of Block Attention for Long-Context LLMs Enzhe Lu, Zhejun Jiang, Jingyuan Liu, Yulun Du, Tao Jiang, Chao Hong, Shaowei Liu, Weiran He, Enming Yuan, Yuzhi Wang, Zhiqi Huang, Huan Yuan, Suting Xu, Xinran Xu, Guokun Lai, Yanru Chen, Huabin Zheng, Junjie Yan, Jianlin Su, Yuxin Wu, Yutao Zhang, Zhilin Yang, Xinyu Zhou, Mingxing Zhang, Jiezhong Qiu

NeurIPS 2020 Funnel-Transformer: Filtering Out Sequential Redundancy for Efficient Language Processing Zihang Dai, Guokun Lai, Yiming Yang, Quoc V. Le

NeurIPS 2019 Re-Examination of the Role of Latent Variables in Sequence Modeling Guokun Lai, Zihang Dai, Yiming Yang, Shinjae Yoo