Leng, Jingwen

10 publications

ICLR 2026 Astraea: A Token-Wise Acceleration Framework for Video Diffusion Transformers Haosong Liu, Yuge Cheng, Wenxuan Miao, Zihan Liu, Aiyue Chen, Jing Lin, Yiwu Yao, Chen Chen, Jingwen Leng, Minyi Guo, Yu Feng

ICLR 2026 DASH: Deterministic Attention Scheduling for High-Throughput Reproducible LLM Training Xinwei Qiang, Hongmin Chen, Shixuan Sun, Jingwen Leng, Xin Liu, Minyi Guo

ICML 2025 An Efficient Private GPT Never Autoregressively Decodes Zhengyi Li, Yue Guan, Kang Yang, Yu Feng, Ning Liu, Yu Yu, Jingwen Leng, Minyi Guo

NeurIPS 2025 ClusterFusion: Expanding Operator Fusion Scope for LLM Inference via Cluster-Level Collective Primitive Xinhao Luo, Zihan Liu, Yangjie Zhou, Shihan Fang, Ziyu Huang, Yu Feng, Chen Zhang, Shixuan Sun, Zhenzhe Zheng, Jingwen Leng, Minyi Guo

IJCAI 2025 TreeKV: Smooth Key-Value Cache Compression with Tree Structures Ziwei He, Jian Yuan, Haoli Bai, Jingwen Leng, Bo Jiang

NeurIPS 2025 Yggdrasil: Bridging Dynamic Speculation and Static Runtime for Latency-Optimal Tree-Based LLM Decoding Yue Guan, Changming Yu, Shihan Fang, Weiming Hu, Zaifeng Pan, Zheng Wang, Zihan Liu, Yangjie Zhou, Yufei Ding, Minyi Guo, Jingwen Leng

NeurIPS 2024 Nimbus: Secure and Efficient Two-Party Inference for Transformers Zhengyi Li, Kang Yang, Jin Tan, Wen-jie Lu, Haoqi Wu, Xiao Wang, Yu Yu, Derun Zhao, Yancheng Zheng, Minyi Guo, Jingwen Leng

AAAI 2022 Block-Skim: Efficient Question Answering for Transformer Yue Guan, Zhengyi Li, Zhouhan Lin, Yuhao Zhu, Jingwen Leng, Minyi Guo

ICLR 2022 SQuant: On-the-Fly Data-Free Quantization via Diagonal Hessian Approximation Cong Guo, Yuxian Qiu, Jingwen Leng, Xiaotian Gao, Chen Zhang, Yunxin Liu, Fan Yang, Yuhao Zhu, Minyi Guo

CVPR 2019 Adversarial Defense Through Network Profiling Based Path Extraction Yuxian Qiu, Jingwen Leng, Cong Guo, Quan Chen, Chao Li, Minyi Guo, Yuhao Zhu