Sui, Yang

19 publications

TMLR 2026 A Survey of Token Compression for Efficient Multimodal Large Language Models Kele Shao, Keda Tao, Kejia Zhang, Sicheng Feng, Mu Cai, Yuzhang Shang, Haoxuan You, Can Qin, Yang Sui, Huan Wang

NeurIPS 2025 70% Size, 100% Accuracy: Lossless LLM Compression for Efficient GPU Inference via Dynamic-Length Float (DFloat11) Tianyi Zhang, Mohsen Hariri, Shaochen Zhong, Vipin Chaudhary, Yang Sui, Xia Hu, Anshumali Shrivastava

TMLR 2025 DisDet: Exploring Detectability of Backdoor Attack on Diffusion Models Yang Sui, Huy Phan, Jinqi Xiao, Tianfang Zhang, Zijie Tang, Cong Shi, Yan Wang, Yingying Chen, Bo Yuan

CVPR 2025 DyCoke: Dynamic Compression of Tokens for Fast Video Large Language Models Keda Tao, Can Qin, Haoxuan You, Yang Sui, Huan Wang

NeurIPS 2025 HoliTom: Holistic Token Merging for Fast Video Large Language Models Kele Shao, Keda Tao, Can Qin, Haoxuan You, Yang Sui, Huan Wang

CVPR 2025 SnapGen-V: Generating a Five-Second Video Within Five Seconds on a Mobile Device Yushu Wu, Zhixing Zhang, Yanyu Li, Yanwu Xu, Anil Kag, Yang Sui, Huseyin Coskun, Ke Ma, Aleksei Lebedev, Ju Hu, Dimitris N. Metaxas, Yanzhi Wang, Sergey Tulyakov, Jian Ren

TMLR 2025 Stop Overthinking: A Survey on Efficient Reasoning for Large Language Models Yang Sui, Yu-Neng Chuang, Guanchu Wang, Jiamu Zhang, Tianyi Zhang, Jiayi Yuan, Hongyi Liu, Andrew Wen, Shaochen Zhong, Na Zou, Hanjie Chen, Xia Hu

CVPR 2025 TopV: Compatible Token Pruning with Inference Time Optimization for Fast and Low-Memory Multimodal Vision Language Model Cheng Yang, Yang Sui, Jinqi Xiao, Lingyi Huang, Yu Gong, Chendi Li, Jinghua Yan, Yu Bai, Ponnuswamy Sadayappan, Xia Hu, Bo Yuan

NeurIPS 2024 BitsFusion: 1.99 Bits Weight Quantization of Diffusion Model Yang Sui, Yanyu Li, Anil Kag, Yerlan Idelbayev, Junli Cao, Ju Hu, Dhritiman Sagar, Bo Yuan, Sergey Tulyakov, Jian Ren

ECCV 2024 Clean & Compact: Efficient Data-Free Backdoor Defense with Model Compactness Huy Phan, Jinqi Xiao, Yang Sui, Tianfang Zhang, Zijie Tang, Cong Shi, Yan Wang, Yingying Chen, Bo Yuan

ICML 2024 Combining Experimental and Historical Data for Policy Evaluation Ting Li, Chengchun Shi, Qianglin Wen, Yang Sui, Yongli Qin, Chunbo Lai, Hongtu Zhu

ICML 2023 Adversarial Learning of Distributional Reinforcement Learning Yang Sui, Yukun Huang, Hongtu Zhu, Fan Zhou

AAAI 2023 CSTAR: Towards Compact and Structured Deep Neural Networks with Adversarial Robustness Huy Phan, Miao Yin, Yang Sui, Bo Yuan, Saman A. Zonouz

AAAI 2023 HALOC: Hardware-Aware Automatic Low-Rank Compression for Compact Neural Networks Jinqi Xiao, Chengming Zhang, Yu Gong, Miao Yin, Yang Sui, Lizhi Xiang, Dingwen Tao, Bo Yuan

NeurIPS 2023 Implicit Regularization in Over-Parameterized Support Vector Machine Yang Sui, Xin He, Yang Bai

ICMLW 2023 Reconstruction Distortion of Learned Image Compression with Imperceptible Perturbations Yang Sui, Zhuohang Li, Ding Ding, Xiang Pan, Xiaozhong Xu, Shan Liu, Zhenzhong Chen

CVPR 2022 HODEC: Towards Efficient High-Order DEcomposed Convolutional Neural Networks Miao Yin, Yang Sui, Wanzhao Yang, Xiao Zang, Yu Gong, Bo Yuan

NeurIPS 2021 CHIP: CHannel Independence-Based Pruning for Compact Neural Networks Yang Sui, Miao Yin, Yi Xie, Huy Phan, Saman Aliari Zonouz, Bo Yuan

CVPR 2021 Towards Efficient Tensor Decomposition-Based DNN Model Compression with Optimization Framework Miao Yin, Yang Sui, Siyu Liao, Bo Yuan