Cai, Han

32 publications

ICLR 2026 SANA-Video: Efficient Video Generation with Block Linear Diffusion Transformer Junsong Chen, Yuyang Zhao, Jincheng Yu, Ruihang Chu, Junyu Chen, Shuai Yang, Xianbang Wang, Yicheng Pan, Daquan Zhou, Huan Ling, Haozhe Liu, Hongwei Yi, Hao Zhang, Muyang Li, Yukang Chen, Han Cai, Sanja Fidler, Ping Luo, Song Han, Enze Xie

ICLR 2025 COAT: Compressing Optimizer States and Activations for Memory-Efficient FP8 Training Haocheng Xi, Han Cai, Ligeng Zhu, Yao Lu, Kurt Keutzer, Jianfei Chen, Song Han

ICCV 2025 DC-AE 1.5: Accelerating Diffusion Model Convergence with Structured Latent Space Junyu Chen, Dongyun Zou, Wenkun He, Junsong Chen, Enze Xie, Song Han, Han Cai

ICCV 2025 DC-AR: Efficient Masked Autoregressive Image Generation with Deep Compression Hybrid Tokenizer Yecheng Wu, Han Cai, Junyu Chen, Zhuoyang Zhang, Enze Xie, Jincheng Yu, Junsong Chen, Jinyi Hu, Yao Lu, Song Han

ICLR 2025 Deep Compression Autoencoder for Efficient High-Resolution Diffusion Models Junyu Chen, Han Cai, Junsong Chen, Enze Xie, Shang Yang, Haotian Tang, Muyang Li, Song Han

ICLR 2025 HART: Efficient Visual Generation with Hybrid Autoregressive Transformer Haotian Tang, Yecheng Wu, Shang Yang, Enze Xie, Junsong Chen, Junyu Chen, Zhuoyang Zhang, Han Cai, Yao Lu, Song Han

NeurIPS 2025 Jet-Nemotron: Efficient Language Model with Post Neural Architecture Search Yuxian Gu, Qinghao Hu, Haocheng Xi, Junyu Chen, Shang Yang, Song Han, Han Cai

ICML 2025 SANA 1.5: Efficient Scaling of Training-Time and Inference-Time Compute in Linear Diffusion Transformer Enze Xie, Junsong Chen, Yuyang Zhao, Jincheng Yu, Ligeng Zhu, Yujun Lin, Zhekai Zhang, Muyang Li, Junyu Chen, Han Cai, Bingchen Liu, Daquan Zhou, Song Han

ICCV 2025 SANA-Sprint: One-Step Diffusion with Continuous-Time Consistency Distillation Junsong Chen, Shuchen Xue, Yuyang Zhao, Jincheng Yu, Sayak Paul, Junyu Chen, Han Cai, Song Han, Enze Xie

ICLR 2025 SANA: Efficient High-Resolution Text-to-Image Synthesis with Linear Diffusion Transformers Enze Xie, Junsong Chen, Junyu Chen, Han Cai, Haotian Tang, Yujun Lin, Zhekai Zhang, Muyang Li, Ligeng Zhu, Yao Lu, Song Han

CVPR 2025 Scaling Vision Pre-Training to 4k Resolution Baifeng Shi, Boyi Li, Han Cai, Yao Lu, Sifei Liu, Marco Pavone, Jan Kautz, Song Han, Trevor Darrell, Pavlo Molchanov, Hongxu Yin

ICML 2025 Sparse Video-Gen: Accelerating Video Diffusion Transformers with Spatial-Temporal Sparsity Haocheng Xi, Shuo Yang, Yilong Zhao, Chenfeng Xu, Muyang Li, Xiuyu Li, Yujun Lin, Han Cai, Jintao Zhang, Dacheng Li, Jianfei Chen, Ion Stoica, Kurt Keutzer, Song Han

NeurIPS 2025 Sparse VideoGen2: Accelerate Video Generation with Sparse Attention via Semantic-Aware Permutation Shuo Yang, Haocheng Xi, Yilong Zhao, Muyang Li, Jintao Zhang, Han Cai, Yujun Lin, Xiuyu Li, Chenfeng Xu, Kelly Peng, Jianfei Chen, Song Han, Kurt Keutzer, Ion Stoica

NeurIPS 2025 Win Fast or Lose Slow: Balancing Speed and Accuracy in Latency-Sensitive Decisions of LLMs Hao Kang, Qingru Zhang, Han Cai, Weiyuan Xu, Tushar Krishna, Yilun Du, Tsachy Weissman

CVPR 2024 Condition-Aware Neural Network for Controlled Image Generation Han Cai, Muyang Li, Qinsheng Zhang, Ming-Yu Liu, Song Han

CVPR 2024 DistriFusion: Distributed Parallel Inference for High-Resolution Diffusion Models Muyang Li, Tianle Cai, Jiaxin Cao, Qinsheng Zhang, Han Cai, Junjie Bai, Yangqing Jia, Kai Li, Song Han

CVPRW 2024 EfficientViT-SAM: Accelerated Segment Anything Model Without Performance Loss Zhuoyang Zhang, Han Cai, Song Han

ICCV 2023 EfficientViT: Lightweight Multi-Scale Attention for High-Resolution Dense Prediction Han Cai, Junyan Li, Muyan Hu, Chuang Gan, Song Han

CVPR 2022 Lite Pose: Efficient Architecture Design for 2D Human Pose Estimation Yihan Wang, Muyang Li, Han Cai, Wei-Ming Chen, Song Han

ICLR 2022 Network Augmentation for Tiny Deep Learning Han Cai, Chuang Gan, Ji Lin, Song Han

NeurIPS 2021 Memory-Efficient Patch-Based Inference for Tiny Deep Learning Ji Lin, Wei-Ming Chen, Han Cai, Chuang Gan, Song Han

CVPR 2020 APQ: Joint Search for Network Architecture, Pruning and Quantization Policy Tianzhe Wang, Kuan Wang, Han Cai, Ji Lin, Zhijian Liu, Hanrui Wang, Yujun Lin, Song Han

ICLR 2020 Once for All: Train One Network and Specialize It for Efficient Deployment Han Cai, Chuang Gan, Tianzhe Wang, Zhekai Zhang, Song Han

NeurIPS 2020 TinyTL: Reduce Memory, Not Parameters for Efficient On-Device Learning Han Cai, Chuang Gan, Ligeng Zhu, Song Han

AAAI 2019 Large-Scale Interactive Recommendation with Tree-Structured Policy Gradient Haokun Chen, Xinyi Dai, Han Cai, Weinan Zhang, Xuejian Wang, Ruiming Tang, Yuzhou Zhang, Yong Yu

ICCVW 2019 On-Device Image Classification with Proxyless Neural Architecture Search and Quantization-Aware Fine-Tuning Han Cai, Tianzhe Wang, Zhanghao Wu, Kuan Wang, Ji Lin, Song Han

ICLR 2019 ProxylessNAS: Direct Neural Architecture Search on Target Task and Hardware Han Cai, Ligeng Zhu, Song Han

ICLR 2018 Activation Maximization Generative Adversarial Nets Zhiming Zhou, Han Cai, Shu Rong, Yuxuan Song, Kan Ren, Weinan Zhang, Jun Wang, Yong Yu

AAAI 2018 Efficient Architecture Search by Network Transformation Han Cai, Tianyao Chen, Weinan Zhang, Yong Yu, Jun Wang

AAAI 2018 Long Text Generation via Adversarial Training with Leaked Information Jiaxian Guo, Sidi Lu, Han Cai, Weinan Zhang, Yong Yu, Jun Wang

AAAI 2018 MAgent: A Many-Agent Reinforcement Learning Platform for Artificial Collective Intelligence Lianmin Zheng, Jiacheng Yang, Han Cai, Ming Zhou, Weinan Zhang, Jun Wang, Yong Yu

ICML 2018 Path-Level Network Transformation for Efficient Architecture Search Han Cai, Jiacheng Yang, Weinan Zhang, Song Han, Yong Yu