Han, Kai

119 publications

NeurIPS 2025 3DRS: MLLMs Need 3D-Aware Representation Supervision for Scene Understanding Xiaohu Huang, Jingjing Wu, Qunyi Xie, Kai Han

ICLR 2025 AvatarGO: Zero-Shot 4D Human-Object Interaction Generation and Animation Yukang Cao, Liang Pan, Kai Han, Kwan-Yee K. Wong, Ziwei Liu

ICLR 2025 BiGR: Harnessing Binary Latent Codes for Image Generation and Improved Visual Representation Capabilities Shaozhe Hao, Xuantong Liu, Xianbiao Qi, Shihao Zhao, Bojia Zi, Rong Xiao, Kai Han, Kwan-Yee K. Wong

WACV 2025 CusConcept: Customized Visual Concept Decomposition with Diffusion Models Zhi Xu, Shaozhe Hao, Kai Han

ICLR 2025 DebGCD: Debiased Learning with Distribution Guidance for Generalized Category Discovery Yuanpei Liu, Kai Han

CVPR 2025 Detecting Open World Objects via Partial Attribute Assignment Muli Yang, Gabriel James Goenawan, Huaiyuan Qin, Kai Han, Xi Peng, Yanhua Yang, Hongyuan Zhu

AAAI 2025 Eve: Efficient Multimodal Vision Language Models with Elastic Visual Experts Miao Rang, Zhenni Bi, Chuanjian Liu, Yehui Tang, Kai Han, Yunhe Wang

NeurIPS 2025 Fin3R: Fine-Tuning Feed-Forward 3D Reconstruction Models via Monocular Knowledge Distillation Weining Ren, Hongjun Wang, Xiao Tan, Kai Han

ICML 2025 Forest-of-Thought: Scaling Test-Time Compute for Enhancing LLM Reasoning Zhenni Bi, Kai Han, Chuanjian Liu, Yehui Tang, Yunhe Wang

ICCV 2025 GRAB: A Challenging GRaph Analysis Benchmark for Large Multimodal Models Jonathan Roberts, Kai Han, Samuel Albanie

NeurIPS 2025 GSPN-2: Efficient Parallel Sequence Modeling Hongjun Wang, Yitong Jiang, Collin McCarthy, David Wehr, Hanrong Ye, Xinhao Li, Ka Chun Cheung, Wonmin Byeon, Jinwei Gu, Ke Chen, Kai Han, Hongxu Yin, Pavlo Molchanov, Jan Kautz, Sifei Liu

ICLR 2025 HiLo: A Learning Framework for Generalized Category Discovery Robust to Domain Shifts Hongjun Wang, Sagar Vaze, Kai Han

CVPR 2025 Hyperbolic Category Discovery Yuanpei Liu, Zhenqi He, Kai Han

CVPR 2025 ICE: Intrinsic Concept Extraction from a Single Image via Diffusion Models Fernando Julio Cendra, Kai Han

ICCV 2025 Inpaint4Drag: Repurposing Inpainting Models for Drag-Based Image Editing via Bidirectional Warping Jingyi Lu, Kai Han

AAAI 2025 L-Man: A Large Multi-Modal Model Unifying Human-Centric Tasks Jialong Zuo, Ying Nie, Tianyu Guo, Huaxin Zhang, Jiahao Hong, Nong Sang, Changxin Gao, Kai Han

ICML 2025 LLM Data Selection and Utilization via Dynamic Bi-Level Optimization Yang Yu, Kai Han, Hang Zhou, Yehui Tang, Kaiqi Huang, Yunhe Wang, Dacheng Tao

ICML 2025 Mixture of Lookup Experts Shibo Jie, Yehui Tang, Kai Han, Yitong Li, Duyu Tang, Zhi-Hong Deng, Yunhe Wang

CVPR 2025 Mr. DETR: Instructive Multi-Route Training for Detection Transformers Chang-Bin Zhang, Yujie Zhong, Kai Han

ICLR 2025 Needle Threading: Can LLMs Follow Threads Through Near-Million-Scale Haystacks? Jonathan Roberts, Kai Han, Samuel Albanie

NeurIPS 2025 Panoptic Captioning: An Equivalence Bridge for Image and Text Kun-Yu Lin, Hongjun Wang, Weining Ren, Kai Han

CVPR 2025 Parallel Sequence Modeling via Generalized Spatial Propagation Network Hongjun Wang, Wonmin Byeon, Jiarui Xu, Jinwei Gu, Ka Chun Cheung, Xiaolong Wang, Kai Han, Jan Kautz, Sifei Liu

JAIR 2025 Practical Parallel Algorithms for Non-Monotone Submodular Maximization Shuang Cui, Kai Han, Jing Tang, Xueying Li, Aakas Zhiyuli, Hanxiao Li

NeurIPS 2025 SEAL: Semantic-Aware Hierarchical Learning for Generalized Category Discovery Zhenqi He, Yuanpei Liu, Kai Han

ICML 2025 SpeCache: Speculative Key-Value Caching for Efficient Generation of LLMs Shibo Jie, Yehui Tang, Kai Han, Zhi-Hong Deng, Jing Han

CVPR 2025 V-CLR: View-Consistent Learning for Open-World Instance Segmentation Chang-Bin Zhang, Jinhong Ni, Yujie Zhong, Kai Han

NeurIPS 2025 VaMP: Variational Multi-Modal Prompt Learning for Vision-Language Models Silin Cheng, Kai Han

WACV 2025 VipDiff: Towards Coherent and Diverse Video Inpainting via Training-Free Denoising Diffusion Models Chaohao Xie, Kai Han, Kwan-Yee K. Wong

NeurIPS 2025 Wukong's 72 Transformations: High-Fidelity Textured 3D Morphing via Flow Models Minghao Yin, Yukang Cao, Kai Han

ECCV 2024 Adapt Without Forgetting: Distill Proximity from Dual Teachers in Vision-Language Models Mengyu Zheng, Yehui Tang, Zhiwei Hao, Kai Han, Yunhe Wang, Chang Xu

CVPR 2024 An Empirical Study of Scaling Law for Scene Text Recognition Miao Rang, Zhenni Bi, Chuanjian Liu, Yunhe Wang, Kai Han

CVPRW 2024 Charting New Territories: Exploring the Geographic and Geospatial Capabilities of Multimodal LLMs Jonathan Roberts, Timo Lüddecke, Rehan Sheikh, Kai Han, Samuel Albanie

TMLR 2024 CiPR: An Efficient Framework with Cross-Instance Positive Relations for Generalized Category Discovery Shaozhe Hao, Kai Han, Kwan-Yee K. Wong

ECCV 2024 ConceptExpress: Harnessing Diffusion Models for Single-Image Unsupervised Concept Extraction Shaozhe Hao, Kai Han, Zhengyao Lv, Shihao Zhao, Kwan-Yee K. Wong

ICML 2024 Data-Efficient Large Vision Models Through Sequential Autoregression Zhiwei Hao, Jianyuan Guo, Chengcheng Wang, Yehui Tang, Han Wu, Han Hu, Kai Han, Chang Xu

AAAI 2024 Deletion-Robust Submodular Maximization with Knapsack Constraints Shuang Cui, Kai Han, He Huang

CVPR 2024 DreamAvatar: Text-and-Shape Guided 3D Human Avatar Generation via Diffusion Models Yukang Cao, Yan-Pei Cao, Kai Han, Ying Shan, Kwan-Yee K. Wong

ICLR 2024 FROSTER: Frozen CLIP Is a Strong Teacher for Open-Vocabulary Action Recognition Xiaohu Huang, Hao Zhou, Kun Yao, Kai Han

ICML 2024 GeminiFusion: Efficient Pixel-Wise Multimodal Fusion for Vision Transformer Ding Jia, Jianyuan Guo, Kai Han, Han Wu, Chao Zhang, Chang Xu, Xinghao Chen

CVPR 2024 IBD-SLAM: Learning Image-Based Depth Fusion for Generalizable SLAM Minghao Yin, Shangzhe Wu, Kai Han

NeurIPS 2024 Kangaroo: Lossless Self-Speculative Decoding for Accelerating LLMs via Double Early Exiting Fangcheng Liu, Yehui Tang, Zhenhua Liu, Yunsheng Ni, Duyu Tang, Kai Han, Yunhe Wang

ICML 2024 Memory-Space Visual Prompting for Efficient Vision-Language Fine-Tuning Shibo Jie, Yehui Tang, Ning Ding, Zhi-Hong Deng, Kai Han, Yunhe Wang

NeurIPS 2024 MemoryFormer : Minimize Transformer Computation by Removing Fully-Connected Layers Ning Ding, Yehui Tang, Haochen Qin, Zhenli Zhou, Chao Xu, Lin Li, Kai Han, Heng Liao, Yunhe Wang

CVPR 2024 ParameterNet: Parameters Are All You Need for Large-Scale Visual Pretraining of Mobile Networks Kai Han, Yunhe Wang, Jianyuan Guo, Enhua Wu

ECCV 2024 PromptCCD: Learning Gaussian Mixture Prompt Pool for Continual Category Discovery Fernando Julio Cendra, Bingchen Zhao, Kai Han

ECCV 2024 RegionDrag: Fast Region-Based Image Editing with Diffusion Models Jingyi Lu, Xinghui Li, Kai Han

ICML 2024 Rethinking Optimization and Architecture for Tiny Language Models Yehui Tang, Kai Han, Fangcheng Liu, Yunsheng Ni, Yuchuan Tian, Zheyuan Bai, Yi-Qi Hu, Sichao Liu, Shangling Jui, Yunhe Wang

CVPR 2024 SD4Match: Learning to Prompt Stable Diffusion Model for Semantic Matching Xinghui Li, Jingyi Lu, Kai Han, Victor Adrian Prisacariu

ICLR 2024 SPTNet: An Efficient Alternative Framework for Generalized Category Discovery with Spatial Prompt Tuning Hongjun Wang, Sagar Vaze, Kai Han

NeurIPS 2024 SciFIBench: Benchmarking Large Multimodal Models for Scientific Figure Interpretation Jonathan Roberts, Kai Han, Neil Houlsby, Samuel Albanie

NeurIPS 2024 Star-Agents: Automatic Data Optimization with LLM Agents for Instruction Tuning Hang Zhou, Yehui Tang, Haochen Qin, Yujie Yang, Renren Jin, Deyi Xiong, Kai Han, Yunhe Wang

ECCV 2024 Token Compensator: Altering Inference Cost of Vision Transformer Without Re-Tuning Shibo Jie, Yehui Tang, Jianyuan Guo, Zhi-Hong Deng, Kai Han, Yunhe Wang

ICCV 2023 Boosting Semantic Segmentation from the Perspective of Explicit Class Embeddings Yuhe Liu, Chuanjian Liu, Kai Han, Quan Tang, Zengchang Qin

TMLR 2023 Complementary Sparsity: Accelerating Sparse CNNs with High Accuracy on General-Purpose Computing Platforms Kang Zhao, Yijun Tan, Kai Han, Ting Hu, Hanting Chen, Tao Yuan, Yunhe Wang, Jun Yao

ICCV 2023 Diffusion-Based 3D Human Pose Estimation with Multi-Hypothesis Aggregation Wenkang Shan, Zhenhua Liu, Xinfeng Zhang, Zhao Wang, Kai Han, Shanshe Wang, Siwei Ma, Wen Gao

NeurIPSW 2023 GPT4GEO: How a Language Model Sees the World’s Geography Jonathan Roberts, Timo Lüddecke, Sowmen Das, Kai Han, Samuel Albanie

NeurIPS 2023 Gold-YOLO: Efficient Object Detector via Gather-and-Distribute Mechanism Chengcheng Wang, Wei He, Ying Nie, Jianyuan Guo, Chuanjian Liu, Yunhe Wang, Kai Han

NeurIPS 2023 HeadSculpt: Crafting 3D Head Avatars with Text Xiao Han, Yukang Cao, Kai Han, Xiatian Zhu, Jiankang Deng, Yi-Zhe Song, Tao Xiang, Kwan-Yee K. Wong

CVPR 2023 Learning Attention as Disentangler for Compositional Zero-Shot Learning Shaozhe Hao, Kai Han, Kwan-Yee K. Wong

ICCV 2023 Learning Semi-Supervised Gaussian Mixture Models for Generalized Category Discovery Bingchen Zhao, Xin Wen, Kai Han

CVPR 2023 Masked Image Modeling with Local Multi-Scale Reconstruction Haoqing Wang, Yehui Tang, Yunhe Wang, Jianyuan Guo, Zhi-Hong Deng, Kai Han

CVPR 2023 Network Expansion for Practical Training Acceleration Ning Ding, Yehui Tang, Kai Han, Chao Xu, Yunhe Wang

NeurIPS 2023 One-for-All: Bridge the Gap Between Heterogeneous Architectures in Knowledge Distillation Zhiwei Hao, Jianyuan Guo, Kai Han, Yehui Tang, Han Hu, Yunhe Wang, Chang Xu

ICCV 2023 Open-Vocabulary Semantic Segmentation with Decoupled One-Pass Network Cong Han, Yujie Zhong, Dengjie Li, Kai Han, Lin Ma

AAAI 2023 Practical Parallel Algorithms for Submodular Maximization Subject to a Knapsack Constraint with Nearly Optimal Adaptivity Shuang Cui, Kai Han, Jing Tang, He Huang, Xueying Li, Aakas Zhiyuli

NeurIPS 2023 Revisit the Power of Vanilla Knowledge Distillation: From Small Scale to Large Scale Zhiwei Hao, Jianyuan Guo, Kai Han, Han Hu, Chang Xu, Yunhe Wang

CVPR 2023 SeSDF: Self-Evolved Signed Distance Field for Implicit 3D Clothed Human Reconstruction Yukang Cao, Kai Han, Kwan-Yee K. Wong

NeurIPS 2023 Species196: A One-Million Semi-Supervised Dataset for Fine-Grained Species Recognition Wei He, Kai Han, Ying Nie, Chengcheng Wang, Yunhe Wang

NeurIPS 2023 Triple Eagle: Simple, Fast and Practical Budget-Feasible Mechanisms Kai Han, You Wu, He Huang, Shuang Cui

NeurIPS 2022 A Transformer-Based Object Detector with Coarse-Fine Crossing Representations Zhishan Li, Ying Nie, Kai Han, Jianyuan Guo, Lei Xie, Yunhe Wang

NeurIPS 2022 Accelerating Sparse Convolution with Column Vector-Wise Sparsity Yijun Tan, Kai Han, Kang Zhao, Xianzhi Yu, Zidong Du, Yunji Chen, Yunhe Wang, Jun Yao

CVPR 2022 An Image Patch Is a Wave: Phase-Aware Vision MLP Yehui Tang, Kai Han, Jianyuan Guo, Chang Xu, Yanxi Li, Chao Xu, Yunhe Wang

CVPR 2022 CMT: Convolutional Neural Networks Meet Vision Transformers Jianyuan Guo, Kai Han, Han Wu, Yehui Tang, Xinghao Chen, Yunhe Wang, Chang Xu

NeurIPS 2022 Chromatic Correlation Clustering, Revisited Qing Xiu, Kai Han, Jing Tang, Shuang Cui, He Huang

CVPR 2022 Generalized Category Discovery Sagar Vaze, Kai Han, Andrea Vedaldi, Andrew Zisserman

NeurIPS 2022 GhostNetV2: Enhance Cheap Operation with Long-Range Attention Yehui Tang, Kai Han, Jianyuan Guo, Chang Xu, Chao Xu, Yunhe Wang

TMLR 2022 GhostSR: Learning Ghost Features for Efficient Image Super-Resolution Ying Nie, Kai Han, Zhenhua Liu, Chuanjian Liu, Yunhe Wang

CVPR 2022 Hire-MLP: Vision MLP via Hierarchical Rearrangement Jianyuan Guo, Yehui Tang, Kai Han, Xinghao Chen, Han Wu, Chao Xu, Chang Xu, Yunhe Wang

CVPR 2022 Instance-Aware Dynamic Neural Network Quantization Zhenhua Liu, Yunhe Wang, Kai Han, Siwei Ma, Wen Gao

CVPR 2022 JIFF: Jointly-Aligned Implicit Face Function for High Quality Single View Clothed Human Reconstruction Yukang Cao, Guanying Chen, Kai Han, Wenqi Yang, Kwan-Yee K. Wong

NeurIPS 2022 Learning Efficient Vision Transformers via Fine-Grained Manifold Distillation Zhiwei Hao, Jianyuan Guo, Ding Jia, Kai Han, Yehui Tang, Chao Zhang, Han Hu, Yunhe Wang

CVPRW 2022 Network Amplification with Efficient MACs Allocation Chuanjian Liu, Kai Han, An Xiao, Ying Nie, Wei Zhang, Yunhe Wang

ECCV 2022 Novel Class Discovery Without Forgetting K J Joseph, Sujoy Paul, Gaurav Aggarwal, Soma Biswas, Piyush Rai, Kai Han, Vineeth N Balasubramanian

ICLR 2022 Open-Set Recognition: A Good Closed-Set Classifier Is All You Need Sagar Vaze, Kai Han, Andrea Vedaldi, Andrew Zisserman

CVPR 2022 Patch Slimming for Efficient Vision Transformers Yehui Tang, Kai Han, Yunhe Wang, Chang Xu, Jianyuan Guo, Chao Xu, Dacheng Tao

NeurIPS 2022 Redistribution of Weights and Activations for AdderNet Quantization Ying Nie, Kai Han, Haikang Diao, Chuanjian Liu, Enhua Wu, Yunhe Wang

CVPR 2022 SharpContour: A Contour-Based Boundary Refinement Approach for Efficient and Accurate Instance Segmentation Chenming Zhu, Xuanye Zhang, Yanran Li, Liangdong Qiu, Kai Han, Xiaoguang Han

CVPRW 2022 Spacing Loss for Discovering Novel Categories K. J. Joseph, Sujoy Paul, Gaurav Aggarwal, Soma Biswas, Piyush Rai, Kai Han, Vineeth N. Balasubramanian

ICMLW 2022 The Semantic Shift Benchmark Sagar Vaze, Kai Han, Andrea Vedaldi, Andrew Zisserman

NeurIPS 2022 Vision GNN: An Image Is Worth Graph of Nodes Kai Han, Yunhe Wang, Jianyuan Guo, Yehui Tang, Enhua Wu

NeurIPS 2021 Augmented Shortcuts for Vision Transformers Yehui Tang, Kai Han, Chang Xu, An Xiao, Yiping Deng, Chao Xu, Yunhe Wang

CVPR 2021 Contrastive Learning Based Hybrid Networks for Long-Tailed Image Classification Peng Wang, Kai Han, Xiu-Shen Wei, Lei Zhang, Lei Wang

CVPR 2021 Distilling Object Detectors via Decoupled Features Jianyuan Guo, Kai Han, Yunhe Wang, Han Wu, Xinghao Chen, Chunjing Xu, Chang Xu

NeurIPS 2021 Dynamic Resolution Network Mingjian Zhu, Kai Han, Enhua Wu, Qiulin Zhang, Ying Nie, Zhenzhong Lan, Yunhe Wang

ICCV 2021 Joint Representation Learning and Novel Category Discovery on Single- and Multi-Modal Data Xuhui Jia, Kai Han, Yukun Zhu, Bradley Green

ICCVW 2021 LSD-C: Linearly Separable Deep Clusters Sylvestre-Alvise Rebuffi, Sébastien Ehrhardt, Kai Han, Andrea Vedaldi, Andrew Zisserman

NeurIPS 2021 Learning Frequency Domain Approximation for Binary Neural Networks Yixing Xu, Kai Han, Chang Xu, Yehui Tang, Chunjing Xu, Yunhe Wang

NeurIPS 2021 Novel Visual Category Discovery with Dual Ranking Statistics and Mutual Knowledge Distillation Bingchen Zhao, Kai Han

CVPR 2021 Positive-Unlabeled Data Purification in the Wild for Object Detection Jianyuan Guo, Kai Han, Han Wu, Chao Zhang, Xinghao Chen, Chunjing Xu, Chang Xu, Yunhe Wang

NeurIPS 2021 Post-Training Quantization for Vision Transformer Zhenhua Liu, Yunhe Wang, Kai Han, Wei Zhang, Siwei Ma, Wen Gao

ICML 2021 Randomized Algorithms for Submodular Function Maximization with a $k$-System Constraint Shuang Cui, Kai Han, Tianshuai Zhu, Jing Tang, Benwei Wu, He Huang

CVPR 2021 ReNAS: Relativistic Evaluation of Neural Architecture Search Yixing Xu, Yunhe Wang, Kai Han, Yehui Tang, Shangling Jui, Chunjing Xu, Chang Xu

NeurIPS 2021 Transformer in Transformer Kai Han, An Xiao, Enhua Wu, Jianyuan Guo, Chunjing Xu, Yunhe Wang

ICLR 2020 Automatically Discovering and Learning New Visual Categories with Ranking Statistics Kai Han, Sylvestre-Alvise Rebuffi, Sebastien Ehrhardt, Andrea Vedaldi, Andrew Zisserman

NeurIPS 2020 Deterministic Approximation for Submodular Maximization over a Matroid in Nearly Linear Time Kai Han, Zongmai Cao, Shuang Cui, Benwei Wu

NeurIPS 2020 Dual-Resolution Correspondence Networks Xinghui Li, Kai Han, Shuda Li, Victor Prisacariu

NeurIPS 2020 Model Rubik’s Cube: Twisting Resolution, Depth and Width for TinyNets Kai Han, Yunhe Wang, Qiulin Zhang, Wei Zhang, Chunjing Xu, Tong Zhang

NeurIPS 2020 Searching for Low-Bit Weights in Quantized Neural Networks Zhaohui Yang, Yunhe Wang, Kai Han, Chunjing Xu, Chao Xu, Dacheng Tao, Chang Xu

CVPRW 2020 Semi-Supervised Learning with Scarce Annotations Sylvestre-Alvise Rebuffi, Sébastien Ehrhardt, Kai Han, Andrea Vedaldi, Andrew Zisserman

ICML 2020 Training Binary Neural Networks Through Learning with Noisy Supervision Kai Han, Yunhe Wang, Yixing Xu, Chunjing Xu, Enhua Wu, Chang Xu

IJCAI 2019 Attribute Aware Pooling for Pedestrian Attribute Recognition Kai Han, Yunhe Wang, Han Shu, Chuanjian Liu, Chunjing Xu, Chang Xu

IJCAI 2019 Learning Instance-Wise Sparsity for Accelerating Deep Models Chuanjian Liu, Yunhe Wang, Kai Han, Chunjing Xu, Chang Xu

NeurIPS 2019 Positive-Unlabeled Compression on the Cloud Yixing Xu, Yunhe Wang, Hanting Chen, Kai Han, Chunjing Xu, Dacheng Tao, Chang Xu

ICCVW 2019 Searching for Accurate Binary Neural Architectures Mingzhu Shen, Kai Han, Chunjing Xu, Yunhe Wang

NeurIPS 2018 Greedy Hash: Towards Fast Optimization for Accurate Hash Coding in CNN Shupeng Su, Chao Zhang, Kai Han, Yonghong Tian

ECCV 2018 PS-FCN: A Flexible Learning Framework for Photometric Stereo Guanying Chen, Kai Han, Kwan-Yee K. Wong

ICCV 2017 SCNet: Learning Semantic Correspondence Kai Han, Rafael S. Rezende, Bumsub Ham, Kwan-Yee K. Wong, Minsu Cho, Cordelia Schmid, Jean Ponce

CVPR 2016 Mirror Surface Reconstruction Under an Uncalibrated Camera Kai Han, Kwan-Yee K. Wong, Dirk Schnieders, Miaomiao Liu

CVPR 2015 A Fixed Viewpoint Approach for Dense Reconstruction of Transparent Objects Kai Han, Kwan-Yee K. Wong, Miaomiao Liu