Shi, Humphrey

76 publications

ICCV 2025 CLIP-GS: Unifying Vision-Language Representation with 3D Gaussian Splatting Siyu Jiao, Haoye Dong, Yuyang Yin, Zequn Jie, Yinlong Qian, Yao Zhao, Humphrey Shi, Yunchao Wei

ICLR 2025 ClassDiffusion: More Aligned Personalization Tuning with Explicit Class Guidance Jiannan Huang, Jun Hao Liew, Hanshu Yan, Yuyang Yin, Yao Zhao, Humphrey Shi, Yunchao Wei

CVPRW 2025 Distilling Normalizing Flows Steven Walton, Valeriy Klyukin, Maksim Artemev, Denis Derkach, Nikita Orlov, Humphrey Shi

ICLR 2025 Eagle: Exploring the Design Space for Multimodal LLMs with Mixture of Encoders Min Shi, Fuxiao Liu, Shihao Wang, Shijia Liao, Subhashree Radhakrishnan, Yilin Zhao, De-An Huang, Hongxu Yin, Karan Sapra, Yaser Yacoob, Humphrey Shi, Bryan Catanzaro, Andrew Tao, Jan Kautz, Zhiding Yu, Guilin Liu

CVPRW 2025 Efficient Image Generation with Variadic Attention Heads Steven Walton, Ali Hassani, Xingqian Xu, Zhangyang Wang, Humphrey Shi

NeurIPS 2025 Elevating Visual Perception in Multimodal LLMs with Visual Embedding Distillation Jitesh Jain, Zhengyuan Yang, Humphrey Shi, Jianfeng Gao, Jianwei Yang

CVPR 2025 Everything to the Synthetic: Diffusion-Driven Test-Time Adaptation via Synthetic-Domain Alignment Jiayi Guo, Junhao Zhao, Chaoqun Du, Yulin Wang, Chunjiang Ge, Zanlin Ni, Shiji Song, Humphrey Shi, Gao Huang

NeurIPS 2025 FlexVAR: Flexible Visual Autoregressive Modeling Without Residual Prediction Siyu Jiao, Gengwei Zhang, Yinlong Qian, Jiancheng Huang, Yao Zhao, Humphrey Shi, Lin Ma, Yunchao Wei, Zequn Jie

ICLR 2025 HD-Painter: High-Resolution and Prompt-Faithful Text-Guided Image Inpainting with Diffusion Models Hayk Manukyan, Andranik Sargsyan, Barsegh Atanyan, Zhangyang Wang, Shant Navasardyan, Humphrey Shi

ICCV 2025 HyPiDecoder: Hybrid Pixel Decoder for Efficient Segmentation and Detection Fengzhe Zhou, Humphrey Shi

ICCV 2025 IMG: Calibrating Diffusion Models via Implicit Multimodal Guidance Jiayi Guo, Chuanhao Yan, Xingqian Xu, Yulin Wang, Kai Wang, Gao Huang, Humphrey Shi

CVPR 2025 StreamingT2V: Consistent, Dynamic, and Extendable Long Video Generation from Text Roberto Henschel, Levon Khachatryan, Hayk Poghosyan, Daniil Hayrapetyan, Vahram Tadevosyan, Zhangyang Wang, Shant Navasardyan, Humphrey Shi

ICCV 2025 T2I-Copilot: A Training-Free Multi-Agent Text-to-Image System for Enhanced Prompt Interpretation and Interactive Generation Chieh-Yun Chen, Min Shi, Gong Zhang, Humphrey Shi

ECCV 2024 Benchmarking Object Detectors with COCO: A New Path Forward Shweta Singh, Aayan Yadav, Jitesh Jain, Humphrey Shi, Justin Johnson, Karan Desai

CVPR 2024 Brush2Prompt: Contextual Prompt Generator for Object Inpainting Mang Tik Chiu, Yuqian Zhou, Lingzhi Zhang, Zhe Lin, Connelly Barnes, Sohrab Amirghodsi, Eli Shechtman, Humphrey Shi

ECCV 2024 Collaborative Vision-Text Representation Optimizing for Open-Vocabulary Segmentation Siyu Jiao, Hongguang Zhu, Yunchao Wei, Yao Zhao, Jiannan Huang, Humphrey Shi

WACV 2024 Continuous Adaptation for Interactive Segmentation Using Teacher-Student Architecture Barsegh Atanyan, Levon Khachatryan, Shant Navasardyan, Yunchao Wei, Humphrey Shi

NeurIPS 2024 CuMo: Scaling Multimodal LLM with Co-Upcycled Mixture-of-Experts Jiachen Li, Xinyao Wang, Sijie Zhu, Chia-Wen Kuo, Lu Xu, Fan Chen, Jitesh Jain, Humphrey Shi, Longyin Wen

CVPRW 2024 DGBD: Depth Guided Branched Diffusion for Comprehensive Controllability in Multi-View Generation Hovhannes Margaryan, Daniil Hayrapetyan, Wenyan Cong, Zhangyang Wang, Humphrey Shi

CPAL 2024 Decoding Micromotion in Low-Dimensional Latent Spaces from StyleGAN Qiucheng Wu, Yifan Jiang, Junru Wu, Kai Wang, Eric Zhang, Humphrey Shi, Zhangyang Wang, Shiyu Chang

ECCV 2024 Diffusion for Natural Image Matting Yihan Hu, Yiheng Lin, Wei Wang, Yao Zhao, Yunchao Wei, Humphrey Shi

WACV 2024 FarSight: A Physics-Driven Whole-Body Biometric System at Large Distance and Altitude Feng Liu, Ryan Ashbaugh, Nicholas Chimitt, Najmul Hassan, Ali Hassani, Ajay Jaiswal, Minchul Kim, Zhiyuan Mao, Christopher Perry, Zhiyuan Ren, Yiyang Su, Pegah Varghaei, Kai Wang, Xingguang Zhang, Stanley Chan, Arun Ross, Humphrey Shi, Zhangyang Wang, Anil Jain, Xiaoming Liu

NeurIPS 2024 Faster Neighborhood Attention: Reducing the O(n^2) Cost of Self Attention at the Threadblock Level Ali Hassani, Wen-mei Hwu, Humphrey Shi

NeurIPS 2024 FineStyle: Fine-Grained Controllable Style Personalization for Text-to-Image Models Gong Zhang, Kihyuk Sohn, Meera Hahn, Humphrey Shi, Irfan Essa

CVPRW 2024 Forget-Me-Not: Learning to Forget in Text-to-Image Diffusion Models Gong Zhang, Kai Wang, Xingqian Xu, Zhangyang Wang, Humphrey Shi

CVPRW 2024 Matting Anything Jiachen Li, Jitesh Jain, Humphrey Shi

CVPR 2024 OpenBias: Open-Set Bias Detection in Text-to-Image Generative Models Moreno D'Incà, Elia Peruzzo, Massimiliano Mancini, Dejia Xu, Vidit Goel, Xingqian Xu, Zhangyang Wang, Humphrey Shi, Nicu Sebe

CVPR 2024 PAIR Diffusion: A Comprehensive Multimodal Object-Level Image Editor Vidit Goel, Elia Peruzzo, Yifan Jiang, Dejia Xu, Xingqian Xu, Nicu Sebe, Trevor Darrell, Zhangyang Wang, Humphrey Shi

CVPR 2024 Prompt-Free Diffusion: Taking "Text" Out of Text-to-Image Diffusion Models Xingqian Xu, Jiayi Guo, Zhangyang Wang, Gao Huang, Irfan Essa, Humphrey Shi

CVPR 2024 Smooth Diffusion: Crafting Smooth Latent Spaces in Diffusion Models Jiayi Guo, Xingqian Xu, Yifan Pu, Zanlin Ni, Chaofei Wang, Manushree Vasu, Shiji Song, Gao Huang, Humphrey Shi

ICLR 2024 Social Reward: Evaluating and Enhancing Generative AI Through Million-User Feedback from an Online Creative Community Arman Isajanyan, Artur Shatveryan, David Kocharian, Zhangyang Wang, Humphrey Shi

WACV 2024 Towards Better Structured Pruning Saliency by Reorganizing Convolution Xinglong Sun, Humphrey Shi

CVPR 2024 VCoder: Versatile Vision Encoders for Multimodal Large Language Models Jitesh Jain, Jianwei Yang, Humphrey Shi

WACV 2024 VMFormer: End-to-End Video Matting with Transformer Jiachen Li, Vidit Goel, Marianna Ohanyan, Shant Navasardyan, Yunchao Wei, Humphrey Shi

WACV 2024 Video Instance Matting Jiachen Li, Roberto Henschel, Vidit Goel, Marianna Ohanyan, Shant Navasardyan, Humphrey Shi

CVPR 2024 Zero-Painter: Training-Free Layout Control for Text-to-Image Synthesis Marianna Ohanyan, Hayk Manukyan, Zhangyang Wang, Shant Navasardyan, Humphrey Shi

CVPR 2023 Automatic High Resolution Wire Segmentation and Removal Mang Tik Chiu, Xuaner Zhang, Zijun Wei, Yuqian Zhou, Eli Shechtman, Connelly Barnes, Zhe Lin, Florian Kainz, Sohrab Amirghodsi, Humphrey Shi

AAAI 2023 Boosted Dynamic Neural Networks Haichao Yu, Haoxiang Li, Gang Hua, Gao Huang, Humphrey Shi

CVPRW 2023 ConvMLP: Hierarchical Convolutional MLPs for Vision Jiachen Li, Ali Hassani, Steven Walton, Humphrey Shi

CVPR 2023 Graph Transformer GANs for Graph-Constrained House Generation Hao Tang, Zhenyu Zhang, Humphrey Shi, Bo Li, Ling Shao, Nicu Sebe, Radu Timofte, Luc Van Gool

WACV 2023 Image Completion with Heterogeneously Filtered Spectral Hints Xingqian Xu, Shant Navasardyan, Vahram Tadevosyan, Andranik Sargsyan, Yadong Mu, Humphrey Shi

WACV 2023 Keys to Better Image Inpainting: Structure and Texture Go Hand in Hand Jitesh Jain, Yuqian Zhou, Ning Yu, Humphrey Shi

NeurIPS 2023 Learning Mask-Aware CLIP Representations for Zero-Shot Segmentation Siyu Jiao, Yunchao Wei, Yaowei Wang, Yao Zhao, Humphrey Shi

ICCV 2023 MI-GAN: A Simple Baseline for Image Inpainting on Mobile Devices Andranik Sargsyan, Shant Navasardyan, Xingqian Xu, Humphrey Shi

WACV 2023 More Control for Free! Image Synthesis with Semantic Diffusion Guidance Xihui Liu, Dong Huk Park, Samaneh Azadi, Gong Zhang, Arman Chopikyan, Yuxiao Hu, Humphrey Shi, Anna Rohrbach, Trevor Darrell

CVPR 2023 Neighborhood Attention Transformer Ali Hassani, Steven Walton, Jiachen Li, Shen Li, Humphrey Shi

CVPR 2023 OneFormer: One Transformer to Rule Universal Image Segmentation Jitesh Jain, Jiachen Li, Mang Tik Chiu, Ali Hassani, Nikita Orlov, Humphrey Shi

ICCVW 2023 SeMask: Semantically Masked Transformers for Semantic Segmentation Jitesh Jain, Anukriti Singh, Nikita Orlov, Zilong Huang, Jiachen Li, Steven Walton, Humphrey Shi

WACV 2023 Sim2RealVS: A New Benchmark for Video Stabilization with a Strong Baseline Qi Rao, Xin Yu, Shant Navasardyan, Humphrey Shi

CVPR 2023 Specialist Diffusion: Plug-and-Play Sample-Efficient Fine-Tuning of Text-to-Image Diffusion Models to Learn Any Unseen Style Haoming Lu, Hazarapet Tunanyan, Kai Wang, Shant Navasardyan, Zhangyang Wang, Humphrey Shi

ICCV 2023 Text2Video-Zero: Text-to-Image Diffusion Models Are Zero-Shot Video Generators Levon Khachatryan, Andranik Movsisyan, Vahram Tadevosyan, Roberto Henschel, Zhangyang Wang, Shant Navasardyan, Humphrey Shi

ICCV 2023 Versatile Diffusion: Text, Images and Variations All in One Diffusion Model Xingqian Xu, Zhangyang Wang, Gong Zhang, Kai Wang, Humphrey Shi

CVPRW 2023 VideoMatt: A Simple Baseline for Accessible Real-Time Video Matting Jiachen Li, Marianna Ohanyan, Vidit Goel, Shant Navasardyan, Yunchao Wei, Humphrey Shi

CVPR 2023 Zero-Shot Generative Model Adaptation via Image-Specific Prompt Learning Jiayi Guo, Chaofei Wang, You Wu, Eric Zhang, Kai Wang, Xingqian Xu, Shiji Song, Humphrey Shi, Gao Huang

CVPR 2022 AdaFocus V2: End-to-End Training of Spatial Dynamic Networks for Video Recognition Yulin Wang, Yang Yue, Yuanze Lin, Haojun Jiang, Zihang Lai, Victor Kulikov, Nikita Orlov, Humphrey Shi, Gao Huang

ECCV 2022 AdaFocusV3: On Unified Spatial-Temporal Dynamic Video Recognition Yulin Wang, Yang Yue, Xinhong Xu, Ali Hassani, Victor Kulikov, Nikita Orlov, Shiji Song, Humphrey Shi, Gao Huang

WACV 2022 Auto-X3D: Ultra-Efficient Video Understanding via Finer-Grained Neural Architecture Search Yifan Jiang, Xinyu Gong, Junru Wu, Humphrey Shi, Zhicheng Yan, Zhangyang Wang

CVPR 2022 DiSparse: Disentangled Sparsification for Multitask Model Compression Xinglong Sun, Ali Hassani, Zhangyang Wang, Gao Huang, Humphrey Shi

NeurIPS 2022 Mask Matching Transformer for Few-Shot Segmentation Siyu Jiao, Gengwei Zhang, Shant Navasardyan, Ling Chen, Yao Zhao, Yunchao Wei, Humphrey Shi

CVPR 2022 Object Localization Under Single Coarse Point Supervision Xuehui Yu, Pengfei Chen, Di Wu, Najmul Hassan, Guorong Li, Junchi Yan, Humphrey Shi, Qixiang Ye, Zhenjun Han

ECCV 2022 Point-to-Box Network for Accurate Object Detection via Single Point Supervision Pengfei Chen, Xuehui Yu, Xumeng Han, Najmul Hassan, Kai Wang, Jiachen Li, Jian Zhao, Humphrey Shi, Zhenjun Han, Qixiang Ye

ECCV 2022 SinNeRF: Training Neural Radiance Fields on Complex Scenes from a Single Image Dejia Xu, Yifan Jiang, Peihao Wang, Zhiwen Fan, Humphrey Shi, Zhangyang Wang

CVPR 2022 Towards Layer-Wise Image Vectorization Xu Ma, Yuqian Zhou, Xingqian Xu, Bin Sun, Valerii Filev, Nikita Orlov, Yun Fu, Humphrey Shi

CVPR 2022 VideoINR: Learning Video Implicit Neural Representation for Continuous Space-Time Super-Resolution Zeyuan Chen, Yinbo Chen, Jingwen Liu, Xingqian Xu, Vidit Goel, Zhangyang Wang, Humphrey Shi, Xiaolong Wang

ICCV 2021 A Multi-Mode Modulator for Multi-Domain Few-Shot Classification Yanbin Liu, Juho Lee, Linchao Zhu, Ling Chen, Humphrey Shi, Yi Yang

CVPR 2021 Adaptive Consistency Regularization for Semi-Supervised Transfer Learning Abulikemu Abuduweili, Xingjian Li, Humphrey Shi, Cheng-Zhong Xu, Dejing Dou

AAAI 2021 Any-Precision Deep Neural Networks Haichao Yu, Haoxiang Li, Humphrey Shi, Thomas S. Huang, Gang Hua

AAAI 2021 CompFeat: Comprehensive Feature Aggregation for Video Instance Segmentation Yang Fu, Linjie Yang, Ding Liu, Thomas S. Huang, Humphrey Shi

AAAI 2021 High-Resolution Deep Image Matting Haichao Yu, Ning Xu, Zilong Huang, Yuqian Zhou, Humphrey Shi

ICCV 2021 Interpretable Visual Reasoning via Induced Symbolic Space Zhonghao Wang, Kai Wang, Mo Yu, Jinjun Xiong, Wen-mei Hwu, Mark Hasegawa-Johnson, Humphrey Shi

CVPRW 2021 Is In-Domain Data Really Needed? a Pilot Study on Cross-Domain Calibration for Network Quantization Haichao Yu, Linjie Yang, Humphrey Shi

CVPR 2021 Learning to Track Instances Without Video Annotations Yang Fu, Sifei Liu, Umar Iqbal, Shalini De Mello, Humphrey Shi, Jan Kautz

CVPRW 2021 Pseudo-IoU: Improving Label Assignment in Anchor-Free Object Detection Jiachen Li, Bowen Cheng, Rogério Feris, Jinjun Xiong, Thomas S. Huang, Wen-Mei Hwu, Humphrey Shi

CVPRW 2021 RSCA: Real-Time Segmentation-Based Context-Aware Scene Text Detection Jiachen Li, Yuan Lin, Rongrong Liu, Chiu Man Ho, Humphrey Shi

CVPR 2021 Rethinking Text Segmentation: A Novel Dataset and a Text-Specific Refinement Approach Xingqian Xu, Zhifei Zhang, Zhaowen Wang, Brian Price, Zhonghao Wang, Humphrey Shi

ECCVW 2020 The 1st Tiny Object Detection Challenge: Methods and Results Xuehui Yu, Zhenjun Han, Yuqi Gong, Nan Jan, Jian Zhao, Qixiang Ye, Jie Chen, Yuan Feng, Bin Zhang, Xiaodi Wang, Ying Xin, Jingwei Liu, Mingyuan Mao, Sheng Xu, Baochang Zhang, Shumin Han, Cheng Gao, Wei Tang, Lizuo Jin, Mingbo Hong, Yuchao Yang, Shuiwang Li, Huan Luo, Qijun Zhao, Humphrey Shi