Shan, Ying

160 publications

ICCV 2025 AnimeGamer: Infinite Anime Life Simulation with Next Game State Prediction Junhao Cheng, Yuying Ge, Yixiao Ge, Jing Liao, Ying Shan

AAAI 2025 CustomCrafter: Customized Video Generation with Preserving Motion and Concept Composition Abilities Tao Wu, Yong Zhang, Xintao Wang, Xianpan Zhou, Guangcong Zheng, Zhongang Qi, Ying Shan, Xi Li

CVPR 2025 DI-PCG: Diffusion-Based Efficient Inverse Procedural Content Generation for High-Quality 3D Asset Creation Wang Zhao, Yan-Pei Cao, Jiale Xu, Yuejiang Dong, Ying Shan

CVPR 2025 DepthCrafter: Generating Consistent Long Depth Sequences for Open-World Videos Wenbo Hu, Xiangjun Gao, Xiaoyu Li, Sijie Zhao, Xiaodong Cun, Yong Zhang, Long Quan, Ying Shan

ICCV 2025 DepthSync: Diffusion Guidance-Based Depth Synchronization for Scale- and Geometry-Consistent Video Depth Estimation Yue-Jiang Dong, Wang Zhao, Jiale Xu, Ying Shan, Song-Hai Zhang

CVPR 2025 DiTCtrl: Exploring Attention Control in Multi-Modal Diffusion Transformer for Tuning-Free Multi-Prompt Longer Video Generation Minghong Cai, Xiaodong Cun, Xiaoyu Li, Wenze Liu, Zhaoyang Zhang, Yong Zhang, Ying Shan, Xiangyu Yue

CVPR 2025 Divot: Diffusion Powers Video Tokenizer for Comprehension and Generation Yuying Ge, Yizhuo Li, Yixiao Ge, Ying Shan

ICCV 2025 FreeSplatter: Pose-Free Gaussian Splatting for Sparse-View 3D Reconstruction Jiale Xu, Shenghua Gao, Ying Shan

ICCV 2025 GenHancer: Imperfect Generative Models Are Secretly Strong Vision-Centric Enhancers Shijie Ma, Yuying Ge, Teng Wang, Yuxin Guo, Yixiao Ge, Ying Shan

ICCV 2025 GeometryCrafter: Consistent Geometry Estimation for Open-World Videos with Diffusion Priors Tian-Xing Xu, Xiangjun Gao, Wenbo Hu, Xiaoyu Li, Song-Hai Zhang, Ying Shan

ICML 2025 HaploVL: A Single-Transformer Baseline for Multi-Modal Understanding Rui Yang, Lin Song, Yicheng Xiao, Runhui Huang, Yixiao Ge, Ying Shan, Hengshuang Zhao

AAAI 2025 Image Conductor: Precision Control for Interactive Video Synthesis Yaowei Li, Xintao Wang, Zhaoyang Zhang, Zhouxia Wang, Ziyang Yuan, Liangbin Xie, Ying Shan, Yuexian Zou

ICML 2025 LoRA-Gen: Specializing Large Language Model via Online LoRA Generation Yicheng Xiao, Lin Song, Rui Yang, Cheng Cheng, Yixiao Ge, Xiu Li, Ying Shan

ICCV 2025 Mamba-3VL: Taming State Space Model for 3D Vision Language Learning Yuan Wang, Yuxin Chen, Zhongang Qi, Lijun Liu, Jile Jiao, Xuetao Feng, Yujia Liang, Ying Shan, Zhipeng Zhang

CVPR 2025 Mani-GS: Gaussian Splatting Manipulation with Triangular Mesh Xiangjun Gao, Xiaoyu Li, Yiyu Zhuang, Qi Zhang, Wenbo Hu, Chaopeng Zhang, Yao Yao, Ying Shan, Long Quan

NeurIPS 2025 MindOmni: Unleashing Reasoning Generation in Vision Language Models with RGPO Yicheng Xiao, Lin Song, Yukang Chen, Yingmin Luo, Yuxin Chen, Yukang Gan, Wei Huang, Xiu Li, Xiaojuan Qi, Ying Shan

CVPR 2025 Mono2Stereo: A Benchmark and Empirical Study for Stereo Conversion Songsong Yu, Yuxin Chen, Zhongang Qi, Zeke Xie, Yifan Wang, Lijun Wang, Ying Shan, Huchuan Lu

ICCV 2025 Moto: Latent Motion Token as the Bridging Language for Learning Robot Manipulation from Videos Yi Chen, Yuying Ge, Weiliang Tang, Yizhuo Li, Yixiao Ge, Mingyu Ding, Ying Shan, Xihui Liu

CVPR 2025 NVComposer: Boosting Generative Novel View Synthesis with Multiple Sparse and Unposed Images Lingen Li, Zhaoyang Zhang, Yaowei Li, Jiale Xu, Wenbo Hu, Xiaoyu Li, Weihao Cheng, Jinwei Gu, Tianfan Xue, Ying Shan

ICCV 2025 Scalable Image Tokenization with Index Backpropagation Quantization Fengyuan Shi, Zhuoyan Luo, Yixiao Ge, Yujiu Yang, Ying Shan, Limin Wang

ICML 2025 Taming Rectified Flow for Inversion and Editing Jiangshan Wang, Junfu Pu, Zhongang Qi, Jiayi Guo, Yue Ma, Nisha Huang, Yuxin Chen, Xiu Li, Ying Shan

ICCV 2025 TrajectoryCrafter: Redirecting Camera Trajectory for Monocular Videos via Diffusion Models Mark Yu, Wenbo Hu, Jinbo Xing, Ying Shan

NeurIPS 2025 UniPixel: Unified Object Referring and Segmentation for Pixel-Level Visual Reasoning Ye Liu, Zongyang Ma, Junfu Pu, Zhongang Qi, Yang Wu, Ying Shan, Chang Wen Chen

ICCV 2025 VisionMath: Vision-Form Mathematical Problem-Solving Zongyang Ma, Yuxin Chen, Ziqi Zhang, Zhongang Qi, Chunfeng Yuan, Shaojie Zhu, Chengxiang Zhuo, Bing Li, Ye Liu, Zang Li, Ying Shan, Weiming Hu

AAAI 2024 A Pre-Convolved Representation for Plug-and-Play Neural Illumination Fields Yiyu Zhuang, Qi Zhang, Xuan Wang, Hao Zhu, Ying Feng, Xiaoyu Li, Ying Shan, Xun Cao

CVPR 2024 BT-Adapter: Video Conversation Is Feasible Without Video Instruction Tuning Ruyang Liu, Chen Li, Yixiao Ge, Thomas H. Li, Ying Shan, Ge Li

ECCV 2024 BrushNet: A Plug-and-Play Image Inpainting Model with Decomposed Dual-Branch Diffusion Xuan Ju, Xian Liu, Xintao Wang, Yuxuan Bian, Ying Shan, Qiang Xu

NeurIPS 2024 CV-VAE: A Compatible Video VAE for Latent Generative Video Models Sijie Zhao, Yong Zhang, Xiaodong Cun, Shaoshu Yang, Muyao Niu, Xiaoyu Li, Wenbo Hu, Ying Shan

CVPR 2024 ConTex-Human: Free-View Rendering of Human from a Single Image with Texture-Consistent Synthesis Xiangjun Gao, Xiaoyu Li, Chaopeng Zhang, Qi Zhang, Yanpei Cao, Ying Shan, Long Quan

ECCV 2024 DMiT: Deformable Mipmapped Tri-Plane Representation for Dynamic Scenes Jing-Wen Yang, Jia-Mu Sun, Yong-Liang Yang, Jie Yang, Ying Shan, Yan-Pei Cao, Lin Gao

CVPR 2024 DiffEditor: Boosting Accuracy and Flexibility on Diffusion-Based Image Editing Chong Mou, Xintao Wang, Jiechong Song, Ying Shan, Jian Zhang

ICLR 2024 DragonDiffusion: Enabling Drag-Style Manipulation on Diffusion Models Chong Mou, Xintao Wang, Jiechong Song, Ying Shan, Jian Zhang

CVPR 2024 DreamAvatar: Text-and-Shape Guided 3D Human Avatar Generation via Diffusion Models Yukang Cao, Yan-Pei Cao, Kai Han, Ying Shan, Kwan-Yee K. Wong

ECCV 2024 DreamDiffusion: High-Quality EEG-to-Image Generation with Temporal Masked Signal Modeling and CLIP Alignment Yunpeng Bai, Xintao Wang, Yan-Pei Cao, Yixiao Ge, Chun Yuan, Ying Shan

CVPR 2024 DynVideo-E: Harnessing Dynamic NeRF for Large-Scale Motion- and View-Change Human-Centric Video Editing Jia-Wei Liu, Yan-Pei Cao, Jay Zhangjie Wu, Weijia Mao, Yuchao Gu, Rui Zhao, Jussi Keppo, Ying Shan, Mike Zheng Shou

ECCV 2024 DynamiCrafter: Animating Open-Domain Images with Video Diffusion Priors Jinbo Xing, Menghan Xia, Yong Zhang, Haoxin Chen, Wangbo Yu, Hanyuan Liu, Gongye Liu, Xintao Wang, Ying Shan, Tien-Tsin Wong

NeurIPS 2024 E.T. Bench: Towards Open-Ended Event-Level Video-Language Understanding Ye Liu, Zongyang Ma, Zhongang Qi, Yang Wu, Ying Shan, Chang Wen Chen

ECCV 2024 EA-VTR: Event-Aware Video-Text Retrieval Zongyang Ma, Ziqi Zhang, Yuxin Chen, Zhongang Qi, Chunfeng Yuan, Bing Li, Yingmin Luo, Xu Li, Xiaojuan Qi, Ying Shan, Weiming Hu

CVPR 2024 EvalCrafter: Benchmarking and Evaluating Large Video Generation Models Yaofang Liu, Xiaodong Cun, Xuebo Liu, Xintao Wang, Yong Zhang, Haoxin Chen, Yang Liu, Tieyong Zeng, Raymond Chan, Ying Shan

ICLR 2024 FreeNoise: Tuning-Free Longer Video Diffusion via Noise Rescheduling Haonan Qiu, Menghan Xia, Yong Zhang, Yingqing He, Xintao Wang, Ying Shan, Ziwei Liu

CVPR 2024 GS-IR: 3D Gaussian Splatting for Inverse Rendering Zhihao Liang, Qi Zhang, Ying Feng, Ying Shan, Kui Jia

ECCV 2024 HiFi-123: Towards High-Fidelity One Image to 3D Content Generation Wangbo Yu, Li Yuan, Yan-Pei Cao, Xiangjun Gao, Xiaoyu Li, Wenbo Hu, Long Quan, Ying Shan, Yonghong Tian

CVPR 2024 How to Make Cross Encoder a Good Teacher for Efficient Image-Text Retrieval? Yuxin Chen, Zongyang Ma, Ziqi Zhang, Zhongang Qi, Chunfeng Yuan, Bing Li, Junfu Pu, Ying Shan, Xiaojuan Qi, Weiming Hu

CVPR 2024 HumanGaussian: Text-Driven 3D Human Generation with Gaussian Splatting Xian Liu, Xiaohang Zhan, Jiaxiang Tang, Ying Shan, Gang Zeng, Dahua Lin, Xihui Liu, Ziwei Liu

CVPR 2024 HumanRef: Single Image to 3D Human Generation via Reference-Guided Diffusion Jingbo Zhang, Xiaoyu Li, Qi Zhang, Yanpei Cao, Ying Shan, Jing Liao

CVPR 2024 Low-Rank Approximation for Sparse Attention in Multi-Modal LLMs Lin Song, Yukang Chen, Shuai Yang, Xiaohan Ding, Yixiao Ge, Ying-Cong Chen, Ying Shan

ECCV 2024 MOFA-Video: Controllable Image Animation via Generative Motion Field Adaptions in Frozen Image-to-Video Diffusion Model Muyao Niu, Xiaodong Cun, Xintao Wang, Yong Zhang, Ying Shan, Yinqiang Zheng

ECCV 2024 Make a Cheap Scaling: A Self-Cascade Diffusion Model for Higher-Resolution Adaptation Lanqing Guo, Yingqing He, Haoxin Chen, Menghan Xia, Xiaodong Cun, Yufei Wang, Siyu Huang, Yong Zhang, Xintao Wang, Qifeng Chen, Ying Shan, Bihan Wen

ICLR 2024 Making Llama SEE and Draw with SEED Tokenizer Yuying Ge, Sijie Zhao, Ziyun Zeng, Yixiao Ge, Chen Li, Xintao Wang, Ying Shan

NeurIPS 2024 MambaTree: Tree Topology Is All You Need in State Space Model Yicheng Xiao, Lin Song, Shaoli Huang, Jiangshan Wang, Siyu Song, Yixiao Ge, Xiu Li, Ying Shan

NeurIPS 2024 MiraData: A Large-Scale Video Dataset with Long Durations and Structured Captions Xuan Ju, Yiming Gao, Zhaoyang Zhang, Ziyang Yuan, Xintao Wang, Ailing Zeng, Yu Xiong, Qiang Xu, Ying Shan

CVPR 2024 Multimodal Pathway: Improve Transformers with Irrelevant Data from Other Modalities Yiyuan Zhang, Xiaohan Ding, Kaixiong Gong, Yixiao Ge, Ying Shan, Xiangyu Yue

ECCV 2024 Noise Calibration: Plug-and-Play Content-Preserving Video Enhancement Using Pre-Trained Video Diffusion Models Qinyu Yang, Haoxin Chen, Yong Zhang, Menghan Xia, Xiaodong Cun, Zhixun Su, Ying Shan

CVPR 2024 PhotoMaker: Customizing Realistic Human Photos via Stacked ID Embedding Zhen Li, Mingdeng Cao, Xintao Wang, Zhongang Qi, Ming-Ming Cheng, Ying Shan

CVPR 2024 Programmable Motion Generation for Open-Set Motion Control Tasks Hanchao Liu, Xiaohang Zhan, Shaoli Huang, Tai-Jiang Mu, Ying Shan

NeurIPS 2024 ReVideo: Remake a Video with Motion and Content Control Chong Mou, Mingdeng Cao, Xintao Wang, Zhaoyang Zhang, Ying Shan, Jian Zhang

CVPR 2024 Rethinking the Objectives of Vector-Quantized Tokenizers for Image Synthesis Yuchao Gu, Xintao Wang, Yixiao Ge, Ying Shan, Mike Zheng Shou

AAAI 2024 SC-NeuS: Consistent Neural Surface Reconstruction from Sparse and Noisy Views Shi-Sheng Huang, Zi-Xin Zou, Yichi Zhang, Yan-Pei Cao, Ying Shan

CVPR 2024 SEED-Bench: Benchmarking Multimodal Large Language Models Bohao Li, Yuying Ge, Yixiao Ge, Guangzhi Wang, Rui Wang, Ruimao Zhang, Ying Shan

ECCV 2024 ST-LLM: Large Language Models Are Effective Temporal Learners Ruyang Liu, Chen Li, Haoran Tang, Yixiao Ge, Ying Shan, Ge Li

ICLR 2024 ScaleCrafter: Tuning-Free Higher-Resolution Visual Generation with Diffusion Models Yingqing He, Shaoshu Yang, Haoxin Chen, Xiaodong Cun, Menghan Xia, Yong Zhang, Xintao Wang, Ran He, Qifeng Chen, Ying Shan

CVPR 2024 SmartEdit: Exploring Complex Instruction-Based Image Editing with Multimodal Large Language Models Yuzhou Huang, Liangbin Xie, Xintao Wang, Ziyang Yuan, Xiaodong Cun, Yixiao Ge, Jiantao Zhou, Chao Dong, Rui Huang, Ruimao Zhang, Ying Shan

AAAI 2024 Sparse3D: Distilling Multiview-Consistent Diffusion for Object Reconstruction from Sparse Views Zixin Zou, Weihao Cheng, Yan-Pei Cao, Shi-Sheng Huang, Ying Shan, Song-Hai Zhang

AAAI 2024 SparseGNV: Generating Novel Views of Indoor Scenes with Sparse RGB-D Images Weihao Cheng, Yan-Pei Cao, Ying Shan

AAAI 2024 SphereDiffusion: Spherical Geometry-Aware Distortion Resilient Diffusion Model Tao Wu, Xuewei Li, Zhongang Qi, Di Hu, Xintao Wang, Ying Shan, Xi Li

ECCVW 2024 Storytelling Video Generation with Retrieval Augmentation and Character Consistency Yingqing He, Menghan Xia, Haoxin Chen, Xiaodong Cun, Yuan Gong, Jinbo Xing, Yong Zhang, Xintao Wang, Chao Weng, Ying Shan, Qifeng Chen

AAAI 2024 T2I-Adapter: Learning Adapters to Dig Out More Controllable Ability for Text-to-Image Diffusion Models Chong Mou, Xintao Wang, Liangbin Xie, Yanze Wu, Jian Zhang, Zhongang Qi, Ying Shan

ICLR 2024 TapMo: Shape-Aware Motion Generation of Skeleton-Free Characters Jiaxu Zhang, Shaoli Huang, Zhigang Tu, Xin Chen, Xiaohang Zhan, Gang Yu, Ying Shan

ECCV 2024 Texture-GS: Disentangle the Geometry and Texture for 3D Gaussian Splatting Editing Tianxing Xu, Wenbo Hu, Yu-Kun Lai, Ying Shan, Song-Hai Zhang

CVPR 2024 UniRepLKNet: A Universal Perception Large-Kernel ConvNet for Audio Video Point Cloud Time-Series and Image Recognition Xiaohan Ding, Yiyuan Zhang, Yixiao Ge, Sijie Zhao, Lin Song, Xiangyu Yue, Ying Shan

CVPR 2024 ViT-Lens: Towards Omni-Modal Representations Weixian Lei, Yixiao Ge, Kun Yi, Jianfeng Zhang, Difei Gao, Dylan Sun, Yuying Ge, Ying Shan, Mike Zheng Shou

CVPR 2024 VideoCrafter2: Overcoming Data Limitations for High-Quality Video Diffusion Models Haoxin Chen, Yong Zhang, Xiaodong Cun, Menghan Xia, Xintao Wang, Chao Weng, Ying Shan

TMLR 2024 Vision-Language Instruction Tuning: A Review and Analysis Chen Li, Yixiao Ge, Dian Li, Ying Shan

CVPR 2024 YOLO-World: Real-Time Open-Vocabulary Object Detection Tianheng Cheng, Lin Song, Yixiao Ge, Wenyu Liu, Xinggang Wang, Ying Shan

ICML 2023 $\pi$-Tuning: Transferring Multimodal Foundation Models with Optimal Multi-Task Interpolation Chengyue Wu, Teng Wang, Yixiao Ge, Zeyu Lu, Ruisong Zhou, Ying Shan, Ping Luo

CVPR 2023 3D GAN Inversion with Facial Symmetry Prior Fei Yin, Yong Zhang, Xuan Wang, Tengfei Wang, Xiaoyu Li, Yuan Gong, Yanbo Fan, Xiaodong Cun, Ying Shan, Cengiz Oztireli, Yujiu Yang

CVPR 2023 Accelerating Vision-Language Pretraining with Free Language Modeling Teng Wang, Yixiao Ge, Feng Zheng, Ran Cheng, Ying Shan, Xiaohu Qie, Ping Luo

AAAI 2023 Accelerating the Training of Video Super-Resolution Models Lijian Lin, Xintao Wang, Zhongang Qi, Ying Shan

CVPR 2023 All in One: Exploring Unified Video-Language Pre-Training Jinpeng Wang, Yixiao Ge, Rui Yan, Yuying Ge, Kevin Qinghong Lin, Satoshi Tsutsui, Xudong Lin, Guanyu Cai, Jianping Wu, Ying Shan, Xiaohu Qie, Mike Zheng Shou

NeurIPS 2023 CL-NeRF: Continual Learning of Neural Radiance Fields for Evolving Scene Representation Xiuzhe Wu, Peng Dai, Weipeng Deng, Handi Chen, Yang Wu, Yan-Pei Cao, Ying Shan, Xiaojuan Qi

CVPR 2023 DPE: Disentanglement of Pose and Expression for General Video Portrait Editing Youxin Pang, Yong Zhang, Weize Quan, Yanbo Fan, Xiaodong Cun, Ying Shan, Dong-Ming Yan

AAAI 2023 Darwinian Model Upgrades: Model Evolving with Selective Compatibility Binjie Zhang, Shupeng Su, Yixiao Ge, Xuyuan Xu, Yexin Wang, Chun Yuan, Mike Zheng Shou, Ying Shan

ICML 2023 DeSRA: Detect and Delete the Artifacts of GAN-Based Real-World Super-Resolution Models Liangbin Xie, Xintao Wang, Xiangyu Chen, Gen Li, Ying Shan, Jiantao Zhou, Chao Dong

CVPR 2023 Dream3D: Zero-Shot Text-to-3D Synthesis Using 3D Shape Prior and Text-to-Image Diffusion Models Jiale Xu, Xintao Wang, Weihao Cheng, Yan-Pei Cao, Ying Shan, Xiaohu Qie, Shenghua Gao

CVPR 2023 DropMAE: Masked Autoencoders with Spatial-Attention Dropout for Tracking Tasks Qiangqiang Wu, Tianyu Yang, Ziquan Liu, Baoyuan Wu, Ying Shan, Antoni B. Chan

NeurIPS 2023 Exploiting Contextual Objects and Relations for 3D Visual Grounding Li Yang, Chunfeng Yuan, Ziqi Zhang, Zhongang Qi, Yan Xu, Wei Liu, Ying Shan, Bing Li, Weiping Yang, Peng Li, Yan Wang, Weiming Hu

ICCV 2023 Exploring Model Transferability Through the Lens of Potential Energy Xiaotong Li, Zixuan Hu, Yixiao Ge, Ying Shan, Ling-Yu Duan

ICCV 2023 FateZero: Fusing Attentions for Zero-Shot Text-Based Video Editing Chenyang Qi, Xiaodong Cun, Yong Zhang, Chenyang Lei, Xintao Wang, Ying Shan, Qifeng Chen

NeurIPS 2023 GPT4Tools: Teaching Large Language Model to Use Tools via Self-Instruction Rui Yang, Lin Song, Yanwei Li, Sijie Zhao, Yixiao Ge, Xiu Li, Ying Shan

CVPR 2023 Generating Human Motion from Textual Descriptions with Discrete Representations Jianrong Zhang, Yangsong Zhang, Xiaodong Cun, Yong Zhang, Hongwei Zhao, Hongtao Lu, Xi Shen, Ying Shan

ICCV 2023 HOSNeRF: Dynamic Human-Object-Scene Neural Radiance Fields from a Single Video Jia-Wei Liu, Yan-Pei Cao, Tianyuan Yang, Zhongcong Xu, Jussi Keppo, Ying Shan, Xiaohu Qie, Mike Zheng Shou

CVPR 2023 HRDFuse: Monocular 360deg Depth Estimation by Collaboratively Learning Holistic-with-Regional Depth Distributions Hao Ai, Zidong Cao, Yan-Pei Cao, Ying Shan, Lin Wang

CVPR 2023 High-Fidelity Facial Avatar Reconstruction from Monocular Video with Generative Priors Yunpeng Bai, Yanbo Fan, Xuan Wang, Yong Zhang, Jingxiang Sun, Chun Yuan, Ying Shan

CVPR 2023 Improved Test-Time Adaptation for Domain Generalization Liang Chen, Yong Zhang, Yibing Song, Ying Shan, Lingqiao Liu

NeurIPS 2023 Inserting Anybody in Diffusion Models via Celeb Basis Ge Yuan, Xiaodong Cun, Yong Zhang, Maomao Li, Chenyang Qi, Xintao Wang, Ying Shan, Huicheng Zheng

CVPR 2023 LayoutDiffusion: Controllable Diffusion Model for Layout-to-Image Generation Guangcong Zheng, Xianpan Zhou, Xuewei Li, Zhongang Qi, Ying Shan, Xi Li

CVPR 2023 Learning Anchor Transformations for 3D Garment Animation Fang Zhao, Zekun Li, Shaoli Huang, Junwu Weng, Tianfei Zhou, Guo-Sen Xie, Jue Wang, Ying Shan

CVPR 2023 Local-to-Global Registration for Bundle-Adjusting Neural Radiance Fields Yue Chen, Xingyu Chen, Xuan Wang, Qi Zhang, Yu Guo, Ying Shan, Fei Wang

ICCV 2023 MasaCtrl: Tuning-Free Mutual Self-Attention Control for Consistent Image Synthesis and Editing Mingdeng Cao, Xintao Wang, Zhongang Qi, Ying Shan, Xiaohu Qie, Yinqiang Zheng

ICLR 2023 Masked Image Modeling with Denoising Contrast Kun Yi, Yixiao Ge, Xiaotong Li, Shusheng Yang, Dian Li, Jianping Wu, Ying Shan, Xiaohu Qie

NeurIPS 2023 Meta-Adapter: An Online Few-Shot Learner for Vision-Language Model Cheng Cheng, Lin Song, Ruoyi Xue, Hang Wang, Hongbin Sun, Yixiao Ge, Ying Shan

AAAI 2023 Mitigating Artifacts in Real-World Video Super-Resolution Models Liangbin Xie, Xintao Wang, Shuwei Shi, Jinjin Gu, Chao Dong, Ying Shan

NeurIPS 2023 Mix-of-Show: Decentralized Low-Rank Adaptation for Multi-Concept Customization of Diffusion Models Yuchao Gu, Xintao Wang, Jay Zhangjie Wu, Yujun Shi, Yunpeng Chen, Zihan Fan, Wuyou Xiao, Rui Zhao, Shuning Chang, Weijia Wu, Yixiao Ge, Ying Shan, Mike Zheng Shou

CVPRW 2023 NTIRE 2023 Challenge on 360° Omnidirectional Image and Video Super-Resolution: Datasets, Methods and Results Mingdeng Cao, Chong Mou, Fanghua Yu, Xintao Wang, Yinqiang Zheng, Jian Zhang, Chao Dong, Gen Li, Ying Shan, Radu Timofte, Xiaopeng Sun, Weiqi Li, Zhenyu Zhang, Xuhan Sheng, Bin Chen, Haoyu Ma, Ming Cheng, Shijie Zhao, Wanwan Cui, Tianyu Xu, Chunyang Li, Long Bao, Heng Sun, Huaibo Huang, Xiaoqiang Zhou, Yuang Ai, Ran He, Renlong Wu, Yi Yang, Zhilu Zhang, Shuohao Zhang, Junyi Li, Yunjin Chen, Dongwei Ren, Wangmeng Zuo, Qian Wang, Hao-Hsiang Yang, Yi-Chung Chen, Zhi-Kai Huang, Wei-Ting Chen, Yuan-Chun Chiang, Hua-En Chang, I-Hsiang Chen, Chia-Hsuan Hsieh, Sy-Yen Kuo, Zebin Zhang, Jiaqi Zhang, Yuhui Wang, Shuhao Cui, Junshi Huang, Li Zhu, Shuman Tian, Wei Yu, Bingchun Luo

CVPR 2023 OSRT: Omnidirectional Image Super-Resolution with Distortion-Aware Transformer Fanghua Yu, Xintao Wang, Mingdeng Cao, Gen Li, Ying Shan, Chao Dong

ICCV 2023 OmniZoomer: Learning to Move and Zoom in on Sphere at High-Resolution Zidong Cao, Hao Ai, Yan-Pei Cao, Ying Shan, Xiaohu Qie, Lin Wang

ICCV 2023 Order-Prompted Tag Sequence Generation for Video Tagging Zongyang Ma, Ziqi Zhang, Yuxin Chen, Zhongang Qi, Yingmin Luo, Zekun Li, Chunfeng Yuan, Bing Li, Xiaohu Qie, Ying Shan, Weiming Hu

NeurIPS 2023 PanoGRF: Generalizable Spherical Radiance Fields for Wide-Baseline Panoramas Zheng Chen, Yan-Pei Cao, Yuan-Chen Guo, Chen Wang, Ying Shan, Song-Hai Zhang

CVPR 2023 RILS: Masked Visual Reconstruction in Language Semantic Space Shusheng Yang, Yixiao Ge, Kun Yi, Dian Li, Ying Shan, Xiaohu Qie, Xinggang Wang

IJCAI 2023 SGAT4PASS: Spherical Geometry-Aware Transformer for PAnoramic Semantic Segmentation Xuewei Li, Tao Wu, Zhongang Qi, Gaoang Wang, Ying Shan, Xi Li

CVPR 2023 SadTalker: Learning Realistic 3D Motion Coefficients for Stylized Audio-Driven Single Image Talking Face Animation Wenxuan Zhang, Xiaodong Cun, Xuan Wang, Yong Zhang, Xi Shen, Yu Guo, Ying Shan, Fei Wang

CVPR 2023 Skinned Motion Retargeting with Residual Perception of Motion Semantics & Geometry Jiaxu Zhang, Junwu Weng, Di Kang, Fang Zhao, Shaoli Huang, Xuefei Zhe, Linchao Bao, Ying Shan, Jue Wang, Zhigang Tu

ICCV 2023 Speech2Lip: High-Fidelity Speech to Lip Generation by Learning from a Short Video Xiuzhe Wu, Pengfei Hu, Yang Wu, Xiaoyang Lyu, Yan-Pei Cao, Ying Shan, Wenming Yang, Zhongqian Sun, Xiaojuan Qi

CVPR 2023 SurfelNeRF: Neural Surfel Radiance Fields for Online Photorealistic Reconstruction of Indoor Scenes Yiming Gao, Yan-Pei Cao, Ying Shan

AAAI 2023 Tagging Before Alignment: Integrating Multi-Modal Tags for Video-Text Retrieval Yizhen Chen, Jie Wang, Lijian Lin, Zhongang Qi, Jin Ma, Ying Shan

ICCV 2023 Tune-a-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation Jay Zhangjie Wu, Yixiao Ge, Xintao Wang, Stan Weixian Lei, Yuchao Gu, Yufei Shi, Wynne Hsu, Ying Shan, Xiaohu Qie, Mike Zheng Shou

ICCV 2023 Unleashing Vanilla Vision Transformer with Masked Image Modeling for Object Detection Yuxin Fang, Shusheng Yang, Shijie Wang, Yixiao Ge, Ying Shan, Xinggang Wang

CVPR 2023 ViLEM: Visual-Language Error Modeling for Image-Text Retrieval Yuxin Chen, Zongyang Ma, Ziqi Zhang, Zhongang Qi, Chunfeng Yuan, Ying Shan, Bing Li, Weiming Hu, Xiaohu Qie, Jianping Wu

AAAI 2023 What Does Your Face Sound like? 3D Face Shape Towards Voice Zhihan Yang, Zhiyong Wu, Ying Shan, Jia Jia

NeurIPS 2022 AnimeSR: Learning Real-World Super-Resolution Models for Animation Videos Yanze Wu, Xintao Wang, Gen Li, Ying Shan

CVPR 2022 BTS: A Bi-Lingual Benchmark for Text Segmentation in the Wild Xixi Xu, Zhongang Qi, Jianqi Ma, Honglun Zhang, Ying Shan, Xiaohu Qie

CVPR 2022 Bridging Video-Text Retrieval with Multiple Choice Questions Yuying Ge, Yixiao Ge, Xihui Liu, Dian Li, Ying Shan, Xiaohu Qie, Ping Luo

NeurIPS 2022 DeVRF: Fast Deformable Voxel Radiance Fields for Dynamic Scenes Jia-Wei Liu, Yan-Pei Cao, Weijia Mao, Wenqiao Zhang, David Junhao Zhang, Jussi Keppo, Ying Shan, Xiaohu Qie, Mike Zheng Shou

ICLR 2022 Dynamic Token Normalization Improves Vision Transformers Wenqi Shao, Yixiao Ge, Zhaoyang Zhang, Xuyuan Xu, Xiaogang Wang, Ying Shan, Ping Luo

ICLR 2022 Hot-Refresh Model Upgrades with Regression-Free Compatible Training in Image Retrieval Binjie Zhang, Yixiao Ge, Yantao Shen, Yu Li, Chun Yuan, Xuyuan Xu, Yexin Wang, Ying Shan

ECCV 2022 MILES: Visual BERT Pre-Training with Injected Language Semantics for Video-Text Retrieval Yuying Ge, Yixiao Ge, Xihui Liu, Jinpeng Wang, Jianping Wu, Ying Shan, Xiaohu Qie, Ping Luo

ECCV 2022 Mc-BEiT: Multi-Choice Discretization for Image BERT Pre-Training Xiaotong Li, Yixiao Ge, Kun Yi, Zixuan Hu, Ying Shan, Ling-Yu Duan

ECCV 2022 Metric Learning Based Interactive Modulation for Real-World Super-Resolution Chong Mou, Yanze Wu, Xintao Wang, Chao Dong, Jian Zhang, Ying Shan

ECCV 2022 Not All Models Are Equal: Predicting Model Transferability in a Self-Challenging Fisher Space Wenqi Shao, Xun Zhao, Yixiao Ge, Zhaoyang Zhang, Lei Yang, Xiaogang Wang, Ying Shan, Ping Luo

CVPR 2022 Object-Aware Video-Language Pre-Training for Retrieval Jinpeng Wang, Yixiao Ge, Guanyu Cai, Rui Yan, Xudong Lin, Ying Shan, Xiaohu Qie, Mike Zheng Shou

CVPR 2022 Temporally Efficient Vision Transformer for Video Instance Segmentation Shusheng Yang, Xinggang Wang, Yu Li, Yuxin Fang, Jiemin Fang, Wenyu Liu, Xun Zhao, Ying Shan

IJCAI 2022 Towards Universal Backward-Compatible Representation Learning Binjie Zhang, Yixiao Ge, Yantao Shen, Shupeng Su, Fanzi Wu, Chun Yuan, Xuyuan Xu, Yexin Wang, Ying Shan

CVPR 2022 UMT: Unified Multi-Modal Transformers for Joint Video Moment Retrieval and Highlight Detection Ye Liu, Siyuan Li, Yang Wu, Chang-Wen Chen, Ying Shan, Xiaohu Qie

ICLR 2022 Uncertainty Modeling for Out-of-Distribution Generalization Xiaotong Li, Yongxing Dai, Yixiao Ge, Jun Liu, Ying Shan, Lingyu Duan

CVPRW 2022 VFHQ: A High-Quality Dataset and Benchmark for Video Face Super-Resolution Liangbin Xie, Xintao Wang, Honglun Zhang, Chao Dong, Ying Shan

ECCV 2022 VQFR: Blind Face Restoration with Vector-Quantized Dictionary and Parallel Decoder Yuchao Gu, Xintao Wang, Liangbin Xie, Chao Dong, Gen Li, Ying Shan, Ming-Ming Cheng

ICCV 2021 Crossover Learning for Fast Online Video Instance Segmentation Shusheng Yang, Yuxin Fang, Xinggang Wang, Yu Li, Chen Fang, Ying Shan, Bin Feng, Wenyu Liu

CVPR 2021 Distilling Audio-Visual Knowledge by Compositional Contrastive Learning Yanbei Chen, Yongqin Xian, A. Sophia Koepke, Ying Shan, Zeynep Akata

ICCVW 2021 Enforcing Temporal Consistency in Video Depth Estimation Siyuan Li, Yue Luo, Ye Zhu, Xun Zhao, Yu Li, Ying Shan

NeurIPS 2021 Finding Discriminative Filters for Specific Degradations in Blind Super-Resolution Liangbin Xie, Xintao Wang, Chao Dong, Zhongang Qi, Ying Shan

ICCV 2021 Instances as Queries Yuxin Fang, Shusheng Yang, Xinggang Wang, Yu Li, Chen Fang, Ying Shan, Bin Feng, Wenyu Liu

CVPR 2021 Open-Book Video Captioning with Retrieve-Copy-Generate Network Ziqi Zhang, Zhongang Qi, Chunfeng Yuan, Ying Shan, Bing Li, Ying Deng, Weiming Hu

ICCVW 2021 Real-ESRGAN: Training Real-World Blind Super-Resolution with Pure Synthetic Data Xintao Wang, Liangbin Xie, Chao Dong, Ying Shan

CVPR 2021 Towards Real-World Blind Face Restoration with Generative Facial Prior Xintao Wang, Yu Li, Honglun Zhang, Ying Shan

ICCV 2021 Towards Vivid and Diverse Image Colorization with Generative Color Prior Yanze Wu, Xintao Wang, Yu Li, Honglun Zhang, Xun Zhao, Ying Shan

NeurIPS 2020 Detecting Interactions from Neural Networks via Topological Analysis Zirui Liu, Qingquan Song, Kaixiong Zhou, Ting-Hsiang Wang, Ying Shan, Xia Hu

ECCV 2020 Fast Video Object Segmentation Using the Global Context Module Yu Li, Zhuoran Shen, Ying Shan

IJCAI 2020 Feature Augmented Memory with Global Attention Network for VideoQA Jiayin Cai, Chun Yuan, Cheng Shi, Lei Li, Yangyang Cheng, Ying Shan

CVPR 2008 Discovering Class Specific Composite Features Through Discriminative Sampling with Swendsen-Wang Cut Feng Han, Ying Shan, Harpreet S. Sawhney, Rakesh Kumar

CVPR 2007 PEET: Prototype Embedding and Embedding Transition for Matching Vehicles over Disparate Viewpoints Yanlin Guo, Ying Shan, Harpreet S. Sawhney, Rakesh Kumar

CVPR 2006 Learning Exemplar-Based Categorization for the Detection of Multi-View Multi-Pose Objects Ying Shan, Feng Han, Harpreet S. Sawhney, Rakesh Kumar

CVPR 2005 Unsupervised Learning of Discriminative Edge Measures for Vehicle Matching Between Non-Overlapping Cameras Ying Shan, Harpreet S. Sawhney, Rakesh Kumar

CVPR 2005 Vehicle Fingerprinting for Reacquisition and Tracking in Videos Yanlin Guo, Steven C. Hsu, Ying Shan, Harpreet S. Sawhney, Rakesh Kumar

ICCV 2005 Vehicle Identification Between Non-Overlapping Cameras Without Direct Feature Matching Ying Shan, Harpreet S. Sawhney, Rakesh Kumar

CVPR 2004 Linear Model Hashing and Batch RANSAC for Rapid and Accurate Object Recognition Ying Shan, Bogdan Matei, Harpreet S. Sawhney, Rakesh Kumar, Daniel F. Huber, Martial Hebert

ECCV 2004 Partial Object Matching with Shapeme Histograms Ying Shan, Harpreet S. Sawhney, Bogdan Matei, Rakesh Kumar

ICCV 2001 Cloning Your Own Face with a Desktop Camera Zhengyou Zhang, Zicheng Liu, Dennis Adler, Michael F. Cohen, Erik Hanson, Ying Shan

CVPR 2001 Image-Based Surface Detail Transfer Ying Shan, Zicheng Liu, Zhengyou Zhang

ICCV 2001 Model-Based Bundle Adjustment with Application to Face Modeling Ying Shan, Zicheng Liu, Zhengyou Zhang

CVPR 2000 Corner Guided Curve Matching and Its Application to Scene Reconstruction Ying Shan, Zhengyou Zhang