Cun, Xiaodong

37 publications

AAAI 2025 CustomTTT: Motion and Appearance Customized Video Generation via Test-Time Training Xiuli Bi, Jian Lu, Bo Liu, Xiaodong Cun, Yong Zhang, Weisheng Li, Bin Xiao

CVPR 2025 DEIM: DETR with Improved Matching for Fast Convergence Shihua Huang, Zhichao Lu, Xiaodong Cun, Yongjun Yu, Xiao Zhou, Xi Shen

CVPR 2025 DepthCrafter: Generating Consistent Long Depth Sequences for Open-World Videos Wenbo Hu, Xiangjun Gao, Xiaoyu Li, Sijie Zhao, Xiaodong Cun, Yong Zhang, Long Quan, Ying Shan

CVPR 2025 DiTCtrl: Exploring Attention Control in Multi-Modal Diffusion Transformer for Tuning-Free Multi-Prompt Longer Video Generation Minghong Cai, Xiaodong Cun, Xiaoyu Li, Wenze Liu, Zhaoyang Zhang, Yong Zhang, Ying Shan, Xiangyu Yue

WACV 2025 MagicStick: Controllable Video Editing via Control Handle Transformations Yue Ma, Xiaodong Cun, Sen Liang, Jinbo Xing, Yingqing He, Chenyang Qi, Siran Chen, Qifeng Chen

NeurIPS 2024 CV-VAE: A Compatible Video VAE for Latent Generative Video Models Sijie Zhao, Yong Zhang, Xiaodong Cun, Shaoshu Yang, Muyao Niu, Xiaoyu Li, Wenbo Hu, Ying Shan

CVPR 2024 Depth-Aware Test-Time Training for Zero-Shot Video Object Segmentation Weihuang Liu, Xi Shen, Haolun Li, Xiuli Bi, Bo Liu, Chi-Man Pun, Xiaodong Cun

CVPR 2024 EvalCrafter: Benchmarking and Evaluating Large Video Generation Models Yaofang Liu, Xiaodong Cun, Xuebo Liu, Xintao Wang, Yong Zhang, Haoxin Chen, Yang Liu, Tieyong Zeng, Raymond Chan, Ying Shan

AAAI 2024 Follow Your Pose: Pose-Guided Text-to-Video Generation Using Pose-Free Videos Yue Ma, Yingqing He, Xiaodong Cun, Xintao Wang, Siran Chen, Xiu Li, Qifeng Chen

ECCV 2024 MOFA-Video: Controllable Image Animation via Generative Motion Field Adaptions in Frozen Image-to-Video Diffusion Model Muyao Niu, Xiaodong Cun, Xintao Wang, Yong Zhang, Ying Shan, Yinqiang Zheng

ECCV 2024 Make a Cheap Scaling: A Self-Cascade Diffusion Model for Higher-Resolution Adaptation Lanqing Guo, Yingqing He, Haoxin Chen, Menghan Xia, Xiaodong Cun, Yufei Wang, Siyu Huang, Yong Zhang, Xintao Wang, Qifeng Chen, Ying Shan, Bihan Wen

CVPR 2024 Make-Your-Anchor: A Diffusion-Based 2D Avatar Generation Framework Ziyao Huang, Fan Tang, Yong Zhang, Xiaodong Cun, Juan Cao, Jintao Li, Tong-Yee Lee

ECCV 2024 Noise Calibration: Plug-and-Play Content-Preserving Video Enhancement Using Pre-Trained Video Diffusion Models Qinyu Yang, Haoxin Chen, Yong Zhang, Menghan Xia, Xiaodong Cun, Zhixun Su, Ying Shan

ICLR 2024 ScaleCrafter: Tuning-Free Higher-Resolution Visual Generation with Diffusion Models Yingqing He, Shaoshu Yang, Haoxin Chen, Xiaodong Cun, Menghan Xia, Yong Zhang, Xintao Wang, Ran He, Qifeng Chen, Ying Shan

CVPR 2024 SmartEdit: Exploring Complex Instruction-Based Image Editing with Multimodal Large Language Models Yuzhou Huang, Liangbin Xie, Xintao Wang, Ziyang Yuan, Xiaodong Cun, Yixiao Ge, Jiantao Zhou, Chao Dong, Rui Huang, Ruimao Zhang, Ying Shan

ECCVW 2024 Storytelling Video Generation with Retrieval Augmentation and Character Consistency Yingqing He, Menghan Xia, Haoxin Chen, Xiaodong Cun, Yuan Gong, Jinbo Xing, Yong Zhang, Xintao Wang, Chao Weng, Ying Shan, Qifeng Chen

CVPR 2024 VideoCrafter2: Overcoming Data Limitations for High-Quality Video Diffusion Models Haoxin Chen, Yong Zhang, Xiaodong Cun, Menghan Xia, Xintao Wang, Chao Weng, Ying Shan

CVPR 2024 X-Adapter: Adding Universal Compatibility of Plugins for Upgraded Diffusion Model Lingmin Ran, Xiaodong Cun, Jia-Wei Liu, Rui Zhao, Song Zijie, Xintao Wang, Jussi Keppo, Mike Zheng Shou

CVPR 2023 3D GAN Inversion with Facial Symmetry Prior Fei Yin, Yong Zhang, Xuan Wang, Tengfei Wang, Xiaoyu Li, Yuan Gong, Yanbo Fan, Xiaodong Cun, Ying Shan, Cengiz Oztireli, Yujiu Yang

CVPR 2023 CodeTalker: Speech-Driven 3D Facial Animation with Discrete Motion Prior Jinbo Xing, Menghan Xia, Yuechen Zhang, Xiaodong Cun, Jue Wang, Tien-Tsin Wong

AAAI 2023 CoordFill: Efficient High-Resolution Image Inpainting via Parameterized Coordinate Querying Weihuang Liu, Xiaodong Cun, Chi-Man Pun, Menghan Xia, Yong Zhang, Jue Wang

CVPR 2023 DPE: Disentanglement of Pose and Expression for General Video Portrait Editing Youxin Pang, Yong Zhang, Weize Quan, Yanbo Fan, Xiaodong Cun, Ying Shan, Dong-Ming Yan

CVPR 2023 Explicit Visual Prompting for Low-Level Structure Segmentations Weihuang Liu, Xi Shen, Chi-Man Pun, Xiaodong Cun

ICCV 2023 FateZero: Fusing Attentions for Zero-Shot Text-Based Video Editing Chenyang Qi, Xiaodong Cun, Yong Zhang, Chenyang Lei, Xintao Wang, Ying Shan, Qifeng Chen

CVPR 2023 Generating Human Motion from Textual Descriptions with Discrete Representations Jianrong Zhang, Yangsong Zhang, Xiaodong Cun, Yong Zhang, Hongwei Zhao, Hongtao Lu, Xi Shen, Ying Shan

ICCV 2023 High-Resolution Document Shadow Removal via a Large-Scale Real-World Dataset and a Frequency-Aware Shadow Erasing Net Zinuo Li, Xuhang Chen, Chi-Man Pun, Xiaodong Cun

NeurIPS 2023 Inserting Anybody in Diffusion Models via Celeb Basis Ge Yuan, Xiaodong Cun, Yong Zhang, Maomao Li, Chenyang Qi, Xintao Wang, Ying Shan, Huicheng Zheng

ICCV 2023 LivelySpeaker: Towards Semantic-Aware Co-Speech Gesture Generation Yihao Zhi, Xiaodong Cun, Xuelin Chen, Xi Shen, Wen Guo, Shaoli Huang, Shenghua Gao

CVPR 2023 SadTalker: Learning Realistic 3D Motion Coefficients for Stylized Audio-Driven Single Image Talking Face Animation Wenxuan Zhang, Xiaodong Cun, Xuan Wang, Yong Zhang, Xi Shen, Yu Guo, Ying Shan, Fei Wang

ICCV 2023 ToonTalker: Cross-Domain Face Reenactment Yuan Gong, Yong Zhang, Xiaodong Cun, Fei Yin, Yanbo Fan, Xuan Wang, Baoyuan Wu, Yujiu Yang

ECCV 2022 Spatial-Separated Curve Rendering Network for Efficient and High-Resolution Image Harmonization Jingtang Liang, Xiaodong Cun, Chi-Man Pun, Jue Wang

ECCV 2022 StyleHEAT: One-Shot High-Resolution Editable Talking Face Generation via Pre-Trained StyleGAN Fei Yin, Yong Zhang, Xiaodong Cun, Mingdeng Cao, Yanbo Fan, Xuan Wang, Qingyan Bai, Baoyuan Wu, Jue Wang, Yujiu Yang

CVPR 2022 Uformer: A General U-Shaped Transformer for Image Restoration Zhendong Wang, Xiaodong Cun, Jianmin Bao, Wengang Zhou, Jianzhuang Liu, Houqiang Li

AAAI 2021 Split Then Refine: Stacked Attention-Guided ResUNets for Blind Single Image Visible Watermark Removal Xiaodong Cun, Chi-Man Pun

ECCV 2020 Defocus Blur Detection via Depth Distillation Xiaodong Cun, Chi-Man Pun

AAAI 2020 Towards Ghost-Free Shadow Removal via Dual Hierarchical Aggregation Network and Shadow Matting GAN Xiaodong Cun, Chi-Man Pun, Cheng Shi

ECCVW 2018 Image Splicing Localization via Semi-Global Network and Fully Connected Conditional Random Fields Xiaodong Cun, Chi-Man Pun