Wang, Yaohui

26 publications

CVPR 2025 Consistent and Controllable Image Animation with Motion Diffusion Models Xin Ma, Yaohui Wang, Gengyun Jia, Xinyuan Chen, Tien-Tsin Wong, Yuan-Fang Li, Cunjian Chen

TMLR 2025 Latte: Latent Diffusion Transformer for Video Generation Xin Ma, Yaohui Wang, Xinyuan Chen, Gengyun Jia, Ziwei Liu, Yuan-Fang Li, Cunjian Chen, Yu Qiao

ICML 2025 MuLan: Adapting Multilingual Diffusion Models for Hundreds of Languages with Negligible Cost Sen Xing, Muyan Zhong, Zeqiang Lai, Liangchen Li, Jiawen Liu, Yaohui Wang, Jifeng Dai, Wenhai Wang

CVPR 2025 Ouroboros3D: Image-to-3D Generation via 3D-Aware Recursive Diffusion Hao Wen, Zehuan Huang, Yaohui Wang, Xinyuan Chen, Lu Sheng

CVPR 2025 The Devil Is in the Prompts: Retrieval-Augmented Prompt Optimization for Text-to-Video Generation Bingjie Gao, Xinyu Gao, Xiaoxue Wu, Yujie Zhou, Yu Qiao, Li Niu, Xinyuan Chen, Yaohui Wang

ICML 2025 TimeStep Master: Asymmetrical Mixture of Timestep LoRA Experts for Versatile and Efficient Diffusion Models in Vision Shaobin Zhuang, Yiwei Guo, Yanbo Ding, Kunchang Li, Xinyuan Chen, Yaohui Wang, Fangyikang Wang, Ying Zhang, Chen Li, Yali Wang

NeurIPS 2024 4Diffusion: Multi-View Video Diffusion Model for 4D Generation Haiyu Zhang, Xinyuan Chen, Yaohui Wang, Xihui Liu, Yunhong Wang, Yu Qiao

ICLR 2024 AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models Without Specific Tuning Yuwei Guo, Ceyuan Yang, Anyi Rao, Zhengyang Liang, Yaohui Wang, Yu Qiao, Maneesh Agrawala, Dahua Lin, Bo Dai

AAAI 2024 Brush Your Text: Synthesize Any Scene Text on Images via Diffusion Model Lingjun Zhang, Xinyuan Chen, Yaohui Wang, Yue Lu, Yu Qiao

AAAI 2024 ConditionVideo: Training-Free Condition-Guided Video Generation Bo Peng, Xinyuan Chen, Yaohui Wang, Chaochao Lu, Yu Qiao

CVPR 2024 EpiDiff: Enhancing Multi-View Synthesis via Localized Epipolar-Constrained Diffusion Zehuan Huang, Hao Wen, Junting Dong, Yaohui Wang, Yangguang Li, Xinyuan Chen, Yan-Pei Cao, Ding Liang, Yu Qiao, Bo Dai, Lu Sheng

WACV 2024 Hierarchical Diffusion Autoencoders and Disentangled Image Manipulation Zeyu Lu, Chengyue Wu, Xinyuan Chen, Yaohui Wang, Lei Bai, Yu Qiao, Xihui Liu

ICLR 2024 InternVid: A Large-Scale Video-Text Dataset for Multimodal Understanding and Generation Yi Wang, Yinan He, Yizhuo Li, Kunchang Li, Jiashuo Yu, Xin Ma, Xinhao Li, Guo Chen, Xinyuan Chen, Yaohui Wang, Ping Luo, Ziwei Liu, Yali Wang, Limin Wang, Yu Qiao

ICLR 2024 SEINE: Short-to-Long Video Diffusion Model for Generative Transition and Prediction Xinyuan Chen, Yaohui Wang, Lingjun Zhang, Shaobin Zhuang, Xin Ma, Jiashuo Yu, Yali Wang, Dahua Lin, Yu Qiao, Ziwei Liu

CVPR 2024 SinSR: Diffusion-Based Image Super-Resolution in a Single Step Yufei Wang, Wenhan Yang, Xinyuan Chen, Yaohui Wang, Lanqing Guo, Lap-Pui Chau, Ziwei Liu, Yu Qiao, Alex C. Kot, Bihan Wen

CVPR 2024 VBench: Comprehensive Benchmark Suite for Video Generative Models Ziqi Huang, Yinan He, Jiashuo Yu, Fan Zhang, Chenyang Si, Yuming Jiang, Yuanhan Zhang, Tianxing Wu, Qingyang Jin, Nattapol Chanpaisit, Yaohui Wang, Xinyuan Chen, Limin Wang, Dahua Lin, Yu Qiao, Ziwei Liu

CVPR 2024 Vlogger: Make Your Dream a Vlog Shaobin Zhuang, Kunchang Li, Xinyuan Chen, Yaohui Wang, Ziwei Liu, Yu Qiao, Yali Wang

ICCV 2023 LAC - Latent Action Composition for Skeleton-Based Action Segmentation Di Yang, Yaohui Wang, Antitza Dantcheva, Quan Kong, Lorenzo Garattoni, Gianpiero Francesca, Francois Bremond

ICML 2023 Long-Term Rhythmic Video Soundtracker Jiashuo Yu, Yaohui Wang, Xinyuan Chen, Xiao Sun, Yu Qiao

AAAI 2023 Self-Supervised Video Representation Learning via Latent Time Navigation Di Yang, Yaohui Wang, Quan Kong, Antitza Dantcheva, Lorenzo Garattoni, Gianpiero Francesca, François Brémond

ICLR 2022 Latent Image Animator: Learning to Animate Images via Latent Space Navigation Yaohui Wang, Di Yang, Francois Bremond, Antitza Dantcheva

CVPR 2021 Joint Generative and Contrastive Learning for Unsupervised Person Re-Identification Hao Chen, Yaohui Wang, Benoit Lagadec, Antitza Dantcheva, Francois Bremond

WACV 2021 Selective Spatio-Temporal Aggregation Based Pose Refinement System: Towards Understanding Human Activities in Real-World Videos Di Yang, Rui Dai, Yaohui Wang, Rupayan Mallick, Luca Minciullo, Gianpiero Francesca, Francois Bremond

WACV 2020 ImaGINator: Conditional Spatio-Temporal GAN for Video Generation Yaohui Wang, Piotr Bilinski, Francois Bremond, Antitza Dantcheva

ECCVW 2018 Comparing Methods for Assessment of Facial Dynamics in Patients with Major Neurocognitive Disorders Yaohui Wang, Antitza Dantcheva, Jean-Claude Broutart, Philippe Robert, François Brémond, Piotr Tadeusz Bilinski

ECCVW 2018 From Attribute-Labels to Faces: Face Generation Using a Conditional Generative Adversarial Network Yaohui Wang, Antitza Dantcheva, François Brémond