Zhang, Shiwei

37 publications

ICLR 2025 Animate-X: Universal Character Image Animation with Enhanced Motion Representation Shuai Tan, Biao Gong, Xiang Wang, Shiwei Zhang, DanDan Zheng, Ruobing Zheng, Kecheng Zheng, Jingdong Chen, Ming Yang

ICCV 2025 CountSE: Soft Exemplar Open-Set Object Counting Shuai Liu, Peng Zhang, Shiwei Zhang, Wei Ke

ICCV 2025 DreamRelation: Relation-Centric Video Customization Yujie Wei, Shiwei Zhang, Hangjie Yuan, Biao Gong, Longxiang Tang, Xiang Wang, Haonan Qiu, Hengjia Li, Shuai Tan, Yingya Zhang, Hongming Shan

ICCV 2025 Enhancing Zero-Shot Object Counting via Text-Guided Local Ranking and Number-Evoked Global Attention Shiwei Zhang, Qi Zhou, Wei Ke

AAAI 2025 FreeMask: Rethinking the Importance of Attention Masks for Zero-Shot Video Editing Lingling Cai, Kang Zhao, Hangjie Yuan, Yingya Zhang, Shiwei Zhang, Kejie Huang

ICCV 2025 FreeScale: Unleashing the Resolution of Diffusion Models via Tuning-Free Scale Fusion Haonan Qiu, Shiwei Zhang, Yujie Wei, Ruihang Chu, Hangjie Yuan, Xiang Wang, Yingya Zhang, Ziwei Liu

ICCV 2025 PersonalVideo: High ID-Fidelity Video Customization Without Dynamic and Semantic Degradation Hengjia Li, Haonan Qiu, Shiwei Zhang, Xiang Wang, Yujie Wei, Zekun Li, Yingya Zhang, Boxi Wu, Deng Cai

ICCV 2025 SimpleVQA: Multimodal Factuality Evaluation for Multimodal Large Language Models Xianfu Cheng, Wei Zhang, Shiwei Zhang, Jian Yang, Xiangyuan Guan, Xianjie Wu, Xiang Li, Ge Zhang, Jiaheng Liu, Yuying Mai, Yutao Zeng, Zhoufutu Wen, Ke Jin, Baorui Wang, Weixiao Zhou, Yunhong Lu, Hangyuan Ji, Tongliang Li, Wenhao Huang, Zhoujun Li

NeurIPS 2025 TTS-VAR: A Test-Time Scaling Framework for Visual Auto-Regressive Generation Zhekai Chen, Ruihang Chu, Yukang Chen, Shiwei Zhang, Yujie Wei, Yingya Zhang, Xihui Liu

CVPR 2025 Timestep Embedding Tells: It's Time to Cache for Video Diffusion Model Feng Liu, Shiwei Zhang, Xiaofeng Wang, Yujie Wei, Haonan Qiu, Yuzhong Zhao, Yingya Zhang, Qixiang Ye, Fang Wan

NeurIPS 2025 Wan-Move: Motion-Controllable Video Generation via Latent Trajectory Guidance Ruihang Chu, Yefei He, Zhekai Chen, Shiwei Zhang, Xiaogang Xu, Bin Xia, Dingdong Wang, Hongwei Yi, Xihui Liu, Hengshuang Zhao, Yu Liu, Yingya Zhang, Yujiu Yang

CVPR 2024 A Recipe for Scaling up Text-to-Video Generation with Text-Free Videos Xiang Wang, Shiwei Zhang, Hangjie Yuan, Zhiwu Qing, Biao Gong, Yingya Zhang, Yujun Shen, Changxin Gao, Nong Sang

CVPR 2024 Check Locate Rectify: A Training-Free Layout Calibration System for Text-to-Image Generation Biao Gong, Siteng Huang, Yutong Feng, Shiwei Zhang, Yuyuan Li, Yu Liu

CVPR 2024 DreamVideo: Composing Your Dream Videos with Customized Subject and Motion Yujie Wei, Shiwei Zhang, Zhiwu Qing, Hangjie Yuan, Zhiheng Liu, Yu Liu, Yingya Zhang, Jingren Zhou, Hongming Shan

NeurIPS 2024 EvolveDirector: Approaching Advanced Text-to-Image Generation with Large Vision-Language Models Rui Zhao, Hangjie Yuan, Yujie Wei, Shiwei Zhang, Yuchao Gu, Lingmin Ran, Xiang Wang, Zhangjie Wu, Junhao Zhang, Yingya Zhang, Mike Zheng Shou

CVPR 2024 Hierarchical Spatio-Temporal Decoupling for Text-to-Video Generation Zhiwu Qing, Shiwei Zhang, Jiayu Wang, Xiang Wang, Yujie Wei, Yingya Zhang, Changxin Gao, Nong Sang

CVPR 2024 InstructVideo: Instructing Video Diffusion Models with Human Feedback Hangjie Yuan, Shiwei Zhang, Xiang Wang, Yujie Wei, Tao Feng, Yining Pan, Yingya Zhang, Ziwei Liu, Samuel Albanie, Dong Ni

ICCV 2023 Disentangling Spatial and Temporal Learning for Efficient Image-to-Video Transfer Learning Zhiwu Qing, Shiwei Zhang, Ziyuan Huang, Yingya Zhang, Changxin Gao, Deli Zhao, Nong Sang

CVPR 2023 Enlarging Instance-Specific and Class-Specific Information for Open-Set Action Recognition Jun Cen, Shiwei Zhang, Xiang Wang, Yixuan Pei, Zhiwu Qing, Yingya Zhang, Qifeng Chen

NeurIPS 2023 FaceComposer: A Unified Model for Versatile Facial Content Creation Jiayu Wang, Kang Zhao, Yifeng Ma, Shiwei Zhang, Yingya Zhang, Yujun Shen, Deli Zhao, Jingren Zhou

CVPR 2023 LipFormer: High-Fidelity and Generalizable Talking Face Generation with a Pre-Learned Facial Codebook Jiayu Wang, Kang Zhao, Shiwei Zhang, Yingya Zhang, Yujun Shen, Deli Zhao, Jingren Zhou

CVPR 2023 MoLo: Motion-Augmented Long-Short Contrastive Learning for Few-Shot Action Recognition Xiang Wang, Shiwei Zhang, Zhiwu Qing, Changxin Gao, Yingya Zhang, Deli Zhao, Nong Sang

ICCV 2023 RLIPv2: Fast Scaling of Relational Language-Image Pre-Training Hangjie Yuan, Shiwei Zhang, Xiang Wang, Samuel Albanie, Yining Pan, Tao Feng, Jianwen Jiang, Dong Ni, Yingya Zhang, Deli Zhao

ICCV 2023 Space-Time Prompting for Video Class-Incremental Learning Yixuan Pei, Zhiwu Qing, Shiwei Zhang, Xiang Wang, Yingya Zhang, Deli Zhao, Xueming Qian

ICLR 2023 The Devil Is in the Wrongly-Classified Samples: Towards Unified Open-Set Recognition Jun Cen, Di Luan, Shiwei Zhang, Yixuan Pei, Yingya Zhang, Deli Zhao, Shaojie Shen, Qifeng Chen

NeurIPS 2023 VideoComposer: Compositional Video Synthesis with Motion Controllability Xiang Wang, Hangjie Yuan, Shiwei Zhang, Dayou Chen, Jiuniu Wang, Yingya Zhang, Yujun Shen, Deli Zhao, Jingren Zhou

CVPR 2022 Hybrid Relation Guided Set Matching for Few-Shot Action Recognition Xiang Wang, Shiwei Zhang, Zhiwu Qing, Mingqian Tang, Zhengrong Zuo, Changxin Gao, Rong Jin, Nong Sang

NeurIPS 2022 Learning a Condensed Frame for Memory-Efficient Video Class-Incremental Learning Yixuan Pei, Zhiwu Qing, Jun Cen, Xiang Wang, Shiwei Zhang, Yaxiong Wang, Mingqian Tang, Nong Sang, Xueming Qian

CVPR 2022 Learning from Untrimmed Videos: Self-Supervised Video Representation Learning with Hierarchical Consistency Zhiwu Qing, Shiwei Zhang, Ziyuan Huang, Yi Xu, Xiang Wang, Mingqian Tang, Changxin Gao, Rong Jin, Nong Sang

ECCV 2022 Open-World Semantic Segmentation for LIDAR Point Clouds Jun Cen, Peng Yun, Shiwei Zhang, Junhao Cai, Di Luan, Mingqian Tang, Ming Liu, Michael Yu Wang

ICLR 2022 TAda! Temporally-Adaptive Convolutions for Video Understanding Ziyuan Huang, Shiwei Zhang, Liang Pan, Zhiwu Qing, Mingqian Tang, Ziwei Liu, Marcelo H Ang Jr

CVPR 2022 TCTrack: Temporal Contexts for Aerial Tracking Ziang Cao, Ziyuan Huang, Liang Pan, Shiwei Zhang, Ziwei Liu, Changhong Fu

ICCV 2021 OadTR: Online Action Detection with Transformers Xiang Wang, Shiwei Zhang, Zhiwu Qing, Yuanjie Shao, Zhengrong Zuo, Changxin Gao, Nong Sang

CVPR 2021 Self-Supervised Learning for Semi-Supervised Temporal Action Proposal Xiang Wang, Shiwei Zhang, Zhiwu Qing, Yuanjie Shao, Changxin Gao, Nong Sang

CVPR 2021 Self-Supervised Motion Learning from Static Images Ziyuan Huang, Shiwei Zhang, Jianwen Jiang, Mingqian Tang, Rong Jin, Marcelo H. Ang

ICCV 2021 Support-Set Based Cross-Supervision for Video Grounding Xinpeng Ding, Nannan Wang, Shiwei Zhang, De Cheng, Xiaomeng Li, Ziyuan Huang, Mingqian Tang, Xinbo Gao

ECML-PKDD 2020 Less Is More: Rejecting Unreliable Reviews for Product Question Answering Shiwei Zhang, Xiuzhen Zhang, Jey Han Lau, Jeffrey Chan, Cécile Paris