Yin, Xi

19 publications

CVPR 2025 Flowing from Words to Pixels: A Noise-Free Framework for Cross-Modality Evolution Qihao Liu, Xi Yin, Alan Yuille, Andrew Brown, Mannat Singh

ICCV 2025 Generating Multi-Image Synthetic Data for Text-to-Image Customization Nupur Kumari, Xi Yin, Jun-Yan Zhu, Ishan Misra, Samaneh Azadi

CVPR 2025 MotiF: Making Text Count in Image Animation with Motion Focal Loss Shijie Wang, Samaneh Azadi, Rohit Girdhar, Saketh Rambhatla, Chen Sun, Xi Yin

ECCV 2024 Factorizing Text-to-Video Generation by Explicit Image Conditioning Rohit Girdhar, Mannat Singh, Andrew Brown, Quentin Duval, Samaneh Azadi, Sai Saketh Rambhatla, Mian Akbar Shah, Xi Yin, Devi Parikh, Ishan Misra

CVPR 2023 MaLP: Manipulation Localization Using a Proactive Scheme Vishal Asnani, Xi Yin, Tal Hassner, Xiaoming Liu

ICLR 2023 Make-a-Video: Text-to-Video Generation Without Text-Video Data Uriel Singer, Adam Polyak, Thomas Hayes, Xi Yin, Jie An, Songyang Zhang, Qiyuan Hu, Harry Yang, Oron Ashual, Oran Gafni, Devi Parikh, Sonal Gupta, Yaniv Taigman

CVPR 2023 SpaText: Spatio-Textual Representation for Controllable Image Generation Omri Avrahami, Thomas Hayes, Oran Gafni, Sonal Gupta, Yaniv Taigman, Devi Parikh, Dani Lischinski, Ohad Fried, Xi Yin

ECCV 2022 Long Video Generation with Time-Agnostic VQGAN and Time-Sensitive Transformer Songwei Ge, Thomas Hayes, Harry Yang, Xi Yin, Guan Pang, David Jacobs, Jia-Bin Huang, Devi Parikh

ECCV 2022 MUGEN: A Playground for Video-Audio-Text Multimodal Understanding and GENeration Thomas Hayes, Songyang Zhang, Xi Yin, Guan Pang, Sasha Sheng, Harry Yang, Songwei Ge, Qiyuan Hu, Devi Parikh

CVPR 2022 Proactive Image Manipulation Detection Vishal Asnani, Xi Yin, Tal Hassner, Sijia Liu, Xiaoming Liu

CVPR 2021 A Multiplexed Network for End-to-End, Multilingual OCR Jing Huang, Guan Pang, Rama Kovvuri, Mandy Toh, Kevin J Liang, Praveen Krishnan, Xi Yin, Tal Hassner

CVPR 2021 Img2pose: Face Alignment and Detection via 6DoF, Face Pose Estimation Vitor Albiero, Xingyu Chen, Xi Yin, Guan Pang, Tal Hassner

CVPR 2021 TAP: Text-Aware Pre-Training for Text-VQA and Text-Caption Zhengyuan Yang, Yijuan Lu, Jianfeng Wang, Xi Yin, Dinei Florencio, Lijuan Wang, Cha Zhang, Lei Zhang, Jiebo Luo

AAAI 2021 VIVO: Visual Vocabulary Pre-Training for Novel Object Captioning Xiaowei Hu, Xi Yin, Kevin Lin, Lei Zhang, Jianfeng Gao, Lijuan Wang, Zicheng Liu

ECCV 2020 Oscar: Object-Semantics Aligned Pre-Training for Vision-Language Tasks Xiujun Li, Xi Yin, Chunyuan Li, Pengchuan Zhang, Xiaowei Hu, Lei Zhang, Lijuan Wang, Houdong Hu, Li Dong, Furu Wei, Yejin Choi, Jianfeng Gao

CVPR 2017 Disentangled Representation Learning GAN for Pose-Invariant Face Recognition Luan Tran, Xi Yin, Xiaoming Liu

ICCV 2017 Illuminating Pedestrians via Simultaneous Detection & Segmentation Garrick Brazil, Xi Yin, Xiaoming Liu

ICCV 2017 Towards Large-Pose Face Frontalization in the Wild Xi Yin, Xiang Yu, Kihyuk Sohn, Xiaoming Liu, Manmohan Chandraker

WACV 2014 Multi-Leaf Alignment from Fluorescence Plant Images Xi Yin, Xiaoming Liu, Jin Chen, David M. Kramer