Cui, Yin

33 publications

CVPR 2025 ArtiScene: Language-Driven Artistic 3D Scene Generation Through Image Intermediary Zeqi Gu, Yin Cui, Zhaoshuo Li, Fangyin Wei, Yunhao Ge, Jinwei Gu, Ming-Yu Liu, Abe Davis, Yifan Ding

ICCV 2025 Describe Anything: Detailed Localized Image and Video Captioning Long Lian, Yifan Ding, Yunhao Ge, Sifei Liu, Hanzi Mao, Boyi Li, Marco Pavone, Ming-Yu Liu, Trevor Darrell, Adam Yala, Yin Cui

TMLR 2025 Wolf: Dense Video Captioning with a World Summarization Framework Boyi Li, Ligeng Zhu, Ran Tian, Shuhan Tan, Yuxiao Chen, Yao Lu, Yin Cui, Sushant Veer, Max Ehrlich, Jonah Philion, Xinshuo Weng, Fuzhao Xue, Linxi Fan, Yuke Zhu, Jan Kautz, Andrew Tao, Ming-Yu Liu, Sanja Fidler, Boris Ivanovic, Trevor Darrell, Jitendra Malik, Song Han, Marco Pavone

TMLR 2024 VideoGLUE: Video General Understanding Evaluation of Foundation Models Liangzhe Yuan, Nitesh Bharadwaj Gundavarapu, Long Zhao, Hao Zhou, Yin Cui, Lu Jiang, Xuan Yang, Menglin Jia, Tobias Weyand, Luke Friedman, Mikhail Sirotenko, Huisheng Wang, Florian Schroff, Hartwig Adam, Ming-Hsuan Yang, Ting Liu, Boqing Gong

CVPR 2024 Visual Fact Checker: Enabling High-Fidelity Detailed Caption Generation Yunhao Ge, Xiaohui Zeng, Jacob Samuel Huffman, Tsung-Yi Lin, Ming-Yu Liu, Yin Cui

TMLR 2024 Why Fine-Grained Labels in Pretraining Benefit Generalization? Guan Zhe Hong, Yin Cui, Ariel Fuxman, Stanley H. Chan, Enming Luo

NeurIPSW 2024 Wolf: Captioning Everything with a World Summarization Framework Boyi Li, Ligeng Zhu, Ran Tian, Shuhan Tan, Yuxiao Chen, Yao Lu, Yin Cui, Sushant Veer, Max Ehrlich, Jonah Philion, Xinshuo Weng, Fuzhao Xue, Andrew Tao, Ming-Yu Liu, Sanja Fidler, Boris Ivanovic, Trevor Darrell, Jitendra Malik, Song Han, Marco Pavone

ICML 2023 A Simple Zero-Shot Prompt Weighting Technique to Improve Prompt Ensembling in Text-Image Models James Urquhart Allingham, Jie Ren, Michael W Dusenberry, Xiuye Gu, Yin Cui, Dustin Tran, Jeremiah Zhe Liu, Balaji Lakshminarayanan

NeurIPS 2023 Alternating Gradient Descent and Mixture-of-Experts for Integrated Multimodal Perception Hassan Akbari, Dan Kondratyuk, Yin Cui, Rachel Hornung, Huisheng Wang, Hartwig Adam

NeurIPS 2023 DaTaSeg: Taming a Universal Multi-Dataset Multi-Task Segmentation Model Xiuye Gu, Yin Cui, Jonathan Huang, Abdullah Rashwan, Xuan Yang, Xingyi Zhou, Golnaz Ghiasi, Weicheng Kuo, Huizhong Chen, Liang-Chieh Chen, David A. Ross

NeurIPS 2023 Module-Wise Adaptive Distillation for Multimodality Foundation Models Chen Liang, Jiahui Yu, Ming-Hsuan Yang, Matthew Brown, Yin Cui, Tuo Zhao, Boqing Gong, Tianyi Zhou

WACV 2023 MovieCLIP: Visual Scene Recognition in Movies Digbalay Bose, Rajat Hebbar, Krishna Somandepalli, Haoyang Zhang, Yin Cui, Kree Cole-McLaughlin, Huisheng Wang, Shrikanth Narayanan

ICLR 2023 Open-Vocabulary Object Detection upon Frozen Vision and Language Models Weicheng Kuo, Yin Cui, Xiuye Gu, Aj Piergiovanni, Anelia Angelova

CVPR 2023 Train-Once-for-All Personalization Hong-You Chen, Yandong Li, Yin Cui, Mingda Zhang, Wei-Lun Chao, Li Zhang

ICCV 2023 Unified Visual Relationship Detection with Vision and Language Models Long Zhao, Liangzhe Yuan, Boqing Gong, Yin Cui, Florian Schroff, Ming-Hsuan Yang, Hartwig Adam, Ting Liu

CVPR 2022 Contextualized Spatio-Temporal Contrastive Learning with Self-Supervision Liangzhe Yuan, Rui Qian, Yin Cui, Boqing Gong, Florian Schroff, Ming-Hsuan Yang, Hartwig Adam, Ting Liu

WACV 2022 Federated Multi-Target Domain Adaptation Chun-Han Yao, Boqing Gong, Hang Qi, Yin Cui, Yukun Zhu, Ming-Hsuan Yang

ICLR 2022 Open-Vocabulary Object Detection via Vision and Language Knowledge Distillation Xiuye Gu, Tsung-Yi Lin, Weicheng Kuo, Yin Cui

ECCVW 2022 SITTA: Single Image Texture Translation for Data Augmentation Boyi Li, Yin Cui, Tsung-Yi Lin, Serge J. Belongie

ECCV 2022 Scaling Open-Vocabulary Image Segmentation with Image-Level Labels Golnaz Ghiasi, Xiuye Gu, Yin Cui, Tsung-Yi Lin

ICLR 2022 Surrogate Gap Minimization Improves Sharpness-Aware Training Juntang Zhuang, Boqing Gong, Liangzhe Yuan, Yin Cui, Hartwig Adam, Nicha C Dvornek, Sekhar Tatikonda, James s Duncan, Ting Liu

CVPR 2021 Simple Copy-Paste Is a Strong Data Augmentation Method for Instance Segmentation Golnaz Ghiasi, Yin Cui, Aravind Srinivas, Rui Qian, Tsung-Yi Lin, Ekin D. Cubuk, Quoc V. Le, Barret Zoph

CVPR 2021 Spatiotemporal Contrastive Video Representation Learning Rui Qian, Tianjian Meng, Boqing Gong, Ming-Hsuan Yang, Huisheng Wang, Serge Belongie, Yin Cui

NeurIPS 2021 VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and Text Hassan Akbari, Liangzhe Yuan, Rui Qian, Wei-Hong Chuang, Shih-Fu Chang, Yin Cui, Boqing Gong

ECCV 2020 Fashionpedia: Ontology, Segmentation, and an Attribute Localization Dataset Menglin Jia, Mengyun Shi, Mikhail Sirotenko, Yin Cui, Claire Cardie, Bharath Hariharan, Hartwig Adam, Serge Belongie

NeurIPS 2020 Rethinking Pre-Training and Self-Training Barret Zoph, Golnaz Ghiasi, Tsung-Yi Lin, Yin Cui, Hanxiao Liu, Ekin Dogus Cubuk, Quoc V. Le

CVPRW 2019 Learning Single-View 3D Reconstruction with Limited Pose Supervision Guandao Yang, Yin Cui, Serge J. Belongie, Bharath Hariharan

ICCVW 2019 The iMaterialist Fashion Attribute Dataset Sheng Guo, Weilin Huang, Xiao Zhang, Prasanna Srikhanta, Yin Cui, Yuan Li, Hartwig Adam, Matthew R. Scott, Serge J. Belongie

ECCV 2018 Learning Single-View 3D Reconstruction with Limited Pose Supervision Guandao Yang, Yin Cui, Serge Belongie, Bharath Hariharan

CVPR 2017 Kernel Pooling for Convolutional Neural Networks Yin Cui, Feng Zhou, Jiang Wang, Xiao Liu, Yuanqing Lin, Serge Belongie

CVPR 2016 Fine-Grained Categorization and Dataset Bootstrapping Using Deep Metric Learning with Humans in the Loop Yin Cui, Feng Zhou, Yuanqing Lin, Serge Belongie

CVPR 2015 Learning Deep Representations for Ground-to-Aerial Geolocalization Tsung-Yi Lin, Yin Cui, Serge Belongie, James Hays

WACV 2014 A Spatial-Color Layout Feature for Representing Galaxy Images Yin Cui, Yongzhou Xiang, Kun Rong, Rogério Schmidt Feris, Liangliang Cao