Gao, Mingfei

18 publications

ICLR 2026 MANZANO: A Simple and Scalable Unified Multimodal Model with a Hybrid Vision Tokenizer Yanghao Li, Rui Qian, Bowen Pan, Haotian Zhang, Haoshuo Huang, Bowen Zhang, Jialing Tong, Haoxuan You, Xianzhi Du, Zhe Gan, Hyunjik Kim, Chao Jia, Zhenbang Wang, Yinfei Yang, Mingfei Gao, Zi-Yi Dou, Wenze Hu, Chang Gao, Dongxu Li, Philipp Dufter, Zirui Wang, Guoli Yin, Zhengdong Zhang, Chen Chen, Yang Zhao, Ruoming Pang, Zhifeng Chen

ICLR 2025 MM1.5: Methods, Analysis & Insights from Multimodal LLM Fine-Tuning Haotian Zhang, Mingfei Gao, Zhe Gan, Philipp Dufter, Nina Wenzel, Forrest Huang, Dhruti Shah, Xianzhi Du, Bowen Zhang, Yanghao Li, Sam Dodge, Keen You, Zhen Yang, Aleksei Timofeev, Mingze Xu, Hong-You Chen, Jean-Philippe Fauconnier, Zhengfeng Lai, Haoxuan You, Zirui Wang, Afshin Dehghan, Peter Grasch, Yinfei Yang

NeurIPS 2025 UniGen: Enhanced Training & Test-Time Strategies for Unified Multimodal Understanding and Generation Rui Tian, Mingfei Gao, Mingze Xu, Jiaming Hu, Jiasen Lu, Zuxuan Wu, Yinfei Yang, Afshin Dehghan

NeurIPS 2024 4m-21: An Any-to-Any Vision Model for Tens of Tasks and Modalities Roman Bachmann, Oğuzhan Fatih Kar, David Mizrahi, Ali Garjani, Mingfei Gao, David Griffiths, Jiaming Hu, Afshin Dehghan, Amir Zamir

NeurIPS 2023 4m: Massively Multimodal Masked Modeling David Mizrahi, Roman Bachmann, Oguzhan Kar, Teresa Yeo, Mingfei Gao, Afshin Dehghan, Amir Zamir

CVPR 2023 Mask-Free OVIS: Open-Vocabulary Instance Segmentation Without Manual Mask Annotations Vibashan Vs, Ning Yu, Chen Xing, Can Qin, Mingfei Gao, Juan Carlos Niebles, Vishal M. Patel, Ran Xu

CVPR 2023 ULIP: Learning a Unified Representation of Language, Images, and Point Clouds for 3D Understanding Le Xue, Mingfei Gao, Chen Xing, Roberto Martín-Martín, Jiajun Wu, Caiming Xiong, Ran Xu, Juan Carlos Niebles, Silvio Savarese

ECCV 2022 Burn After Reading: Online Adaptation for Cross-Domain Streaming Data Luyu Yang, Mingfei Gao, Zeyuan Chen, Ran Xu, Abhinav Shrivastava, Chetan Ramaiah

ECCV 2022 Open Vocabulary Object Detection with Pseudo Bounding-Box Labels Mingfei Gao, Chen Xing, Juan Carlos Niebles, Junnan Li, Ran Xu, Wenhao Liu, Caiming Xiong

ICCV 2021 Deep Co-Training with Task Decomposition for Semi-Supervised Domain Adaptation Luyu Yang, Yan Wang, Mingfei Gao, Abhinav Shrivastava, Kilian Q. Weinberger, Wei-Lun Chao, Ser-Nam Lim

CVPR 2021 WOAD: Weakly Supervised Online Action Detection in Untrimmed Videos Mingfei Gao, Yingbo Zhou, Ran Xu, Richard Socher, Caiming Xiong

ECCV 2020 Consistency-Based Semi-Supervised Active Learning: Towards Minimizing Labeling Cost Mingfei Gao, Zizhao Zhang, Guo Yu, Sercan . Arık, Larry S. Davis, Tomas Pfister

ECCV 2020 InfoFocus: 3D Object Detection for Autonomous Driving with Dynamic Information Modeling Jun Wang, Shiyi Lan, Mingfei Gao, Larry S. Davis

ICCV 2019 StartNet: Online Detection of Action Start in Untrimmed Videos Mingfei Gao, Mingze Xu, Larry S. Davis, Richard Socher, Caiming Xiong

ICCV 2019 Temporal Recurrent Networks for Online Action Detection Mingze Xu, Mingfei Gao, Yi-Ting Chen, Larry S. Davis, David J. Crandall

ECCV 2018 C-WSL: Count-Guided Weakly Supervised Localization Mingfei Gao, Ang Li, Ruichi Yu, Vlad I. Morariu, Larry S. Davis

CVPR 2018 Dynamic Zoom-in Network for Fast Object Detection in Large Images Mingfei Gao, Ruichi Yu, Ang Li, Vlad I. Morariu, Larry S. Davis

CVPR 2018 NISP: Pruning Networks Using Neuron Importance Score Propagation Ruichi Yu, Ang Li, Chun-Fu Chen, Jui-Hsin Lai, Vlad I. Morariu, Xintong Han, Mingfei Gao, Ching-Yung Lin, Larry S. Davis