Singh, Mannat

10 publications

CVPR 2025 Flowing from Words to Pixels: A Noise-Free Framework for Cross-Modality Evolution Qihao Liu, Xi Yin, Alan Yuille, Andrew Brown, Mannat Singh

ECCV 2024 Factorizing Text-to-Video Generation by Explicit Image Conditioning Rohit Girdhar, Mannat Singh, Andrew Brown, Quentin Duval, Samaneh Azadi, Sai Saketh Rambhatla, Mian Akbar Shah, Xi Yin, Devi Parikh, Ishan Misra

CVPR 2023 ImageBind: One Embedding Space to Bind Them All Rohit Girdhar, Alaaeldin El-Nouby, Zhuang Liu, Mannat Singh, Kalyan Vasudev Alwala, Armand Joulin, Ishan Misra

CVPR 2023 OmniMAE: Single Model Masked Pretraining on Images and Videos Rohit Girdhar, Alaaeldin El-Nouby, Mannat Singh, Kalyan Vasudev Alwala, Armand Joulin, Ishan Misra

ICCV 2023 The Effectiveness of MAE Pre-Pretraining for Billion-Scale Pretraining Mannat Singh, Quentin Duval, Kalyan Vasudev Alwala, Haoqi Fan, Vaibhav Aggarwal, Aaron Adcock, Armand Joulin, Piotr Dollar, Christoph Feichtenhofer, Ross Girshick, Rohit Girdhar, Ishan Misra

CVPR 2022 Omnivore: A Single Model for Many Visual Modalities Rohit Girdhar, Mannat Singh, Nikhila Ravi, Laurens van der Maaten, Armand Joulin, Ishan Misra

CVPR 2022 Revisiting Weakly Supervised Pre-Training of Visual Perception Models Mannat Singh, Laura Gustafson, Aaron Adcock, Vinicius de Freitas Reis, Bugra Gedik, Raj Prateek Kosaraju, Dhruv Mahajan, Ross Girshick, Piotr Dollár, Laurens van der Maaten

NeurIPS 2021 Early Convolutions Help Transformers See Better Tete Xiao, Mannat Singh, Eric Mintun, Trevor Darrell, Piotr Dollar, Ross B. Girshick

CVPR 2021 Fast and Accurate Model Scaling Piotr Dollar, Mannat Singh, Ross Girshick

ICCV 2021 MDETR - Modulated Detection for End-to-End Multi-Modal Understanding Aishwarya Kamath, Mannat Singh, Yann LeCun, Gabriel Synnaeve, Ishan Misra, Nicolas Carion