Girshick, Ross

41 publications

CVPR 2025 Molmo and PixMo: Open Weights and Open Data for State-of-the-Art Vision-Language Models Matt Deitke, Christopher Clark, Sangho Lee, Rohun Tripathi, Yue Yang, Jae Sung Park, Mohammadreza Salehi, Niklas Muennighoff, Kyle Lo, Luca Soldaini, Jiasen Lu, Taira Anderson, Erin Bransom, Kiana Ehsani, Huong Ngo, YenSung Chen, Ajay Patel, Mark Yatskar, Chris Callison-Burch, Andrew Head, Rose Hendrix, Favyen Bastani, Eli VanderBilt, Nathan Lambert, Yvonne Chou, Arnavi Chheda, Jenna Sparks, Sam Skjonsberg, Michael Schmitz, Aaron Sarnat, Byron Bischoff, Pete Walsh, Chris Newell, Piper Wolters, Tanmay Gupta, Kuo-Hao Zeng, Jon Borchardt, Dirk Groeneveld, Crystal Nam, Sophie Lebrecht, Caitlin Wittlif, Carissa Schoenick, Oscar Michel, Ranjay Krishna, Luca Weihs, Noah A. Smith, Hannaneh Hajishirzi, Ross Girshick, Ali Farhadi, Aniruddha Kembhavi

ICLR 2025 SAM 2: Segment Anything in Images and Videos Nikhila Ravi, Valentin Gabeur, Yuan-Ting Hu, Ronghang Hu, Chaitanya Ryali, Tengyu Ma, Haitham Khedr, Roman Rädle, Chloe Rolland, Laura Gustafson, Eric Mintun, Junting Pan, Kalyan Vasudev Alwala, Nicolas Carion, Chao-Yuan Wu, Ross Girshick, Piotr Dollar, Christoph Feichtenhofer

CoRL 2024 PoliFormer: Scaling On-Policy RL with Transformers Results in Masterful Navigators Kuo-Hao Zeng, Zichen Zhang, Kiana Ehsani, Rose Hendrix, Jordi Salvador, Alvaro Herrasti, Ross Girshick, Aniruddha Kembhavi, Luca Weihs

ICCV 2023 Segment Anything Alexander Kirillov, Eric Mintun, Nikhila Ravi, Hanzi Mao, Chloe Rolland, Laura Gustafson, Tete Xiao, Spencer Whitehead, Alexander C. Berg, Wan-Yen Lo, Piotr Dollar, Ross Girshick

ICCV 2023 The Effectiveness of MAE Pre-Pretraining for Billion-Scale Pretraining Mannat Singh, Quentin Duval, Kalyan Vasudev Alwala, Haoqi Fan, Vaibhav Aggarwal, Aaron Adcock, Armand Joulin, Piotr Dollar, Christoph Feichtenhofer, Ross Girshick, Rohit Girdhar, Ishan Misra

ECCV 2022 Exploring Plain Vision Transformer Backbones for Object Detection Yanghao Li, Hanzi Mao, Ross Girshick, Kaiming He

CVPR 2022 Masked Autoencoders Are Scalable Vision Learners Kaiming He, Xinlei Chen, Saining Xie, Yanghao Li, Piotr Dollár, Ross Girshick

CVPR 2022 Revisiting Weakly Supervised Pre-Training of Visual Perception Models Mannat Singh, Laura Gustafson, Aaron Adcock, Vinicius de Freitas Reis, Bugra Gedik, Raj Prateek Kosaraju, Dhruv Mahajan, Ross Girshick, Piotr Dollár, Laurens van der Maaten

CVPR 2021 A Large-Scale Study on Unsupervised Spatiotemporal Representation Learning Christoph Feichtenhofer, Haoqi Fan, Bo Xiong, Ross Girshick, Kaiming He

CVPR 2021 Boundary IoU: Improving Object-Centric Image Segmentation Evaluation Bowen Cheng, Ross Girshick, Piotr Dollar, Alexander C. Berg, Alexander Kirillov

CVPR 2021 Fast and Accurate Model Scaling Piotr Dollar, Mannat Singh, Ross Girshick

ECCV 2020 Are Labels Necessary for Neural Architecture Search? Chenxi Liu, Piotr Dollár, Kaiming He, Ross Girshick, Alan Yuille, Saining Xie

NeurIPS 2019 PHYRE: A New Benchmark for Physical Reasoning Anton Bakhtin, Laurens van der Maaten, Justin Johnson, Laura Gustafson, Ross Girshick

ECCV 2018 Exploring the Limits of Weakly Supervised Pretraining Dhruv Mahajan, Ross Girshick, Vignesh Ramanathan, Kaiming He, Manohar Paluri, Yixuan Li, Ashwin Bharambe, Laurens van der Maaten

CVPR 2017 Aggregated Residual Transformations for Deep Neural Networks Saining Xie, Ross Girshick, Piotr Dollar, Zhuowen Tu, Kaiming He

CVPR 2017 CLEVR: A Diagnostic Dataset for Compositional Language and Elementary Visual Reasoning Justin Johnson, Bharath Hariharan, Laurens van der Maaten, Li Fei-Fei, C. Lawrence Zitnick, Ross Girshick

CVPR 2017 Feature Pyramid Networks for Object Detection Tsung-Yi Lin, Piotr Dollar, Ross Girshick, Kaiming He, Bharath Hariharan, Serge Belongie

ICCV 2017 Focal Loss for Dense Object Detection Tsung-Yi Lin, Priya Goyal, Ross Girshick, Kaiming He, Piotr Dollar

ICCV 2017 Inferring and Executing Programs for Visual Reasoning Justin Johnson, Bharath Hariharan, Laurens van der Maaten, Judy Hoffman, Li Fei-Fei, C. Lawrence Zitnick, Ross Girshick

CVPR 2017 Learning Features by Watching Objects Move Deepak Pathak, Ross Girshick, Piotr Dollar, Trevor Darrell, Bharath Hariharan

ICCV 2017 Low-Shot Visual Recognition by Shrinking and Hallucinating Features Bharath Hariharan, Ross Girshick

ICCV 2017 Mask R-CNN Kaiming He, Georgia Gkioxari, Piotr Dollar, Ross Girshick

CVPR 2016 Inside-Outside Net: Detecting Objects in Context with Skip Pooling and Recurrent Neural Networks Sean Bell, C. Lawrence Zitnick, Kavita Bala, Ross Girshick

CVPR 2016 Seeing Through the Human Reporting Bias: Visual Classifiers from Noisy Human-Centric Labels Ishan Misra, C. Lawrence Zitnick, Margaret Mitchell, Ross Girshick

CVPR 2016 Training Region-Based Object Detectors with Online Hard Example Mining Abhinav Shrivastava, Abhinav Gupta, Ross Girshick

ICML 2016 Unsupervised Deep Embedding for Clustering Analysis Junyuan Xie, Ross Girshick, Ali Farhadi

CVPR 2016 You Only Look Once: Unified, Real-Time Object Detection Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi

ICCV 2015 Actions and Attributes from Wholes and Parts Georgia Gkioxari, Ross Girshick, Jitendra Malik

CVPR 2015 Aligning 3D Models to RGB-D Images of Cluttered Scenes Saurabh Gupta, Pablo Arbelaez, Ross Girshick, Jitendra Malik

ICCV 2015 Contextual Action Recognition with R*CNN Georgia Gkioxari, Ross Girshick, Jitendra Malik

CVPR 2015 Deformable Part Models Are Convolutional Neural Networks Ross Girshick, Forrest Iandola, Trevor Darrell, Jitendra Malik

ICCV 2015 Fast R-CNN Ross Girshick

NeurIPS 2015 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks Shaoqing Ren, Kaiming He, Ross Girshick, Jian Sun

CVPR 2015 Hypercolumns for Object Segmentation and Fine-Grained Localization Bharath Hariharan, Pablo Arbelaez, Ross Girshick, Jitendra Malik

NeurIPS 2014 LSDA: Large Scale Detection Through Adaptation Judy Hoffman, Sergio Guadarrama, Eric S Tzeng, Ronghang Hu, Jeff Donahue, Ross Girshick, Trevor Darrell, Kate Saenko

ICML 2014 On Learning to Localize Objects with Minimal Supervision Hyun Oh Song, Ross Girshick, Stefanie Jegelka, Julien Mairal, Zaid Harchaoui, Trevor Darrell

CVPR 2014 Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation Ross Girshick, Jeff Donahue, Trevor Darrell, Jitendra Malik

CVPR 2014 Understanding Objects in Detail with Fine-Grained Attributes Andrea Vedaldi, Siddharth Mahendran, Stavros Tsogkas, Subhransu Maji, Ross Girshick, Juho Kannala, Esa Rahtu, Iasonas Kokkinos, Matthew B. Blaschko, David Weiss, Ben Taskar, Karen Simonyan, Naomi Saphra, Sammy Mohamed

CVPR 2014 Using K-Poselets for Detecting People and Localizing Their Keypoints Georgia Gkioxari, Bharath Hariharan, Ross Girshick, Jitendra Malik

ICML 2013 Discriminatively Activated Sparselets Ross Girshick, Hyun Oh Song, Trevor Darrell

ICCV 2013 Training Deformable Part Models with Decorrelated Features Ross Girshick, Jitendra Malik