Changpinyo, Soravit

17 publications

CVPR 2024 On Scaling up a Multilingual Vision and Language Model Xi Chen, Josip Djolonga, Piotr Padlewski, Basil Mustafa, Soravit Changpinyo, Jialin Wu, Carlos Riquelme Ruiz, Sebastian Goodman, Xiao Wang, Yi Tay, Siamak Shakeri, Mostafa Dehghani, Daniel Salz, Mario Lucic, Michael Tschannen, Arsha Nagrani, Hexiang Hu, Mandar Joshi, Bo Pang, Ceslee Montgomery, Paulina Pietrzyk, Marvin Ritter, Aj Piergiovanni, Matthias Minderer, Filip Pavetic, Austin Waters, Gang Li, Ibrahim Alabdulmohsin, Lucas Beyer, Julien Amelot, Kenton Lee, Andreas Peter Steiner, Yang Li, Daniel Keysers, Anurag Arnab, Yuanzhong Xu, Keran Rong, Alexander Kolesnikov, Mojtaba Seyedhosseini, Anelia Angelova, Xiaohua Zhai, Neil Houlsby, Radu Soricut

CVPR 2023 Connecting Vision and Language with Video Localized Narratives Paul Voigtlaender, Soravit Changpinyo, Jordi Pont-Tuset, Radu Soricut, Vittorio Ferrari

CVPR 2023 MetaCLUE: Towards Comprehensive Visual Metaphors Research Arjun R. Akula, Brendan Driscoll, Pradyumna Narayana, Soravit Changpinyo, Zhiwei Jia, Suyash Damle, Garima Pruthi, Sugato Basu, Leonidas Guibas, William T. Freeman, Yuanzhen Li, Varun Jampani

ICLR 2023 PaLI: A Jointly-Scaled Multilingual Language-Image Model Xi Chen, Xiao Wang, Soravit Changpinyo, Aj Piergiovanni, Piotr Padlewski, Daniel Salz, Sebastian Goodman, Adam Grycner, Basil Mustafa, Lucas Beyer, Alexander Kolesnikov, Joan Puigcerver, Nan Ding, Keran Rong, Hassan Akbari, Gaurav Mishra, Linting Xue, Ashish V Thapliyal, James Bradbury, Weicheng Kuo, Mojtaba Seyedhosseini, Chao Jia, Burcu Karagol Ayan, Carlos Riquelme Ruiz, Andreas Peter Steiner, Anelia Angelova, Xiaohua Zhai, Neil Houlsby, Radu Soricut

ICCV 2023 PreSTU: Pre-Training for Scene-Text Understanding Jihyung Kil, Soravit Changpinyo, Xi Chen, Hexiang Hu, Sebastian Goodman, Wei-Lun Chao, Radu Soricut

NeurIPS 2023 What You See Is What You Read? Improving Text-Image Alignment Evaluation Michal Yarom, Yonatan Bitton, Soravit Changpinyo, Roee Aharoni, Jonathan Herzig, Oran Lang, Eran Ofek, Idan Szpektor

ECCV 2022 PACTran: PAC-Bayesian Metrics for Estimating the Transferability of Pretrained Models to Classification Tasks Nan Ding, Xi Chen, Tomer Levinboim, Soravit Changpinyo, Radu Soricut

CVPR 2021 Conceptual 12m: Pushing Web-Scale Image-Text Pre-Training to Recognize Long-Tail Visual Concepts Soravit Changpinyo, Piyush Sharma, Nan Ding, Radu Soricut

ICCV 2021 MosaicOS: A Simple and Effective Use of Object-Centric Images for Long-Tailed Object Detection Cheng Zhang, Tai-Yu Pan, Yandong Li, Hexiang Hu, Dong Xuan, Soravit Changpinyo, Boqing Gong, Wei-Lun Chao

NeurIPS 2021 On Model Calibration for Long-Tailed Object Detection and Instance Segmentation Tai-Yu Pan, Cheng Zhang, Yandong Li, Hexiang Hu, Dong Xuan, Soravit Changpinyo, Boqing Gong, Wei-Lun Chao

NeurIPS 2021 Robust Visual Reasoning via Language Guided Neural Module Networks Arjun Akula, Varun Jampani, Soravit Changpinyo, Song-Chun Zhu

ICCV 2021 Telling the What While Pointing to the Where: Multimodal Queries for Image Retrieval Soravit Changpinyo, Jordi Pont-Tuset, Vittorio Ferrari, Radu Soricut

ECCV 2020 Connecting Vision and Language with Localized Narratives Jordi Pont-Tuset, Jasper Uijlings, Soravit Changpinyo, Radu Soricut, Vittorio Ferrari

ICCV 2017 Predicting Visual Exemplars of Unseen Classes for Zero-Shot Learning Soravit Changpinyo, Wei-Lun Chao, Fei Sha

ECCV 2016 An Empirical Study and Analysis of Generalized Zero-Shot Learning for Object Recognition in the Wild Wei-Lun Chao, Soravit Changpinyo, Boqing Gong, Fei Sha

CVPR 2016 Synthesized Classifiers for Zero-Shot Learning Soravit Changpinyo, Wei-Lun Chao, Boqing Gong, Fei Sha

NeurIPS 2013 Similarity Component Analysis Soravit Changpinyo, Kuan Liu, Fei Sha