Toshev, Alexander

28 publications

CVPR 2025 From Multimodal LLMs to Generalist Embodied Agents: Methods and Lessons Andrew Szot, Bogdan Mazoure, Omar Attia, Aleksei Timofeev, Harsh Agrawal, Devon Hjelm, Zhe Gan, Zsolt Kira, Alexander Toshev

CVPR 2025 Multimodal Autoregressive Pre-Training of Large Vision Encoders Enrico Fini, Mustafa Shukor, Xiujun Li, Philipp Dufter, Michal Klein, David Haldimann, Sai Aitharaju, Victor G. Turrisi da Costa, Louis Béthune, Zhe Gan, Alexander Toshev, Marcin Eichner, Moin Nabi, Yinfei Yang, Joshua Susskind, Alaaeldin El-Nouby

ICCV 2025 UINavBench: A Framework for Comprehensive Evaluation of Interactive Digital Agents Harsh Agrawal, Eldon Schoop, Xinlei Pan, Anuj Mahajan, Ari Seff, Di Feng, Ruijia Cheng, Andres Romero Mier Y Teran, Esteban Gomez, Abhishek Sundararajan, Forrest Huang, Amanda Swearngin, Mohana Prasad Sathya Moorthy, Jeff Nichols, Alexander Toshev

CVPR 2025 World-Consistent Video Diffusion with Explicit 3D Modeling Qihang Zhang, Shuangfei Zhai, Miguel Ángel Bautista Martin, Kevin Miao, Alexander Toshev, Joshua Susskind, Jiatao Gu

NeurIPS 2024 DataComp-LM: In Search of the Next Generation of Training Sets for Language Models Jeffrey Li, Alex Fang, Georgios Smyrnis, Maor Ivgi, Matt Jordan, Samir Gadre, Hritik Bansal, Etash Guha, Sedrick Keh, Kushal Arora, Saurabh Garg, Rui Xin, Niklas Muennighoff, Reinhard Heckel, Jean Mercat, Mayee Chen, Suchin Gururangan, Mitchell Wortsman, Alon Albalak, Yonatan Bitton, Marianna Nezhurina, Amro Abbas, Cheng-Yu Hsieh, Dhruba Ghosh, Josh Gardner, Maciej Kilian, Hanlin Zhang, Rulin Shao, Sarah Pratt, Sunny Sanyal, Gabriel Ilharco, Giannis Daras, Kalyani Marathe, Aaron Gokaslan, Jieyu Zhang, Khyathi Chandu, Thao Nguyen, Igor Vasiljevic, Sham Kakade, Shuran Song, Sujay Sanghavi, Fartash Faghri, Sewoong Oh, Luke Zettlemoyer, Kyle Lo, Alaaeldin El-Nouby, Hadi Pouransari, Alexander Toshev, Stephanie Wang, Dirk Groeneveld, Luca Soldaini, Pang Wei Koh, Jenia Jitsev, Thomas Kollar, Alexandros G. Dimakis, Yair Carmon, Achal Dave, Ludwig Schmidt, Vaishaal Shankar

NeurIPS 2024 Grounding Multimodal Large Language Models in Actions Andrew Szot, Bogdan Mazoure, Harsh Agrawal, Devon Hjelm, Zsolt Kira, Alexander Toshev

ECCV 2024 MM1: Methods, Analysis & Insights from Multimodal LLM Pre-Training Brandon McKinzie, Zhe Gan, Jean-Philippe Fauconnier, Samuel Dodge, Bowen Zhang, Philipp Dufter, Dhruti Shah, Futang Peng, Anton Belyi, Max A Schwarzer, Hongyu Hè, Xianzhi Du, Haotian Zhang, Karanjeet Singh, Doug Kang, Tom Gunter, Xiang Kong, Aonan Zhang, Jianyu Wang, Chong Wang, Nan Du, Tao Lei, Sam Wiseman, Mark Lee, Zirui Wang, Ruoming Pang, Peter Grasch, Alexander Toshev, Yinfei Yang

ICCV 2023 Perceptual Grouping in Contrastive Vision-Language Models Kanchana Ranasinghe, Brandon McKinzie, Sachin Ravi, Yinfei Yang, Alexander Toshev, Jonathon Shlens

NeurIPSW 2023 Pre-Trained Language Models Do Not Help Auto-Regressive Text-to-Image Generation Yuhui Zhang, Brandon McKinzie, Zhe Gan, Vaishaal Shankar, Alexander Toshev

NeurIPS 2022 GAUDI: A Neural Architect for Immersive 3D Scene Generation Miguel Angel Bautista, Pengsheng Guo, Samira Abnar, Walter Talbott, Alexander Toshev, Zhuoyuan Chen, Laurent Dinh, Shuangfei Zhai, Hanlin Goh, Daniel Ulbricht, Afshin Dehghan, Joshua Susskind

ECCV 2020 Adversarial Generative Grammars for Human Activity Prediction Aj Piergiovanni, Anelia Angelova, Alexander Toshev, Michael S. Ryoo

CoRL 2020 Learning Object-Conditioned Exploration Using Distributed Soft Actor Critic Ayzaan Wahid, Austin Stone, Kevin Chen, Brian Ichter, Alexander Toshev

CoRL 2020 Modeling Long-Horizon Tasks as Sequential Interaction Landscapes Soeren Pirk, Karol Hausman, Alexander Toshev, Mohi Khansari

ICCV 2017 No Fuss Distance Metric Learning Using Proxies Yair Movshovitz-Attias, Alexander Toshev, Thomas K. Leung, Sergey Ioffe, Saurabh Singh

CVPR 2017 Towards Accurate Multi-Person Pose Estimation in the Wild George Papandreou, Tyler Zhu, Nori Kanazawa, Alexander Toshev, Jonathan Tompson, Chris Bregler, Kevin Murphy

ECCV 2016 Chained Predictions Using Convolutional Neural Networks Georgia Gkioxari, Alexander Toshev, Navdeep Jaitly

CVPR 2016 Generation and Comprehension of Unambiguous Object Descriptions Junhua Mao, Jonathan Huang, Alexander Toshev, Oana Camburu, Alan L. Yuille, Kevin Murphy

ECCV 2016 The Unreasonable Effectiveness of Noisy Data for Fine-Grained Recognition Jonathan Krause, Benjamin Sapp, Andrew Howard, Howard Zhou, Alexander Toshev, Tom Duerig, James Philbin, Li Fei-Fei

CVPR 2015 Show and Tell: A Neural Image Caption Generator Oriol Vinyals, Alexander Toshev, Samy Bengio, Dumitru Erhan

ICLR 2014 Deep Convolutional Ranking for Multilabel Image Annotation Yunchao Gong, Yangqing Jia, Thomas Leung, Alexander Toshev, Sergey Ioffe

CVPR 2014 DeepPose: Human Pose Estimation via Deep Neural Networks Alexander Toshev, Christian Szegedy

CVPR 2014 Scalable Object Detection Using Deep Neural Networks Dumitru Erhan, Christian Szegedy, Alexander Toshev, Dragomir Anguelov

NeurIPS 2013 Deep Neural Networks for Object Detection Christian Szegedy, Alexander Toshev, Dumitru Erhan

ECCV 2010 Cascaded Models for Articulated Pose Estimation Benjamin Sapp, Alexander Toshev, Ben Taskar

CVPR 2010 Detecting and Parsing Architecture at City Scale from Range Data Alexander Toshev, Philippos Mordohai, Ben Taskar

CVPR 2010 Object Detection via Boundary Structure Segmentation Alexander Toshev, Ben Taskar, Kostas Daniilidis

CVPR 2009 Shape-Based Object Recognition in Videos Using 3D Synthetic Object Models Alexander Toshev, Ameesh Makadia, Kostas Daniilidis

CVPR 2007 Image Matching via Saliency Region Correspondences Alexander Toshev, Jianbo Shi, Kostas Daniilidis