Herzig, Roei

22 publications

ICCV 2025 Enhancing Few-Shot Vision-Language Classification with Large Multimodal Model Features Chancharik Mitra, Brandon Huang, Tianning Chai, Zhiqiu Lin, Assaf Arbelle, Rogerio Feris, Leonid Karlinsky, Trevor Darrell, Deva Ramanan, Roei Herzig

ICML 2025 Pre-Training Auto-Regressive Robotic Models with 4D Representations Dantong Niu, Yuvan Sharma, Haoru Xue, Giscard Biamby, Junyi Zhang, Ziteng Ji, Trevor Darrell, Roei Herzig

CVPR 2024 Compositional Chain-of-Thought Prompting for Large Multimodal Models Chancharik Mitra, Brandon Huang, Trevor Darrell, Roei Herzig

NeurIPS 2024 ConMe: Rethinking Evaluation of Compositional Reasoning for Modern VLMs Irene Huang, Wei Lin, M. Jehanzeb Mirza, Jacob A. Hansen, Sivan Doveh, Victor Ion Butoi, Roei Herzig, Assaf Arbelle, Hilde Kuehne, Trevor Darrell, Chuang Gan, Aude Oliva, Rogerio Feris, Leonid Karlinsky

CoRL 2024 LLARVA: Vision-Action Instruction Tuning Enhances Robot Learning Dantong Niu, Yuvan Sharma, Giscard Biamby, Jerome Quenum, Yutong Bai, Baifeng Shi, Trevor Darrell, Roei Herzig

NeurIPS 2024 Multimodal Task Vectors Enable Many-Shot Multimodal In-Context Learning Brandon Huang, Chancharik Mitra, Assaf Arbelle, Leonid Karlinsky, Trevor Darrell, Roei Herzig

WACV 2024 PromptonomyViT: Multi-Task Prompt Learning Improves Video Transformers Using Synthetic Scene Data Roei Herzig, Ofir Abramovich, Elad Ben Avraham, Assaf Arbelle, Leonid Karlinsky, Ariel Shamir, Trevor Darrell, Amir Globerson

ECCV 2024 Recursive Visual Programming Jiaxin Ge, Sanjay Subramanian, Baifeng Shi, Roei Herzig, Trevor Darrell

CVPR 2024 Unsupervised Universal Image Segmentation Dantong Niu, Xudong Wang, Xinyang Han, Long Lian, Roei Herzig, Trevor Darrell

NeurIPS 2023 Dense and Aligned Captions (DAC) Promote Compositional Reasoning in VL Models Sivan Doveh, Assaf Arbelle, Sivan Harary, Roei Herzig, Donghyun Kim, Paola Cascante-Bonilla, Amit Alfassy, Rameswar Panda, Raja Giryes, Rogerio Feris, Shimon Ullman, Leonid Karlinsky

CVPR 2023 Teaching Structured Vision & Language Concepts to Vision & Language Models Sivan Doveh, Assaf Arbelle, Sivan Harary, Eli Schwartz, Roei Herzig, Raja Giryes, Rogerio Feris, Rameswar Panda, Shimon Ullman, Leonid Karlinsky

NeurIPS 2022 Bringing Image Scene Structure to Video via Frame-CLIP Consistency of Object Tokens Elad Ben Avraham, Roei Herzig, Karttikeya Mangalam, Amir Bar, Anna Rohrbach, Leonid Karlinsky, Trevor Darrell, Amir Globerson

CVPR 2022 DETReg: Unsupervised Pretraining with Region Priors for Object Detection Amir Bar, Xin Wang, Vadim Kantorov, Colorado J. Reed, Roei Herzig, Gal Chechik, Anna Rohrbach, Trevor Darrell, Amir Globerson

NeurIPS 2022 FETA: Towards Specializing Foundational Models for Expert Task Applications Amit Alfassy, Assaf Arbelle, Oshri Halimi, Sivan Harary, Roei Herzig, Eli Schwartz, Rameswar Panda, Michele Dolfi, Christoph Auer, Peter Staar, Kate Saenko, Rogerio Feris, Leonid Karlinsky

CVPR 2022 Object-Region Video Transformers Roei Herzig, Elad Ben-Avraham, Karttikeya Mangalam, Amir Bar, Gal Chechik, Anna Rohrbach, Trevor Darrell, Amir Globerson

CVPR 2022 Unsupervised Domain Generalization by Learning a Bridge Across Domains Sivan Harary, Eli Schwartz, Assaf Arbelle, Peter Staar, Shady Abu-Hussein, Elad Amrani, Roei Herzig, Amit Alfassy, Raja Giryes, Hilde Kuehne, Dina Katabi, Kate Saenko, Rogerio S. Feris, Leonid Karlinsky

ICML 2021 Compositional Video Synthesis with Action Graphs Amir Bar, Roei Herzig, Xiaolong Wang, Anna Rohrbach, Gal Chechik, Trevor Darrell, Amir Globerson

WACV 2020 Differentiable Scene Graphs Moshiko Raboh, Roei Herzig, Jonathan Berant, Gal Chechik, Amir Globerson

ECCV 2020 Learning Canonical Representations for Scene Graph to Image Generation Roei Herzig, Amir Bar, Huijuan Xu, Gal Chechik, Trevor Darrell, Amir Globerson

CVPRW 2019 Accurate Visual Localization for Automotive Applications Eli Brosh, Matan Friedmann, Ilan Kadar, Lev Yitzhak Lavy, Elad Levi, Shmuel Rippa, Yair Lempert, Bruno Fernandez-Ruiz, Roei Herzig, Trevor Darrell

ICCVW 2019 Spatio-Temporal Action Graph Networks Roei Herzig, Elad Levi, Huijuan Xu, Hang Gao, Eli Brosh, Xiaolong Wang, Amir Globerson, Trevor Darrell

NeurIPS 2018 Mapping Images to Scene Graphs with Permutation-Invariant Structured Prediction Roei Herzig, Moshiko Raboh, Gal Chechik, Jonathan Berant, Amir Globerson