Feris, Rogerio

69 publications

ICCV 2025 BATCLIP: Bimodal Online Test-Time Adaptation for CLIP Sarthak Maharana, Baoming Zhang, Leonid Karlinsky, Rogerio Feris, Yunhui Guo

CVPR 2025 CAV-MAE Sync: Improving Contrastive Audio-Visual Mask Autoencoders via Fine-Grained Alignment Edson Araujo, Andrew Rouditchenko, Yuan Gong, Saurabhchand Bhati, Samuel Thomas, Brian Kingsbury, Leonid Karlinsky, Rogerio Feris, James R. Glass, Hilde Kuehne

CVPRW 2025 Comparison Visual Instruction Tuning Wei Lin, Muhammad Jehanzeb Mirza, Sivan Doveh, Rogério Feris, Raja Giryes, Sepp Hochreiter, Leonid Karlinsky

ICCV 2025 Enhancing Few-Shot Vision-Language Classification with Large Multimodal Model Features Chancharik Mitra, Brandon Huang, Tianning Chai, Zhiqiu Lin, Assaf Arbelle, Rogerio Feris, Leonid Karlinsky, Trevor Darrell, Deva Ramanan, Roei Herzig

TMLR 2025 GLOV: Guided Large Language Models as Implicit Optimizers for Vision Language Models Muhammad Jehanzeb Mirza, Mengjie Zhao, Zhuoyuan Mao, Sivan Doveh, Wei Lin, Paul Gavrikov, Michael Dorkenwald, Shiqi Yang, Saurav Jha, Hiromi Wakaki, Yuki Mitsufuji, Horst Possegger, Rogerio Feris, Leonid Karlinsky, James R. Glass

ICML 2025 M+: Extending MemoryLLM with Scalable Long-Term Memory Yu Wang, Dmitry Krotov, Yuanzhe Hu, Yifan Gao, Wangchunshu Zhou, Julian Mcauley, Dan Gutfreund, Rogerio Feris, Zexue He

ICLR 2025 Self-MoE: Towards Compositional Large Language Models with Self-Specialized Experts Junmo Kang, Leonid Karlinsky, Hongyin Luo, Zhen Wang, Jacob A Hansen, James R. Glass, David Daniel Cox, Rameswar Panda, Rogerio Feris, Alan Ritter

ICCV 2025 Teaching VLMs to Localize Specific Objects from In-Context Examples Sivan Doveh, Nimrod Shabtay, Eli Schwartz, Hilde Kuehne, Raja Giryes, Rogerio Feris, Leonid Karlinsky, James Glass, Assaf Arbelle, Shimon Ullman, M. Jehanzeb Mirza

NeurIPS 2024 $\textit{Trans-LoRA}$: Towards Data-Free Transferable Parameter Efficient Finetuning Runqian Wang, Soumya Ghosh, David Cox, Diego Antognini, Aude Oliva, Rogerio Feris, Leonid Karlinsky

CVPRW 2024 Adaptive Memory Replay for Continual Learning James Seale Smith, Lazar Valkov, Shaunak Halbe, Vyshnavi Gutta, Rogério Feris, Zsolt Kira, Leonid Karlinsky

ICMLW 2024 CAMELoT: Towards Large Language Models with Training-Free Consolidated Associative Memory Zexue He, Leonid Karlinsky, Donghyun Kim, Julian McAuley, Dmitry Krotov, Rogerio Feris

NeurIPSW 2024 Comparison Visual Instruction Tuning Wei Lin, Muhammad Jehanzeb Mirza, Sivan Doveh, Rogerio Feris, Raja Giryes, Sepp Hochreiter, Leonid Karlinsky

NeurIPS 2024 ConMe: Rethinking Evaluation of Compositional Reasoning for Modern VLMs Irene Huang, Wei Lin, M. Jehanzeb Mirza, Jacob A. Hansen, Sivan Doveh, Victor Ion Butoi, Roei Herzig, Assaf Arbelle, Hilde Kuehne, Trevor Darrell, Chuang Gan, Aude Oliva, Rogerio Feris, Leonid Karlinsky

WACV 2024 Improved Techniques for Quantizing Deep Networks with Adaptive Bit-Widths Ximeng Sun, Rameswar Panda, Chun-Fu Richard Chen, Naigang Wang, Bowen Pan, Aude Oliva, Rogerio Feris, Kate Saenko

ICMLW 2024 Long Context Understanding Using Self-Generated Synthetic Data Jerry Li, Subhro Das, Aude Oliva, Dmitry Krotov, Leonid Karlinsky, Rogerio Feris

CVPR 2024 What When and Where? Self-Supervised Spatio-Temporal Grounding in Untrimmed Multi-Action Videos from Narrated Instructions Brian Chen, Nina Shvetsova, Andrew Rouditchenko, Daniel Kondermann, Samuel Thomas, Shih-Fu Chang, Rogerio Feris, James Glass, Hilde Kuehne

WACV 2023 Addressing Feature Suppression in Unsupervised Visual Representations Tianhong Li, Lijie Fan, Yuan Yuan, Hao He, Yonglong Tian, Rogerio Feris, Piotr Indyk, Dina Katabi

ICCV 2023 CDAC: Cross-Domain Attention Consistency in Transformer for Domain Adaptive Semantic Segmentation Kaihong Wang, Donghyun Kim, Rogerio Feris, Margrit Betke

CVPR 2023 CODA-Prompt: COntinual Decomposed Attention-Based Prompting for Rehearsal-Free Continual Learning James Seale Smith, Leonid Karlinsky, Vyshnavi Gutta, Paola Cascante-Bonilla, Donghyun Kim, Assaf Arbelle, Rameswar Panda, Rogerio Feris, Zsolt Kira

CVPR 2023 ConStruct-VL: Data-Free Continual Structured VL Concepts Learning James Seale Smith, Paola Cascante-Bonilla, Assaf Arbelle, Donghyun Kim, Rameswar Panda, David Cox, Diyi Yang, Zsolt Kira, Rogerio Feris, Leonid Karlinsky

NeurIPS 2023 Dense and Aligned Captions (DAC) Promote Compositional Reasoning in VL Models Sivan Doveh, Assaf Arbelle, Sivan Harary, Roei Herzig, Donghyun Kim, Paola Cascante-Bonilla, Amit Alfassy, Rameswar Panda, Raja Giryes, Rogerio Feris, Shimon Ullman, Leonid Karlinsky

ICCV 2023 Going Beyond Nouns with Vision & Language Models Using Synthetic Data Paola Cascante-Bonilla, Khaled Shehada, James Seale Smith, Sivan Doveh, Donghyun Kim, Rameswar Panda, Gul Varol, Aude Oliva, Vicente Ordonez, Rogerio Feris, Leonid Karlinsky

NeurIPS 2023 LaFTer: Label-Free Tuning of Zero-Shot Classifier Using Language and Unlabeled Image Collections Muhammad Jehanzeb Mirza, Leonid Karlinsky, Wei Lin, Horst Possegger, Mateusz Kozinski, Rogerio Feris, Horst Bischof

NeurIPS 2023 Learning Human Action Recognition Representations Without Real Humans Howard Zhong, Samarth Mishra, Donghyun Kim, SouYoung Jin, Rameswar Panda, Hilde Kuehne, Leonid Karlinsky, Venkatesh Saligrama, Aude Oliva, Rogerio Feris

ICLR 2023 Learning to Grow Pretrained Models for Efficient Transformer Training Peihao Wang, Rameswar Panda, Lucas Torroba Hennigen, Philip Greengard, Leonid Karlinsky, Rogerio Feris, David Daniel Cox, Zhangyang Wang, Yoon Kim

ICCV 2023 MAtch, eXpand and Improve: Unsupervised Finetuning for Zero-Shot Action Recognition with Language Knowledge Wei Lin, Leonid Karlinsky, Nina Shvetsova, Horst Possegger, Mateusz Kozinski, Rameswar Panda, Rogerio Feris, Hilde Kuehne, Horst Bischof

ICLR 2023 Multitask Prompt Tuning Enables Parameter-Efficient Transfer Learning Zhen Wang, Rameswar Panda, Leonid Karlinsky, Rogerio Feris, Huan Sun, Yoon Kim

WACV 2023 Select, Label, and Mix: Learning Discriminative Invariant Feature Representations for Partial Domain Adaptation Aadarsh Sahoo, Rameswar Panda, Rogerio Feris, Kate Saenko, Abir Das

CVPR 2023 Teaching Structured Vision & Language Concepts to Vision & Language Models Sivan Doveh, Assaf Arbelle, Sivan Harary, Eli Schwartz, Roei Herzig, Raja Giryes, Rogerio Feris, Rameswar Panda, Shimon Ullman, Leonid Karlinsky

NeurIPS 2022 FETA: Towards Specializing Foundational Models for Expert Task Applications Amit Alfassy, Assaf Arbelle, Oshri Halimi, Sivan Harary, Roei Herzig, Eli Schwartz, Rameswar Panda, Michele Dolfi, Christoph Auer, Peter Staar, Kate Saenko, Rogerio Feris, Leonid Karlinsky

NeurIPS 2022 How Transferable Are Video Representations Based on Synthetic Data? Yo-whan Kim, Samarth Mishra, SouYoung Jin, Rameswar Panda, Hilde Kuehne, Leonid Karlinsky, Venkatesh Saligrama, Kate Saenko, Aude Oliva, Rogerio Feris

NeurIPS 2022 Procedural Image Programs for Representation Learning Manel Baradad, Richard Chen, Jonas Wulff, Tongzhou Wang, Rogerio Feris, Antonio Torralba, Phillip Isola

ICCV 2021 A Broad Study on the Transferability of Visual Representations with Contrastive Learning Ashraful Islam, Chun-Fu Chen, Rameswar Panda, Leonid Karlinsky, Richard Radke, Rogerio Feris

ICLR 2021 AdaFuse: Adaptive Temporal Fusion Network for Efficient Action Recognition Yue Meng, Rameswar Panda, Chung-Ching Lin, Prasanna Sattigeri, Leonid Karlinsky, Kate Saenko, Aude Oliva, Rogerio Feris

ICCV 2021 AdaMML: Adaptive Multi-Modal Learning for Efficient Video Recognition Rameswar Panda, Chun-Fu Chen, Quanfu Fan, Ximeng Sun, Kate Saenko, Aude Oliva, Rogerio Feris

CVPR 2021 Deep Analysis of CNN-Based Spatio-Temporal Representations for Action Recognition Chun-Fu Richard Chen, Rameswar Panda, Kandan Ramakrishnan, Rogerio Feris, John Cohn, Aude Oliva, Quanfu Fan

ICCV 2021 Detector-Free Weakly Supervised Grounding by Separation Assaf Arbelle, Sivan Doveh, Amit Alfassy, Joseph Shtok, Guy Lev, Eli Schwartz, Hilde Kuehne, Hila Barak Levi, Prasanna Sattigeri, Rameswar Panda, Chun-Fu Chen, Alex Bronstein, Kate Saenko, Shimon Ullman, Raja Giryes, Rogerio Feris, Leonid Karlinsky

NeurIPS 2021 Dynamic Distillation Network for Cross-Domain Few-Shot Recognition with Unlabeled Data Ashraful Islam, Chun-Fu Chen, Rameswar Panda, Leonid Karlinsky, Rogerio Feris, Richard J. Radke

ICCV 2021 Dynamic Network Quantization for Efficient Video Inference Ximeng Sun, Rameswar Panda, Chun-Fu Chen, Aude Oliva, Rogerio Feris, Kate Saenko

CVPR 2021 Fashion IQ: A New Dataset Towards Retrieving Images by Natural Language Feedback Hui Wu, Yupeng Gao, Xiaoxiao Guo, Ziad Al-Halah, Steven Rennie, Kristen Grauman, Rogerio Feris

CVPR 2021 Fine-Grained Angular Contrastive Learning with Coarse Labels Guy Bukchin, Eli Schwartz, Kate Saenko, Ori Shahar, Rogerio Feris, Raja Giryes, Leonid Karlinsky

NeurIPS 2021 IA-RED$^2$: Interpretability-Aware Redundancy Reduction for Vision Transformers Bowen Pan, Rameswar Panda, Yifan Jiang, Zhangyang Wang, Rogerio Feris, Aude Oliva

ICCV 2021 Multimodal Clustering Networks for Self-Supervised Learning from Unlabeled Videos Brian Chen, Andrew Rouditchenko, Kevin Duarte, Hilde Kuehne, Samuel Thomas, Angie Boggust, Rameswar Panda, Brian Kingsbury, Rogerio Feris, David Harwath, James Glass, Michael Picheny, Shih-Fu Chang

AAAI 2021 NASTransfer: Analyzing Architecture Transferability in Large Scale Neural Architecture Search Rameswar Panda, Michele Merler, Mayoore S. Jaiswal, Hui Wu, Kandan Ramakrishnan, Ulrich Finkler, Chun-Fu (Richard) Chen, Minsik Cho, Rogério Feris, David S. Kung, Bishwaranjan Bhattacharjee

CVPRW 2021 Pseudo-IoU: Improving Label Assignment in Anchor-Free Object Detection Jiachen Li, Bowen Cheng, Rogério Feris, Jinjun Xiong, Thomas S. Huang, Wen-Mei Hwu, Humphrey Shi

NeurIPSW 2021 Select, Label, and Mix: Learning Discriminative Invariant Feature Representations for Partial Domain Adaptation Aadarsh Sahoo, Rameswar Panda, Rogerio Feris, Kate Saenko, Abir Das

CVPR 2021 Semi-Supervised Action Recognition with Temporal Contrastive Learning Ankit Singh, Omprakash Chakraborty, Ashutosh Varshney, Rameswar Panda, Rogerio Feris, Kate Saenko, Abir Das

CVPR 2021 Separating Skills and Concepts for Novel Visual Question Answering Spencer Whitehead, Hui Wu, Heng Ji, Rogerio Feris, Kate Saenko

CVPR 2021 Spoken Moments: Learning Joint Audio-Visual Representations from Video Descriptions Mathew Monfort, SouYoung Jin, Alexander Liu, David Harwath, Rogerio Feris, James Glass, Aude Oliva

AAAI 2021 StarNet: Towards Weakly Supervised Few-Shot Object Detection Leonid Karlinsky, Joseph Shtok, Amit Alfassy, Moshe Lichtenstein, Sivan Harary, Eli Schwartz, Sivan Doveh, Prasanna Sattigeri, Rogério Feris, Alex M. Bronstein, Raja Giryes

ICLR 2021 VA-RED$^2$: Video Adaptive Redundancy Reduction Bowen Pan, Rameswar Panda, Camilo Luciano Fosco, Chung-Ching Lin, Alex J Andonian, Yue Meng, Kate Saenko, Aude Oliva, Rogerio Feris

ECCV 2020 A Broader Study of Cross-Domain Few-Shot Learning Yunhui Guo, Noel C. Codella, Leonid Karlinsky, James V. Codella, John R. Smith, Kate Saenko, Tajana Rosing, Rogerio Feris

ECCV 2020 AR-Net: Adaptive Frame Resolution for Efficient Action Recognition Yue Meng, Chung-Ching Lin, Rameswar Panda, Prasanna Sattigeri, Leonid Karlinsky, Aude Oliva, Kate Saenko, Rogerio Feris

NeurIPS 2020 AdaShare: Learning What to Share for Efficient Deep Multi-Task Learning Ximeng Sun, Rameswar Panda, Rogerio Feris, Kate Saenko

ECCV 2020 OnlineAugment: Online Data Augmentation with Less Domain Knowledge Zhiqiang Tang, Yunhe Gao, Leonid Karlinsky, Prasanna Sattigeri, Rogerio Feris, Dimitris Metaxas

CVPRW 2020 Relationship Matters: Relation Guided Knowledge Transfer for Incremental Learning of Object Detectors Kandan Ramakrishnan, Rameswar Panda, Quanfu Fan, John Henning, Aude Oliva, Rogério Feris

ECCV 2020 TAFSSL: Task-Adaptive Feature Sub-Space Learning for Few-Shot Classification Moshe Lichtenstein, Prasanna Sattigeri, Rogerio Feris, Raja Giryes, Leonid Karlinsky

ECCV 2020 We Have so Much in Common: Modeling Semantic Relational Set Abstractions in Videos Alex Andonian, Camilo Fosco, Mathew Monfort, Allen Lee, Rogerio Feris, Carl Vondrick, Aude Oliva

ICLR 2019 Big-Little Net: An Efficient Multi-Scale Feature Representation for Visual and Speech Recognition Chun-Fu Chen, Quanfu Fan, Neil Mallinar, Tom Sercu, Rogerio Feris

ICCVW 2019 Video-Text Compliance: Activity Verification Based on Natural Language Instructions Mayoore Jaiswal, H. Peter Hofstee, Valerie Chen, Suvadip Paul, Rogério Feris, Frank Liu, Anupama Jagannathan, Anne Gattiker, Inseok Hwang, Jinho Lee, Matthew Tong, Sahil Dureja, Soham Shah

NeurIPS 2018 Co-Regularized Alignment for Unsupervised Domain Adaptation Abhishek Kumar, Prasanna Sattigeri, Kahini Wadhawan, Leonid Karlinsky, Rogerio Feris, Bill Freeman, Gregory Wornell

NeurIPS 2018 Delta-Encoder: An Effective Sample Synthesis Method for Few-Shot Object Recognition Eli Schwartz, Leonid Karlinsky, Joseph Shtok, Sivan Harary, Mattias Marder, Abhishek Kumar, Rogerio Feris, Raja Giryes, Alex Bronstein

NeurIPS 2018 Dialog-Based Interactive Image Retrieval Xiaoxiao Guo, Hui Wu, Yu Cheng, Steven Rennie, Gerald Tesauro, Rogerio Feris

ECCV 2018 Learning to Separate Object Sounds by Watching Unlabeled Video Ruohan Gao, Rogerio Feris, Kristen Grauman

ECCV 2018 Revisiting RCNN: On Awakening the Classification Power of Faster RCNN Bowen Cheng, Yunchao Wei, Honghui Shi, Rogerio Feris, Jinjun Xiong, Thomas Huang

CVPR 2017 Fully-Adaptive Feature Sharing in Multi-Task Networks with Applications in Person Attribute Classification Yongxi Lu, Abhishek Kumar, Shuangfei Zhai, Yu Cheng, Tara Javidi, Rogerio Feris

CVPR 2017 S3Pool: Pooling with Stochastic Spatial Sampling Shuangfei Zhai, Hui Wu, Abhishek Kumar, Yu Cheng, Yongxi Lu, Zhongfei Zhang, Rogerio Feris

CVPR 2015 Deep Domain Adaptation for Describing People Based on Fine-Grained Clothing Attributes Qiang Chen, Junshi Huang, Rogerio Feris, Lisa M. Brown, Jian Dong, Shuicheng Yan

CVPR 2013 Efficient Maximum Appearance Search for Large-Scale Object Detection Qiang Chen, Zheng Song, Rogerio Feris, Ankur Datta, Liangliang Cao, Zhongyang Huang, Shuicheng Yan