Cholakkal, Hisham

36 publications

ICCV 2025 Adapting In-Domain Few-Shot Segmentation to New Domains Without Source Domain Retraining Qi Fan, Kaiqi Liu, Nian Liu, Hisham Cholakkal, Rao Muhammad Anwer, Wenbin Li, Yang Gao

WACV 2025 AgroGPT: Efficient Agricultural Vision-Language Model with Expert Tuning Muhammad Awais, Ali Husain Salem Abdulla Alharthi, Amandeep Kumar, Hisham Cholakkal, Rao Muhammad Anwer

CVPR 2025 All Languages Matter: Evaluating LMMs on Culturally Diverse 100 Languages Ashmal Vayani, Dinura Dissanayake, Hasindri Watawana, Noor Ahsan, Nevasini Sasikumar, Omkar Thawakar, Henok Biadglign Ademtew, Yahya Hmaiti, Amandeep Kumar, Kartik Kukreja, Mykola Maslych, Wafa Al Ghallabi, Mihail Minkov Mihaylov, Chao Qin, Abdelrahman M. Shaker, Mike Zhang, Mahardika Krisna Ihsani, Amiel Gian Esplana, Monil Gokani, Shachar Mirkin, Harsh Singh, Ashay Srivastava, Endre Hamerlik, Fathinah Asma Izzati, Fadillah Adamsyah Maani, Sebastian Cavada, Jenny Chim, Rohit Gupta, Sanjay Manjunath, Kamila Zhumakhanova, Feno Heriniaina Rabevohitra, Azril Hafizi Amirudin, Muhammad Ridzuan, Daniya Najiha Abdul Kareem, Ketan Pravin More, Kunyang Li, Pramesh Shakya, Muhammad Saad, Amirpouya Ghasemaghaei, Amirbek Djanibekov, Dilshod Azizov, Branislava Jankovic, Naman Bhatia, Alvaro Cabrera, Johan Obando-Ceron, Olympiah Otieno, Febian Farestam, Muztoba Rabbani, Sanoojan Ballah, Santosh Sanjeev, Abduragim Shtanchaev, Maheen Fatima, Thao Nguyen, Amrin Kareem, Toluwani Aremu, Nathan Augusto Zacarias Xavier, Amit Bhatkal, Hawau Olamide Toyin, Aman Chadha, Hisham Cholakkal, Rao Muhammad Anwer, Michael Felsberg, Jorma Laaksonen, Thamar Solorio, Monojit Choudhury, Ivan Laptev, Mubarak Shah, Salman Khan, Fahad Shahbaz Khan

NeurIPS 2025 DEFT: Decompositional Efficient Fine-Tuning for Text-to-Image Models Komal Kumar, Rao Muhammad Anwer, Fahad Shahbaz Khan, Salman Khan, Ivan Laptev, Hisham Cholakkal

ICLRW 2025 MobiLlama: Towards Accurate & Lightweight Fully Transparent GPT Omkar Chakradhar Thawakar, Ashmal Vayani, Salman Khan, Hisham Cholakkal, Rao Muhammad Anwer, Michael Felsberg, Timothy Baldwin, Eric P. Xing, Fahad Shahbaz Khan

ICLR 2025 Open-YOLO 3D: Towards Fast and Accurate Open-Vocabulary 3D Instance Segmentation Mohamed El Amine Boudjoghra, Angela Dai, Jean Lahoud, Hisham Cholakkal, Rao Muhammad Anwer, Salman Khan, Fahad Shahbaz Khan

WACV 2025 PALO: A Polyglot Large Multimodal Model for 5b People Hanoona Rasheed, Muhammad Maaz, Abdelrahman Shaker, Salman Khan, Hisham Cholakkal, Rao M. Anwer, Tim Baldwin, Michael Felsberg, Fahad S. Khan

ICCV 2025 TAViS: Text-Bridged Audio-Visual Segmentation with Foundation Models Ziyang Luo, Nian Liu, Xuguang Yang, Salman Khan, Rao Muhammad Anwer, Hisham Cholakkal, Fahad Shahbaz Khan, Junwei Han

ICML 2024 Bidirectional Reciprocative Information Communication for Few-Shot Semantic Segmentation Yuanwei Liu, Junwei Han, Xiwen Yao, Salman Khan, Hisham Cholakkal, Rao Muhammad Anwer, Nian Liu, Fahad Shahbaz Khan

ECCV 2024 CONDA: Condensed Deep Association Learning for Co-Salient Object Detection. Long Li, Nian Liu, Dingwen Zhang, Zhongyu Li, Salman Khan, Rao Anwer, Hisham Cholakkal, Junwei Han, Fahad Shahbaz Khan

ECCV 2024 Continual Learning and Unknown Object Discovery in 3D Scenes via Self-Distillation Mohamed El Amine Boudjoghra, Jean Lahoud, Salman Khan, Hisham Cholakkal, Rao M Anwer, Fahad Shahbaz Khan

WACV 2024 DDAM-PS: Diligent Domain Adaptive Mixer for Person Search Mohammed Khaleed Almansoori, Mustansar Fiaz, Hisham Cholakkal

ECCV 2024 Efficient 3D-Aware Facial Image Editing via Attribute-Specific Prompt Learning Amandeep Kumar, Muhammad Awais, Sanath Narayan, Hisham Cholakkal, Salman Khan, Rao Muhammad Anwer

CVPR 2024 GLaMM: Pixel Grounding Large Multimodal Model Hanoona Rasheed, Muhammad Maaz, Sahal Shaji, Abdelrahman Shaker, Salman Khan, Hisham Cholakkal, Rao M. Anwer, Eric Xing, Ming-Hsuan Yang, Fahad S. Khan

ECCV 2024 PARIS3D: Reasoning-Based 3D Part Segmentation Using Large Multimodal Model Amrin Kareem, Jean Lahoud, Hisham Cholakkal

CVPR 2024 Rethinking Transformers Pre-Training for Multi-Spectral Satellite Imagery Mubashir Noman, Muzammal Naseer, Hisham Cholakkal, Rao Muhammad Anwer, Salman Khan, Fahad Shahbaz Khan

AAAI 2024 Semi-Supervised Open-World Object Detection Sahal Shaji Mullappilly, Abhishek Singh Gehlot, Rao Muhammad Anwer, Fahad Shahbaz Khan, Hisham Cholakkal

WACV 2024 TransRadar: Adaptive-Directional Transformer for Real-Time Multi-View Radar Semantic Segmentation Yahia Dalbah, Jean Lahoud, Hisham Cholakkal

NeurIPS 2023 3D Indoor Instance Segmentation in an Open-World Mohamed El Amine Boudjoghra, Salwa Al Khatib, Jean Lahoud, Hisham Cholakkal, Rao Anwer, Salman H Khan, Fahad Shahbaz Khan

CVPR 2023 Discriminative Co-Saliency and Background Mining Transformer for Co-Salient Object Detection Long Li, Junwei Han, Ni Zhang, Nian Liu, Salman Khan, Hisham Cholakkal, Rao Muhammad Anwer, Fahad Shahbaz Khan

ICCV 2023 Generative Multiplane Neural Radiance for 3D-Aware Image Generation Amandeep Kumar, Ankan Kumar Bhunia, Sanath Narayan, Hisham Cholakkal, Rao Muhammad Anwer, Salman Khan, Ming-Hsuan Yang, Fahad Shahbaz Khan

NeurIPS 2023 Handling Data Heterogeneity via Architectural Design for Federated Visual Recognition Sara Pieri, Jose Restom, Samuel Horváth, Hisham Cholakkal

ICCV 2023 Multi-Grained Temporal Prototype Learning for Few-Shot Video Object Segmentation Nian Liu, Kepan Nan, Wangbo Zhao, Yuanwei Liu, Xiwen Yao, Salman Khan, Hisham Cholakkal, Rao Muhammad Anwer, Junwei Han, Fahad Shahbaz Khan

CVPR 2023 Person Image Synthesis via Denoising Diffusion Model Ankan Kumar Bhunia, Salman Khan, Hisham Cholakkal, Rao Muhammad Anwer, Jorma Laaksonen, Mubarak Shah, Fahad Shahbaz Khan

WACV 2023 SAT: Scale-Augmented Transformer for Person Search Mustansar Fiaz, Hisham Cholakkal, Rao Muhammad Anwer, Fahad Shahbaz Khan

ECCV 2022 DoodleFormer: Creative Sketch Drawing with Transformers Ankan Kumar Bhunia, Salman Khan, Hisham Cholakkal, Rao Muhammad Anwer, Fahad Shahbaz Khan, Jorma Laaksonen, Michael Felsberg

ECCVW 2022 EdgeNeXt: Efficiently Amalgamated CNN-Transformer Architecture for Mobile Vision Applications Muhammad Maaz, Abdelrahman M. Shaker, Hisham Cholakkal, Salman H. Khan, Syed Waqas Zamir, Rao Muhammad Anwer, Fahad Shahbaz Khan

CVPR 2022 PSTR: End-to-End One-Step Person Search with Transformers Jiale Cao, Yanwei Pang, Rao Muhammad Anwer, Hisham Cholakkal, Jin Xie, Mubarak Shah, Fahad Shahbaz Khan

ECCV 2022 Video Instance Segmentation via Multi-Scale Spatio-Temporal Split Attention Transformer Omkar Thawakar, Sanath Narayan, Jiale Cao, Hisham Cholakkal, Rao Muhammad Anwer, Muhammad Haris Khan, Salman Khan, Michael Felsberg, Fahad Shahbaz Khan

ICCV 2021 D2-Net: Weakly-Supervised Action Localization via Discriminative Embeddings and Denoised Activations Sanath Narayan, Hisham Cholakkal, Munawar Hayat, Fahad Shahbaz Khan, Ming-Hsuan Yang, Ling Shao

ICCV 2021 Handwriting Transformers Ankan Kumar Bhunia, Salman Khan, Hisham Cholakkal, Rao Muhammad Anwer, Fahad Shahbaz Khan, Mubarak Shah

ECCV 2020 Count- and Similarity-Aware R-CNN for Pedestrian Detection Jin Xie, Hisham Cholakkal, Rao Muhammad Anwer, Fahad Shahbaz Khan, Yanwei Pang, Ling Shao, Mubarak Shah

AAAI 2020 Fine-Grained Recognition: Accounting for Subtle Differences Between Similar Classes Guolei Sun, Hisham Cholakkal, Salman H. Khan, Fahad Shahbaz Khan, Ling Shao

ECCV 2020 Fixing Localization Errors to Improve Image Classification Guolei Sun, Salman Khan, Wen Li, Hisham Cholakkal, Fahad Shahbaz Khan, Luc Van Gool

ECCV 2020 SipMask: Spatial Information Preservation for Fast Image and Video Instance Segmentation Jiale Cao, Rao Muhammad Anwer, Hisham Cholakkal, Fahad Shahbaz Khan, Yanwei Pang, Ling Shao

CVPR 2016 Backtracking ScSPM Image Classifier for Weakly Supervised Top-Down Saliency Hisham Cholakkal, Jubin Johnson, Deepu Rajan