Sikka, Karan

12 publications

WACV 2025 A Video Is Worth 10000 Words: Training and Benchmarking with Diverse Captions for Better Long Video Retrieval Matthew Gwilliam, Michael Cogswell, Meng Ye, Karan Sikka, Abhinav Shrivastava, Ajay Divakaran

CVPR 2024 DRESS: Instructing Large Vision-Language Models to Align and Interact with Humans via Natural Language Feedback Yangyi Chen, Karan Sikka, Michael Cogswell, Heng Ji, Ajay Divakaran

ICCV 2023 TIJO: Trigger Inversion with Joint Optimization for Defending Multimodal Backdoored Models Indranil Sur, Karan Sikka, Matthew Walmer, Kaushik Koneripalli, Anirban Roy, Xiao Lin, Ajay Divakaran, Susmit Jha

WACV 2022 Challenges in Procedural Multimodal Machine Comprehension: A Novel Way to Benchmark Pritish Sahu, Karan Sikka, Ajay Divakaran

CVPR 2022 Dual-Key Multimodal Backdoors for Visual Question Answering Matthew Walmer, Karan Sikka, Indranil Sur, Abhinav Shrivastava, Susmit Jha

ECCV 2018 Zero-Shot Object Detection Ankan Bansal, Karan Sikka, Gaurav Sharma, Rama Chellappa, Ajay Divakaran

CVPR 2017 AdaScan: Adaptive Scan Pooling in Deep Convolutional Neural Networks for Human Action Recognition in Videos Amlan Kar, Nishant Rai, Karan Sikka, Gaurav Sharma

CVPR 2016 LOMo: Latent Ordinal Model for Facial Analysis in Videos Karan Sikka, Gaurav Sharma, Marian Bartlett

CVPRW 2015 Exemplar Hidden Markov Models for Classification of Facial Expressions in Videos Karan Sikka, Abhinav Dhall, Marian Stewart Bartlett

WACV 2014 A Discriminative Parts Based Model Approach for Fiducial Points Free and Shape Constrained Head Pose Normalisation in the Wild Abhinav Dhall, Karan Sikka, Gwen Littlewort, Roland Goecke, Marian Stewart Bartlett

ECCV 2012 Exploring Bag of Words Architectures in the Facial Expression Domain Karan Sikka, Tingfan Wu, Joshua Susskind, Marian Stewart Bartlett

ECCVW 2012 Exploring Bag of Words Architectures in the Facial Expression Domain Karan Sikka, Tingfan Wu, Joshua Susskind, Marian Stewart Bartlett