Suri, Saksham

11 publications

CVPR 2025 EdgeTAM: On-Device Track Anything Model Chong Zhou, Chenchen Zhu, Yunyang Xiong, Saksham Suri, Fanyi Xiao, Lemeng Wu, Raghuraman Krishnamoorthi, Bo Dai, Chen Change Loy, Vikas Chandra, Bilge Soran

ICCV 2025 Efficient Track Anything Yunyang Xiong, Chong Zhou, Xiaoyu Xiang, Lemeng Wu, Chenchen Zhu, Zechun Liu, Saksham Suri, Balakrishnan Varadarajan, Ramya Akula, Forrest Iandola, Raghuraman Krishnamoorthi, Bilge Soran, Vikas Chandra

ICLR 2025 LARP: Tokenizing Videos with a Learned Autoregressive Generative Prior Hanyu Wang, Saksham Suri, Yixuan Ren, Hao Chen, Abhinav Shrivastava

WACV 2024 Diff2Lip: Audio Conditioned Diffusion Models for Lip-Synchronization Soumik Mukhopadhyay, Saksham Suri, Ravi Teja Gadde, Abhinav Shrivastava

WACV 2024 GRIT: GAN Residuals for Paired Image-to-Image Translation Saksham Suri, Moustafa Meshry, Larry S. Davis, Abhinav Shrivastava

ECCV 2024 LiFT: A Surprisingly Simple Lightweight Feature Transform for Dense ViT Descriptors Saksham Suri, Matthew Walmer, Kamal Gupta, Abhinav Shrivastava

CVPRW 2024 UVIS: Unsupervised Video Instance Segmentation Shuaiyi Huang, Saksham Suri, Kamal Gupta, Sai Saketh Rambhatla, Ser-Nam Lim, Abhinav Shrivastava

ICCV 2023 SparseDet: Improving Sparsely Annotated Object Detection with Pseudo-Positive Mining Saksham Suri, Saketh Rambhatla, Rama Chellappa, Abhinav Shrivastava

CVPR 2023 Teaching Matters: Investigating the Role of Supervision in Vision Transformers Matthew Walmer, Saksham Suri, Kamal Gupta, Abhinav Shrivastava

ICCV 2021 Learned Spatial Representations for Few-Shot Talking-Head Synthesis Moustafa Meshry, Saksham Suri, Larry S. Davis, Abhinav Shrivastava

ICCV 2021 Towards Discovery and Attribution of Open-World GAN Generated Images Sharath Girish, Saksham Suri, Sai Saketh Rambhatla, Abhinav Shrivastava