Rahman, Tanzila

6 publications

ICLR 2026 To Sink or Not to Sink: Visual Information Pathways in Large Vision-Language Models Jiayun Luo, Wan-Cyuan Fan, Lyuyang Wang, Xiangteng He, Tanzila Rahman, Purang Abolmaesumi, Leonid Sigal

CVPR 2024 Prompting Hard or Hardly Prompting: Prompt Inversion for Text-to-Image Diffusion Models Shweta Mahajan, Tanzila Rahman, Kwang Moo Yi, Leonid Sigal

CVPR 2023 Make-a-Story: Visual Memory Conditioned Consistent Story Generation Tanzila Rahman, Hsin-Ying Lee, Jian Ren, Sergey Tulyakov, Shweta Mahajan, Leonid Sigal

CVPRW 2021 An Improved Attention for Visual Question Answering Tanzila Rahman, Shih-Han Chou, Leonid Sigal, Giuseppe Carenini

NeurIPS 2021 TriBERT: Human-Centric Audio-Visual Representation Learning Tanzila Rahman, Mengyu Yang, Leonid Sigal

ICCV 2019 Watch, Listen and Tell: Multi-Modal Weakly Supervised Dense Event Captioning Tanzila Rahman, Bicheng Xu, Leonid Sigal