Torresani, Lorenzo

75 publications

CVPR 2025 BIMBA: Selective-Scan Compression for Long-Range Video Question Answering Md Mohaiminul Islam, Tushar Nagarajan, Huiyu Wang, Gedas Bertasius, Lorenzo Torresani

ICCV 2025 Enrich and Detect: Video Temporal Grounding with Multimodal LLMs Shraman Pramanick, Effrosyni Mavroudi, Yale Song, Rama Chellappa, Lorenzo Torresani, Triantafyllos Afouras

NeurIPS 2025 PerceptionLM: Open-Access Data and Models for Detailed Visual Understanding Jang Hyun Cho, Andrea Madotto, Effrosyni Mavroudi, Triantafyllos Afouras, Tushar Nagarajan, Muhammad Maaz, Yale Song, Tengyu Ma, Shuming Hu, Suyog Jain, Miguel Martin, Huiyu Wang, Hanoona Abdul Rasheed, Peize Sun, Po-Yao Huang, Daniel Bolya, Nikhila Ravi, Shashank Jain, Tammy Stark, Seungwhan Moon, Babak Damavandi, Vivian Lee, Andrew Westbury, Salman Khan, Philipp Kraehenbuehl, Piotr Dollar, Lorenzo Torresani, Kristen Grauman, Christoph Feichtenhofer

CVPR 2025 VITED: Video Temporal Evidence Distillation Yujie Lu, Yale Song, William Wang, Lorenzo Torresani, Tushar Nagarajan

ECCV 2024 4Diff: 3D-Aware Diffusion Model for Third-to-First Viewpoint Translation Feng Cheng, Mi Luo, Huiyu Wang, Alex Dimakis, Lorenzo Torresani, Gedas Bertasius, Kristen Grauman

CVPR 2024 Ego-Exo4D: Understanding Skilled Human Activity from First- and Third-Person Perspectives Kristen Grauman, Andrew Westbury, Lorenzo Torresani, Kris Kitani, Jitendra Malik, Triantafyllos Afouras, Kumar Ashutosh, Vijay Baiyya, Siddhant Bansal, Bikram Boote, Eugene Byrne, Zach Chavis, Joya Chen, Feng Cheng, Fu-Jen Chu, Sean Crane, Avijit Dasgupta, Jing Dong, Maria Escobar, Cristhian Forigua, Abrham Gebreselasie, Sanjay Haresh, Jing Huang, Md Mohaiminul Islam, Suyog Jain, Rawal Khirodkar, Devansh Kukreja, Kevin J Liang, Jia-Wei Liu, Sagnik Majumder, Yongsen Mao, Miguel Martin, Effrosyni Mavroudi, Tushar Nagarajan, Francesco Ragusa, Santhosh Kumar Ramakrishnan, Luigi Seminara, Arjun Somayazulu, Yale Song, Shan Su, Zihui Xue, Edward Zhang, Jinxu Zhang, Angela Castillo, Changan Chen, Xinzhu Fu, Ryosuke Furuta, Cristina Gonzalez, Prince Gupta, Jiabo Hu, Yifei Huang, Yiming Huang, Weslie Khoo, Anush Kumar, Robert Kuo, Sach Lakhavani, Miao Liu, Mi Luo, Zhengyi Luo, Brighid Meredith, Austin Miller, Oluwatumininu Oguntola, Xiaqing Pan, Penny Peng, Shraman Pramanick, Merey Ramazanova, Fiona Ryan, Wei Shan, Kiran Somasundaram, Chenan Song, Audrey Southerland, Masatoshi Tateno, Huiyu Wang, Yuchen Wang, Takuma Yagi, Mingfei Yan, Xitong Yang, Zecheng Yu, Shengxin Cindy Zha, Chen Zhao, Ziwei Zhao, Zhifan Zhu, Jeff Zhuo, Pablo Arbelaez, Gedas Bertasius, Dima Damen, Jakob Engel, Giovanni Maria Farinella, Antonino Furnari, Bernard Ghanem, Judy Hoffman, C.V. Jawahar, Richard Newcombe, Hyun Soo Park, James M. Rehg, Yoichi Sato, Manolis Savva, Jianbo Shi, Mike Zheng Shou, Michael Wray

CVPR 2024 Learning to Segment Referred Objects from Narrated Egocentric Videos Yuhan Shen, Huiyu Wang, Xitong Yang, Matt Feiszli, Ehsan Elhamifar, Lorenzo Torresani, Effrosyni Mavroudi

CVPRW 2024 Open-World Instance Segmentation: Top-Down Learning with Bottom-up Supervision Tarun Kalluri, Weiyao Wang, Heng Wang, Manmohan Chandraker, Lorenzo Torresani, Du Tran

CVPR 2024 Step Differences in Instructional Video Tushar Nagarajan, Lorenzo Torresani

CVPR 2024 Video ReCap: Recursive Captioning of Hour-Long Videos Md Mohaiminul Islam, Ngan Ho, Xitong Yang, Tushar Nagarajan, Lorenzo Torresani, Gedas Bertasius

ICCV 2023 Ego-Only: Egocentric Action Detection Without Exocentric Transferring Huiyu Wang, Mitesh Kumar Singh, Lorenzo Torresani

NeurIPS 2023 Ego4D Goal-Step: Toward Hierarchical Understanding of Procedural Activities Yale Song, Eugene Byrne, Tushar Nagarajan, Huiyu Wang, Miguel Martin, Lorenzo Torresani

CVPR 2023 Egocentric Video Task Translation Zihui Xue, Yale Song, Kristen Grauman, Lorenzo Torresani

NeurIPS 2023 HT-Step: Aligning Instructional Articles with How-to Videos Triantafyllos Afouras, Effrosyni Mavroudi, Tushar Nagarajan, Huiyu Wang, Lorenzo Torresani

CVPR 2023 HierVL: Learning Hierarchical Video-Language Embeddings Kumar Ashutosh, Rohit Girdhar, Lorenzo Torresani, Kristen Grauman

ICCV 2023 Learning to Ground Instructional Articles in Videos Through Narrations Effrosyni Mavroudi, Triantafyllos Afouras, Lorenzo Torresani

CVPR 2023 Relational Space-Time Query in Long-Form Videos Xitong Yang, Fu-Jen Chu, Matt Feiszli, Raghav Goyal, Lorenzo Torresani, Du Tran

CVPR 2022 Deformable Video Transformer Jue Wang, Lorenzo Torresani

CVPR 2022 Ego4D: Around the World in 3,000 Hours of Egocentric Video Kristen Grauman, Andrew Westbury, Eugene Byrne, Zachary Chavis, Antonino Furnari, Rohit Girdhar, Jackson Hamburger, Hao Jiang, Miao Liu, Xingyu Liu, Miguel Martin, Tushar Nagarajan, Ilija Radosavovic, Santhosh Kumar Ramakrishnan, Fiona Ryan, Jayant Sharma, Michael Wray, Mengmeng Xu, Eric Zhongcong Xu, Chen Zhao, Siddhant Bansal, Dhruv Batra, Vincent Cartillier, Sean Crane, Tien Do, Morrie Doulaty, Akshay Erapalli, Christoph Feichtenhofer, Adriano Fragomeni, Qichen Fu, Abrham Gebreselasie, Cristina González, James Hillis, Xuhua Huang, Yifei Huang, Wenqi Jia, Weslie Khoo, Jáchym Kolář, Satwik Kottur, Anurag Kumar, Federico Landini, Chao Li, Yanghao Li, Zhenqiang Li, Karttikeya Mangalam, Raghava Modhugu, Jonathan Munro, Tullie Murrell, Takumi Nishiyasu, Will Price, Paola Ruiz, Merey Ramazanova, Leda Sari, Kiran Somasundaram, Audrey Southerland, Yusuke Sugano, Ruijie Tao, Minh Vo, Yuchen Wang, Xindi Wu, Takuma Yagi, Ziwei Zhao, Yunyi Zhu, Pablo Arbeláez, David Crandall, Dima Damen, Giovanni Maria Farinella, Christian Fuegen, Bernard Ghanem, Vamsi Krishna Ithapu, C. V. Jawahar, Hanbyul Joo, Kris Kitani, Haizhou Li, Richard Newcombe, Aude Oliva, Hyun Soo Park, James M. Rehg, Yoichi Sato, Jianbo Shi, Mike Zheng Shou, Antonio Torralba, Lorenzo Torresani, Mingfei Yan, Jitendra Malik

AAAI 2022 Label Hallucination for Few-Shot Classification Yiren Jian, Lorenzo Torresani

CVPR 2022 Learning to Recognize Procedural Activities with Distant Supervision Xudong Lin, Fabio Petroni, Gedas Bertasius, Marcus Rohrbach, Shih-Fu Chang, Lorenzo Torresani

CVPR 2022 Long-Short Temporal Contrastive Learning of Video Transformers Jue Wang, Gedas Bertasius, Du Tran, Lorenzo Torresani

CVPR 2021 Beyond Short Clips: End-to-End Video-Level Learning with Collaborative Memories Xitong Yang, Haoqi Fan, Lorenzo Torresani, Larry S. Davis, Heng Wang

ICML 2021 Is Space-Time Attention All You Need for Video Understanding? Gedas Bertasius, Heng Wang, Lorenzo Torresani

WACV 2021 Learn like a Pathologist: Curriculum Learning by Annotator Agreement for Histopathology Image Classification Jerry Wei, Arief Suriawinata, Bing Ren, Xiaoying Liu, Mikhail Lisovsky, Louis Vaickus, Charles Brown, Michael Baker, Mustafa Nasir-Moin, Naofumi Tomita, Lorenzo Torresani, Jason Wei, Saeed Hassanpour

WACV 2021 Only Time Can Tell: Discovering Temporal Data for Temporal Modeling Laura Sevilla-Lara, Shengxin Zha, Zhicheng Yan, Vedanuj Goswami, Matt Feiszli, Lorenzo Torresani

ICML 2021 Slot Machines: Discovering Winning Combinations of Random Weights in Neural Networks Maxwell M Aladago, Lorenzo Torresani

WACV 2021 Supervoxel Attention Graphs for Long-Range Video Modeling Yang Wang, Gedas Bertasius, Tae-Hyun Oh, Abhinav Gupta, Minh Hoai, Lorenzo Torresani

CVPR 2021 Vx2Text: End-to-End Learning of Video-Based Text Generation from Multimodal Inputs Xudong Lin, Gedas Bertasius, Jue Wang, Shih-Fu Chang, Devi Parikh, Lorenzo Torresani

NeurIPS 2020 COBE: Contextualized Object Embeddings from Narrated Instructional Video Gedas Bertasius, Lorenzo Torresani

ECCVW 2020 Generalized Many-Way Few-Shot Video Classification Yongqin Xian, Bruno Korbar, Matthijs Douze, Bernt Schiele, Zeynep Akata, Lorenzo Torresani

NeurIPS 2020 Self-Supervised Learning by Cross-Modal Audio-Video Clustering Humam Alwassel, Dhruv Mahajan, Bruno Korbar, Lorenzo Torresani, Bernard Ghanem, Du Tran

AISTATS 2020 Stein Variational Inference for Discrete Distributions Jun Han, Fan Ding, Xianglong Liu, Lorenzo Torresani, Jian Peng, Qiang Liu

NeurIPS 2019 Learning Temporal Pose Estimation from Sparsely-Labeled Videos Gedas Bertasius, Christoph Feichtenhofer, Du Tran, Jianbo Shi, Lorenzo Torresani

CVPRW 2019 Leveraging the Present to Anticipate the Future in Videos Antoine Miech, Ivan Laptev, Josef Sivic, Heng Wang, Lorenzo Torresani, Du Tran

NeurIPS 2019 STAR-Caps: Capsule Networks with Straight-Through Attentive Routing Karim Ahmed, Lorenzo Torresani

WACV 2018 BranchConnect: Image Categorization with Learned Branch Connections Karim Ahmed, Lorenzo Torresani

NeurIPS 2018 Cooperative Learning of Audio and Video Models from Self-Supervised Synchronization Bruno Korbar, Du Tran, Lorenzo Torresani

ECCV 2018 MaskConnect: Connectivity Learning by Gradient Descent Karim Ahmed, Lorenzo Torresani

ECCV 2018 Object Detection in Video with Spatiotemporal Sampling Networks Gedas Bertasius, Lorenzo Torresani, Jianbo Shi

ECCV 2018 Scenes-Objects-Actions: A Multi-Task, Multi-Label Video Dataset Jamie Ray, Heng Wang, Du Tran, Yufei Wang, Matt Feiszli, Lorenzo Torresani, Manohar Paluri

CVPR 2017 Convolutional Random Walk Networks for Semantic Image Segmentation Gedas Bertasius, Lorenzo Torresani, Stella X. Yu, Jianbo Shi

NeurIPS 2017 Learning to Inpaint for Image Compression Mohammad Haris Baig, Vladlen Koltun, Lorenzo Torresani

AISTATS 2017 Local Perturb-and-MAP for Structured Prediction Gedas Bertasius, Qiang Liu, Lorenzo Torresani, Jianbo Shi

CVPRW 2017 Looking Under the Hood: Deep Neural Network Visualization to Interpret Whole-Slide Image Analysis Outcomes for Colorectal Polyps Bruno Korbar, Andrea M. Olofson, Allen P. Miraflor, Catherine M. Nicka, Matthew A. Suriawinata, Lorenzo Torresani, Arief A. Suriawinata, Saeed Hassanpour

ICLR 2017 Recurrent Mixture Density Network for Spatiotemporal Visual Attention Loris Bazzani, Hugo Larochelle, Lorenzo Torresani

WACV 2016 Coupled Depth Learning Mohammad Haris Baig, Lorenzo Torresani

CVPRW 2016 Deep End2End Voxel2Voxel Prediction Du Tran, Lubomir D. Bourdev, Rob Fergus, Lorenzo Torresani, Manohar Paluri

ECCV 2016 Network of Experts for Large-Scale Image Categorization Karim Ahmed, Mohammad Haris Baig, Lorenzo Torresani

WACV 2016 Self-Taught Object Localization with Deep Networks Loris Bazzani, Alessandro Bergamo, Dragomir Anguelov, Lorenzo Torresani

CVPR 2016 Semantic Segmentation with Boundary Neural Fields Gedas Bertasius, Jianbo Shi, Lorenzo Torresani

CVPR 2015 DeepEdge: A Multi-Scale Bifurcated Deep Network for Top-Down Contour Detection Gedas Bertasius, Jianbo Shi, Lorenzo Torresani

ICCV 2015 High-for-Low and Low-for-High: Efficient Boundary Detection from Deep Object Features and Its Applications to High-Level Vision Gedas Bertasius, Jianbo Shi, Lorenzo Torresani

ICCV 2015 Learning Spatiotemporal Features with 3D Convolutional Networks Du Tran, Lubomir Bourdev, Rob Fergus, Lorenzo Torresani, Manohar Paluri

WACV 2014 AutoCaption: Automatic Caption Generation for Personal Photos Krishnan Ramnath, Simon Baker, Lucy Vanderwende, Motaz Ahmad El-Saban, Sudipta N. Sinha, Anitha Kannan, Noran Hassan, Michel Galley, Yi Yang, Deva Ramanan, Alessandro Bergamo, Lorenzo Torresani

ICLR 2014 EXMOVES: Classifier-Based Features for Scalable Action Recognition Du Tran, Lorenzo Torresani

MLJ 2014 Learning What Is Where from Unlabeled Images: Joint Localization and Clustering of Foreground Objects Ashok Chandrashekar, Lorenzo Torresani, Richard Granger

CVPR 2013 Leveraging Structure from Motion to Learn Discriminative Codebooks for Scalable Landmark Classification Alessandro Bergamo, Sudipta N. Sinha, Lorenzo Torresani

ECCV 2012 Measuring Image Distances via Embedding in a Semantic Manifold Chen Fang, Lorenzo Torresani

CVPR 2012 Meta-Class Features for Large-Scale Object Categorization on a Budget Alessandro Bergamo, Lorenzo Torresani

NeurIPS 2011 PiCoDes: Learning a Compact Code for Novel-Category Recognition Alessandro Bergamo, Lorenzo Torresani, Andrew W. Fitzgibbon

ICCV 2011 Scalable Object-Class Retrieval with Approximate and Top-K Ranking Mohammad Rastegari, Chen Fang, Lorenzo Torresani

ECCV 2010 Efficient Object Category Recognition Using Classemes Lorenzo Torresani, Martin Szummer, Andrew W. Fitzgibbon

NeurIPS 2010 Exploiting Weakly-Labeled Web Images to Improve Object Classification: A Domain Adaptation Approach Alessandro Bergamo, Lorenzo Torresani

CVPR 2010 Simultaneous Point Matching and 3D Deformable Surface Reconstruction Appu Shaji, Aydin Varol, Lorenzo Torresani, Pascal Fua

CVPR 2009 Learning Query-Dependent Prefilters for Scalable Image Retrieval Lorenzo Torresani, Martin Szummer, Andrew W. Fitzgibbon

ICML 2009 Unsupervised Hierarchical Modeling of Locomotion Styles Wei Pan, Lorenzo Torresani

ICCV 2009 Weakly Supervised Discriminative Localization and Classification: A Joint Learning Process Minh Hoai Nguyen, Lorenzo Torresani, Lorenzo de la Torre, Carsten Rother

ECCV 2008 Feature Correspondence via Graph Matching: Models and Global Optimization Lorenzo Torresani, Vladimir Kolmogorov, Carsten Rother

NeurIPS 2006 Large Margin Component Analysis Lorenzo Torresani, Kuang-chih Lee

NeurIPS 2006 Learning Motion Style Synthesis from Perceptual Observations Lorenzo Torresani, Peggy Hackney, Christoph Bregler

ECCV 2004 Automatic Non-Rigid 3D Modeling from Video Lorenzo Torresani, Aaron Hertzmann

NeurIPS 2003 Learning Non-Rigid 3D Shape from 2D Motion Lorenzo Torresani, Aaron Hertzmann, Christoph Bregler

ECCV 2002 Space-Time Tracking Lorenzo Torresani, Christoph Bregler

CVPR 2001 Tracking and Modeling Non-Rigid Objects with Rank Constraints Lorenzo Torresani, Danny B. Yang, Eugene J. Alexander, Christoph Bregler