Sivic, Josef

80 publications

ICLR 2025 6d Object Pose Tracking in Internet Videos for Robotic Manipulation Georgy Ponimatkin, Martin Cífka, Tomas Soucek, Médéric Fourmy, Yann Labbé, Vladimir Petrik, Josef Sivic

ICCV 2025 Discovering Divergent Representations Between Text-to-Image Models Lisa Dunlap, Joseph E. Gonzalez, Trevor Darrell, Fabian Caba Heilbron, Josef Sivic, Bryan Russell

CVPR 2025 Improving Personalized Search with Regularized Low-Rank Parameter Updates Fiona Ryan, Josef Sivic, Fabian Caba Heilbron, Judy Hoffman, James M. Rehg, Bryan Russell

ICCV 2025 Large-Scale Pre-Training for Grounded Video Caption Generation Evangelos Kazakos, Cordelia Schmid, Josef Sivic

ICLR 2025 Learning to Engineer Protein Flexibility Petr Kouba, Joan Planas-Iglesias, Jiri Damborsky, Jiri Sedlar, Stanislav Mazurenko, Josef Sivic

ICCV 2025 ResidualViT for Efficient Temporally Dense Video Encoding Mattia Soldan, Fabian Caba Heilbron, Bernard Ghanem, Josef Sivic, Bryan Russell

CVPR 2025 ShowHowTo: Generating Scene-Conditioned Step-by-Step Visual Instructions Tomáš Souček, Prajwal Gatti, Michael Wray, Ivan Laptev, Dima Damen, Josef Sivic

ICLRW 2024 Accurate Predictions of Enzymatic Biochemistry as an Enabler for Generation of De-Novo Sequences Raman Samusevich, Petr Kouba, Roman Bushuiev, Anton Bushuiev, Josef Sivic, Tomas Pluskal

CVPR 2024 GenHowTo: Learning to Generate Actions and State Transformations from Instructional Videos Tomáš Souček, Dima Damen, Michael Wray, Ivan Laptev, Josef Sivic

NeurIPSW 2024 Generative Timelines for Instructed Visual Assembly Alejandro Pardo, Jui-Hsien Wang, Bernard Ghanem, Josef Sivic, Bryan Russell, Fabian Caba Heilbron

ICLR 2024 Learning to Design Protein-Protein Interactions with Enhanced Generalization Anton Bushuiev, Roman Bushuiev, Petr Kouba, Anatolii Filkin, Marketa Gabrielova, Michal Gabriel, Jiri Sedlar, Tomas Pluskal, Jiri Damborsky, Stanislav Mazurenko, Josef Sivic

NeurIPS 2024 MassSpecGym: A Benchmark for the Discovery and Identification of Molecules Roman Bushuiev, Anton Bushuiev, Niek F. de Jonge, Adamo Young, Fleming Kretschmer, Raman Samusevich, Janne Heirman, Fei Wang, Luke Zhang, Kai Dührkop, Marcus Ludwig, Nils A. Haupt, Apurva Kalia, Corinna Brungs, Robin Schmid, Russell Greiner, Bo Wang, David S. Wishart, Li-Ping Liu, Juho Rousu, Wout Bittremieux, Hannes Rost, Tytus D. Mak, Soha Hassoun, Florian Huber, Justin J.J. van der Hooft, Michael A. Stravs, Sebastian Böcker, Josef Sivic, Tomáš Pluskal

ICLRW 2024 Revealing Data Leakage in Protein Interaction Benchmarks Anton Bushuiev, Roman Bushuiev, Jiri Sedlar, Tomas Pluskal, Jiri Damborsky, Stanislav Mazurenko, Josef Sivic

CVPR 2023 Language-Guided Music Recommendation for Video via Prompt Analogies Daniel McKee, Justin Salamon, Josef Sivic, Bryan Russell

CVPR 2023 Meta-Personalizing Vision-Language Models to Find Named Instances in Video Chun-Hsiao Yeh, Bryan Russell, Josef Sivic, Fabian Caba Heilbron, Simon Jenni

NeurIPS 2023 POP-3D: Open-Vocabulary 3D Occupancy Prediction from Images Antonin Vobecky, Oriane Siméoni, David Hurych, Spyridon Gidaris, Andrei Bursuc, Patrick Pérez, Josef Sivic

CVPR 2023 Vid2Seq: Large-Scale Pretraining of a Visual Language Model for Dense Video Captioning Antoine Yang, Arsha Nagrani, Paul Hongsuck Seo, Antoine Miech, Jordi Pont-Tuset, Ivan Laptev, Josef Sivic, Cordelia Schmid

NeurIPS 2023 VidChapters-7m: Video Chapters at Scale Antoine Yang, Arsha Nagrani, Ivan Laptev, Josef Sivic, Cordelia Schmid

CoLLAs 2022 Benchmarking Learning Efficiency in Deep Reservoir Computing Hugo Cisneros, Tomas Mikolov, Josef Sivic

ECCV 2022 Drive&Segment: Unsupervised Semantic Segmentation of Urban Scenes via Cross-Modal Distillation Antonin Vobecky, David Hurych, Oriane Siméoni, Spyros Gidaris, Andrei Bursuc, Patrick Pérez, Josef Sivic

CVPR 2022 Focal Length and Object Pose Estimation via Render and Compare Georgy Ponimatkin, Yann Labbé, Bryan Russell, Mathieu Aubry, Josef Sivic

CVPR 2022 Look for the Change: Learning Object States and State-Modifying Actions from Untrimmed Web Videos Tomáš Souček, Jean-Baptiste Alayrac, Antoine Miech, Ivan Laptev, Josef Sivic

CoRL 2022 MegaPose: 6d Pose Estimation of Novel Objects via Render & Compare Yann Labbé, Lucas Manuelli, Arsalan Mousavian, Stephen Tyree, Stan Birchfield, Jonathan Tremblay, Justin Carpentier, Mathieu Aubry, Dieter Fox, Josef Sivic

CVPR 2022 TubeDETR: Spatio-Temporal Video Grounding with Transformers Antoine Yang, Antoine Miech, Josef Sivic, Ivan Laptev, Cordelia Schmid

NeurIPS 2022 Zero-Shot Video Question Answering via Frozen Bidirectional Language Models Antoine Yang, Antoine Miech, Josef Sivic, Ivan Laptev, Cordelia Schmid

AAAI 2021 Artificial Dummies for Urban Dataset Augmentation Antonín Vobecký, David Hurych, Michal Uricár, Patrick Pérez, Josef Sivic

ICCV 2021 Just Ask: Learning to Answer Questions from Millions of Narrated Videos Antoine Yang, Antoine Miech, Josef Sivic, Ivan Laptev, Cordelia Schmid

CVPR 2021 Single-View Robot Pose and Joint Angle Estimation via Render & Compare Yann Labbe, Justin Carpentier, Mathieu Aubry, Josef Sivic

CVPR 2021 Thinking Fast and Slow: Efficient Text-to-Visual Retrieval with Transformers Antoine Miech, Jean-Baptiste Alayrac, Ivan Laptev, Josef Sivic, Andrew Zisserman

ICCV 2021 Weakly Supervised Human-Object Interaction Detection in Video via Contrastive Spatiotemporal Regions Shuang Li, Yilun Du, Antonio Torralba, Josef Sivic, Bryan Russell

ECCV 2020 CosyPose: Consistent Multi-View Multi-Object 6d Pose Estimation Yann Labbé, Justin Carpentier, Mathieu Aubry, Josef Sivic

ECCV 2020 Efficient Neighbourhood Consensus Networks via Submanifold Sparse Convolutions Ignacio Rocco, Relja Arandjelović, Josef Sivic

ECCV 2020 Learning Actionness via Long-Range Temporal Order Verification Dimitri Zhukov, Jean-Baptiste Alayrac, Ivan Laptev, Josef Sivic

CoRL 2020 Learning Object Manipulation Skills via Approximate State Estimation from Real Videos Vladimír Petrík, Makarand Tapaswi, Ivan Laptev, Josef Sivic

CVPRW 2019 Leveraging the Present to Anticipate the Future in Videos Antoine Miech, Ivan Laptev, Josef Sivic, Heng Wang, Lorenzo Torresani, Du Tran

NeurIPS 2018 Neighbourhood Consensus Networks Ignacio Rocco, Mircea Cimpoi, Relja Arandjelović, Akihiko Torii, Tomas Pajdla, Josef Sivic

CVPR 2017 ActionVLAD: Learning Spatio-Temporal Aggregation for Action Classification Rohit Girdhar, Deva Ramanan, Abhinav Gupta, Josef Sivic, Bryan Russell

CVPR 2017 Are Large-Scale 3D Models Really Necessary for Accurate Visual Localization? Torsten Sattler, Akihiko Torii, Josef Sivic, Marc Pollefeys, Hajime Taira, Masatoshi Okutomi, Tomas Pajdla

CVPR 2017 Convolutional Neural Network Architecture for Geometric Matching Ignacio Rocco, Relja Arandjelovic, Josef Sivic

ICCV 2017 Joint Discovery of Object States and Manipulation Actions Jean-Baptiste Alayrac, Ivan Laptev, Josef Sivic, Simon Lacoste-Julien

ICCV 2017 Learning from Video and Text via Large-Scale Discriminative Clustering Antoine Miech, Jean-Baptiste Alayrac, Piotr Bojanowski, Ivan Laptev, Josef Sivic

ICCV 2017 Localizing Moments in Video with Natural Language Lisa Anne Hendricks, Oliver Wang, Eli Shechtman, Josef Sivic, Trevor Darrell, Bryan Russell

ICCV 2017 Weakly-Supervised Learning of Visual Relations Julia Peyre, Josef Sivic, Ivan Laptev, Cordelia Schmid

CVPR 2016 NetVLAD: CNN Architecture for Weakly Supervised Place Recognition Relja Arandjelovic, Petr Gronat, Akihiko Torii, Tomas Pajdla, Josef Sivic

CVPR 2016 Unsupervised Learning from Narrated Instruction Videos Jean-Baptiste Alayrac, Piotr Bojanowski, Nishant Agrawal, Josef Sivic, Ivan Laptev, Simon Lacoste-Julien

CVPR 2015 24/7 Place Recognition by View Synthesis Akihiko Torii, Relja Arandjelovic, Josef Sivic, Masatoshi Okutomi, Tomas Pajdla

CVPR 2015 Is Object Localization for Free? - Weakly-Supervised Learning with Convolutional Neural Networks Maxime Oquab, Leon Bottou, Ivan Laptev, Josef Sivic

CVPR 2015 On Pairwise Costs for Network Flow Multi-Object Tracking Visesh Chari, Simon Lacoste-Julien, Ivan Laptev, Josef Sivic

CVPR 2014 Learning and Transferring Mid-Level Image Representations Using Convolutional Neural Networks Maxime Oquab, Leon Bottou, Ivan Laptev, Josef Sivic

ECCV 2014 Predicting Actions from Static Scenes Tuan-Hung Vu, Catherine Olsson, Ivan Laptev, Aude Oliva, Josef Sivic

CVPR 2014 Seeing 3D Chairs: Exemplar Part-Based 2D-3D Alignment Using a Large Dataset of CAD Models Mathieu Aubry, Daniel Maturana, Alexei A. Efros, Bryan C. Russell, Josef Sivic

ECCV 2014 Weakly Supervised Action Labeling in Videos Under Ordering Constraints Piotr Bojanowski, Rémi Lajugie, Francis R. Bach, Ivan Laptev, Jean Ponce, Cordelia Schmid, Josef Sivic

CVPR 2013 Learning and Calibrating Per-Location Classifiers for Visual Place Recognition Petr Gronat, Guillaume Obozinski, Josef Sivic, Tomas Pajdla

ICCV 2013 Pose Estimation and Segmentation of People in 3D Movies Karteek Alahari, Guillaume Seguin, Josef Sivic, Ivan Laptev

CVPR 2013 Visual Place Recognition with Repetitive Structures Akihiko Torii, Josef Sivic, Tomas Pajdla, Masatoshi Okutomi

ECCV 2012 People Watching: Human Actions as a Cue for Single View Geometry David F. Fouhey, Vincent Delaitre, Abhinav Gupta, Alexei A. Efros, Ivan Laptev, Josef Sivic

ECCV 2012 Scene Semantics from Long-Term Observation of People Vincent Delaitre, David F. Fouhey, Ivan Laptev, Josef Sivic, Abhinav Gupta, Alexei A. Efros

ICCV 2011 Data-Driven Crowd Analysis in Videos Mikel Rodriguez, Josef Sivic, Ivan Laptev, Jean-Yves Audibert

ICCV 2011 Density-Aware Person Detection and Tracking in Crowds Mikel Rodriguez, Ivan Laptev, Josef Sivic, Jean-Yves Audibert

NeurIPS 2011 Learning Person-Object Interactions for Action Recognition in Still Images Vincent Delaitre, Josef Sivic, Ivan Laptev

CVPR 2011 Track to the Future: Spatio-Temporal Video Segmentation with Long-Range Motion Cues José Lezama, Karteek Alahari, Josef Sivic, Ivan Laptev

ECCV 2010 Avoiding Confusing Features in Place Recognition Jan Knopp, Josef Sivic, Tomás Pajdla

ECCV 2010 Descriptor Learning for Efficient Retrieval James Philbin, Michael Isard, Josef Sivic, Andrew Zisserman

CVPR 2010 Non-Uniform Deblurring for Shaken Images Oliver Whyte, Josef Sivic, Andrew Zisserman, Jean Ponce

ECCV 2010 Semi-Supervised Learning of Facial Attributes in Video Neva Cherniavsky, Ivan Laptev, Josef Sivic, Andrew Zisserman

ECCVW 2010 Semi-Supervised Learning of Facial Attributes in Video Neva Cherniavsky, Ivan Laptev, Josef Sivic, Andrew Zisserman

CVPR 2009 "Who Are You?" - Learning Person Specific Classifiers from Video Josef Sivic, Mark Everingham, Andrew Zisserman

ICCV 2009 Automatic Annotation of Human Actions in Video Olivier Duchenne, Ivan Laptev, Josef Sivic, Francis R. Bach, Jean Ponce

NeurIPS 2009 Segmenting Scenes by Matching Image Composites Bryan Russell, Alyosha Efros, Josef Sivic, Bill Freeman, Andrew Zisserman

CVPRW 2008 Creating and Exploring a Large Photorealistic Virtual Space Josef Sivic, Biliana Kaneva, Antonio Torralba, Shai Avidan, William T. Freeman

CVPR 2008 Lost in Quantization: Improving Particular Object Retrieval in Large Scale Image Databases James Philbin, Ondrej Chum, Michael Isard, Josef Sivic, Andrew Zisserman

ECCV 2008 SIFT Flow: Dense Correspondence Across Different Scenes Ce Liu, Jenny Yuen, Antonio Torralba, Josef Sivic, William T. Freeman

CVPR 2008 Unsupervised Discovery of Visual Object Class Hierarchies Josef Sivic, Bryan C. Russell, Andrew Zisserman, William T. Freeman, Alexei A. Efros

CVPR 2007 Object Retrieval with Large Vocabularies and Fast Spatial Matching James Philbin, Ondrej Chum, Michael Isard, Josef Sivic, Andrew Zisserman

ICCV 2007 Total Recall: Automatic Query Expansion with a Generative Feature Model for Object Retrieval Ondrej Chum, James Philbin, Josef Sivic, Michael Isard, Andrew Zisserman

CVPR 2006 Using Multiple Segmentations to Discover Objects and Their Extent in Image Collections Bryan C. Russell, William T. Freeman, Alexei A. Efros, Josef Sivic, Andrew Zisserman

ICCV 2005 Discovering Objects and Their Localization in Images Josef Sivic, Bryan C. Russell, Alexei A. Efros, Andrew Zisserman, William T. Freeman

ECCV 2004 Object Level Grouping for Video Shots Josef Sivic, Frederik Schaffalitzky, Andrew Zisserman

CVPR 2004 Video Data Mining Using Configurations of Viewpoint Invariant Regions Josef Sivic, Andrew Zisserman

ICCV 2003 Video Google: A Text Retrieval Approach to Object Matching in Videos Josef Sivic, Andrew Zisserman