WACV 2023

639 papers

360MVSNet: Deep Multi-View Stereo Network with 360deg Images for Indoor Scene Reconstruction Ching-Ya Chiu, Yu-Ting Wu, I-Chao Shen, Yung-Yu Chuang

3D Change Localization and Captioning from Dynamic Scans of Indoor Scenes Yue Qiu, Shintaro Yamamoto, Ryosuke Yamada, Ryota Suzuki, Hirokatsu Kataoka, Kenji Iwata, Yutaka Satoh

3D GAN Inversion with Pose Optimization Jaehoon Ko, Kyusun Cho, Daewon Choi, Kwangrok Ryoo, Seungryong Kim

3D Neural Sculpting (3DNS): Editing Neural Signed Distance Functions Petros Tzathas, Petros Maragos, Anastasios Roussos

3D-SpLineNet: 3D Traffic Line Detection Using Parametric Spline Representations Maximilian Pittner, Alexandru Condurache, Joel Janai

3DMM-RF: Convolutional Radiance Fields for 3D Face Modeling Stathis Galanakis, Baris Gecer, Alexandros Lattas, Stefanos Zafeiriou

A Continual Deepfake Detection Benchmark: Dataset, Methods, and Essentials Chuqiao Li, Zhiwu Huang, Danda Pani Paudel, Yabin Wang, Mohamad Shahbazi, Xiaopeng Hong, Luc Van Gool

A Deep Neural Framework to Detect Individual Advertisement (Ad) from Videos Zongyi Liu

A Morphology Focused Diffusion Probabilistic Model for Synthesis of Histopathology Images Puria Azadi Moghadam, Sanne Van Dalen, Karina C. Martin, Jochen Lennerz, Stephen Yip, Hossein Farahani, Ali Bashashati

A Neural Video Codec with Spatial Rate-Distortion Control Noor Fathima, Jens Petersen, Guillaume Sautière, Auke Wiggers, Reza Pourreza

A Priority mAP for Vision-and-Language Navigation with Trajectory Plans and Feature-Location Cues Jason Armitage, Leonardo Impett, Rico Sennrich

A Protocol for Evaluating Model Interpretation Methods from Visual Explanations Hamed Behzadi-Khormouji, José Oramas

A Quality Aware Sample-to-Sample Comparison for Face Recognition Mohammad Saeed Ebrahimi Saadabadi, Sahar Rahimi Malakshan, Ali Zafari, Moktari Mostofa, Nasser M. Nasrabadi

A Simple and Efficient Pipeline to Build an End-to-End Spatial-Temporal Action Detector Lin Sui, Chen-Lin Zhang, Lixin Gu, Feng Han

A Simple and Powerful Global Optimization for Unsupervised Video Object Segmentation Georgy Ponimatkin, Nermin Samet, Yang Xiao, Yuming Du, Renaud Marlet, Vincent Lepetit

A Suspect Identification Framework Using Contrastive Relevance Feedback Devansh Gupta, Aditya Saini, Sarthak Bhagat, Shagun Uppal, Rishi Raj Jain, Drishti Bhasin, Ponnurangam Kumaraguru, Rajiv Ratn Shah

Accelerating Self-Supervised Learning via Efficient Training Strategies Mustafa Taha Koçyiğit, Timothy M. Hospedales, Hakan Bilen

Accumulated Trivial Attention Matters in Vision Transformers on Small Datasets Xiangyu Chen, Qinghao Hu, Kaidong Li, Cuncong Zhong, Guanghui Wang

Action-Aware Masking Network with Group-Based Attention for Temporal Action Localization Tae-Kyung Kang, Gun-Hee Lee, Kyung-Min Jin, Seong-Whan Lee

AdaNorm: Adaptive Gradient Norm Correction Based Optimizer for CNNs Shiv Ram Dubey, Satish Kumar Singh, Bidyut Baran Chaudhuri

Adaptive Feature Fusion for Cooperative Perception Using LiDAR Point Clouds Donghao Qiao, Farhana Zulkernine

Adaptive Local-Component-Aware Graph Convolutional Network for One-Shot Skeleton-Based Action Recognition Anqi Zhu, Qiuhong Ke, Mingming Gong, James Bailey

Adaptive Sample Selection for Robust Learning Under Label Noise Deep Patel, P. S. Sastry

Adaptively-Realistic Image Generation from Stroke and Sketch with Diffusion Model Shin-I Cheng, Yu-Jie Chen, Wei-Chen Chiu, Hung-Yu Tseng, Hsin-Ying Lee

Addressing Feature Suppression in Unsupervised Visual Representations Tianhong Li, Lijie Fan, Yuan Yuan, Hao He, Yonglong Tian, Rogerio Feris, Piotr Indyk, Dina Katabi

Adversarial Local Distribution Regularization for Knowledge Distillation Thanh Nguyen-Duc, Trung Le, He Zhao, Jianfei Cai, Dinh Phung

Adversarial Robustness in Discontinuous Spaces via Alternating Sampling & Descent Rahul Venkatesh, Eric Wong, Zico Kolter

AdvisIL - A Class-Incremental Learning Advisor Eva Feillet, Grégoire Petit, Adrian Popescu, Marina Reyboz, Céline Hudelot

Aerial Image Dehazing with Attentive Deformable Transformers Ashutosh Kulkarni, Subrahmanyam Murala

AFPSNet: Multi-Class Part Parsing Based on Scaled Attention and Feature Fusion Njuod Alsudays, Jing Wu, Yu-Kun Lai, Ze Ji

Aggregating Bilateral Attention for Few-Shot Instance Localization He-Yen Hsieh, Ding-Jie Chen, Cheng-Wei Chang, Tyng-Luh Liu

ALPINE: Improving Remote Heart Rate Estimation Using Contrastive Learning Lokendra Birla, Sneha Shukla, Anup Kumar Gupta, Puneet Gupta

An Embedding-Dynamic Approach to Self-Supervised Learning Suhong Moon, Domas Buracas, Seunghyun Park, Jinkyu Kim, John Canny

An Unified Framework for Language Guided Image Completion Jihyun Kim, Seong-Hun Jeong, Kyeongbo Kong, Suk-Ju Kang

Analysis of Master Vein Attacks on Finger Vein Recognition Systems Huy H. Nguyen, Trung-Nghia Le, Junichi Yamagishi, Isao Echizen

Ancestor Search: Generalized Open Set Recognition via Hyperbolic Side Information Learning Xiwen Dengxiong, Yu Kong

Anisotropic Multi-Scale Graph Convolutional Network for Dense Shape Correspondence Mohammad Farazi, Wenhui Zhu, Zhangsihao Yang, Yalin Wang

AnoLeaf: Unsupervised Leaf Disease Segmentation via Structurally Robust Generative Inpainting Swati Bhugra, Vinay Kaushik, Amit Gupta, Brejesh Lall, Santanu Chaudhury

Anomaly Clustering: Grouping Images into Coherent Clusters of Anomaly Types Kihyuk Sohn, Jinsung Yoon, Chun-Liang Li, Chen-Yu Lee, Tomas Pfister

Anomaly Detection in 3D Point Clouds Using Deep Geometric Descriptors Paul Bergmann, David Sattlegger

Anticipative Feature Fusion Transformer for Multi-Modal Action Anticipation Zeyun Zhong, David Schneider, Michael Voit, Rainer Stiefelhagen, Jürgen Beyerer

Arbitrary Style Guidance for Enhanced Diffusion-Based Text-to-Image Generation Zhihong Pan, Xin Zhou, Hao Tian

Are Straight-Through Gradients and Soft-Thresholding All You Need for Sparse Training? Antoine Vanderschueren, Christophe De Vleeschouwer

ARUBA: An Architecture-Agnostic Balanced Loss for Aerial Object Detection Rebbapragada V. C. Sairam, Monish Keswani, Uttaran Sinha, Nishit Shah, Vineeth N. Balasubramanian

Asymmetric Student-Teacher Networks for Industrial Anomaly Detection Marco Rudolph, Tom Wehrbein, Bodo Rosenhahn, Bastian Wandt

AT-DDPM: Restoring Faces Degraded by Atmospheric Turbulence Using Denoising Diffusion Probabilistic Models Nithin Gopalakrishnan Nair, Kangfu Mei, Vishal M. Patel

ATCON: Attention Consistency for Vision Models Ali Mirzazadeh, Florian Dubost, Maxwell Pike, Krish Maniar, Max Zuo, Christopher Lee-Messer, Daniel Rubin

Attend Who Is Weak: Pruning-Assisted Medical Image Localization Under Sophisticated and Implicit Imbalances Ajay Jaiswal, Tianlong Chen, Justin F. Rousseau, Yifan Peng, Ying Ding, Zhangyang Wang

Attention Attention Everywhere: Monocular Depth Prediction with Skip Attention Ashutosh Agarwal, Chetan Arora

Attribution-Aware Weight Transfer: A Warm-Start Initialization for Class-Incremental Semantic Segmentation Dipam Goswami, René Schuster, Joost van de Weijer, Didier Stricker

AttTrack: Online Deep Attention Transfer for Multi-Object Tracking Keivan Nalaie, Rong Zheng

Audio-Visual Efficient Conformer for Robust Speech Recognition Maxime Burchi, Radu Timofte

Audio-Visual Face Reenactment Madhav Agarwal, Rudrabha Mukhopadhyay, Vinay P. Namboodiri, C. V. Jawahar

AudioViewer: Learning to Visualize Sounds Chunjin Song, Yuchi Zhang, Willis Peng, Parmis Mohaghegh, Bastian Wandt, Helge Rhodin

Augmentation by Counterfactual Explanation - Fixing an Overconfident Classifier Sumedha Singla, Nihal Murali, Forough Arabshahi, Sofia Triantafyllou, Kayhan Batmanghelich

Autoencoder-Based Background Reconstruction and Foreground Segmentation with Background Noise Estimation Bruno Sauvalle, Arnaud de La Fortelle

Automated Detection of Label Errors in Semantic Segmentation Datasets via Deep Learning and Uncertainty Quantification Matthias Rottmann, Marco Reese

Automated Line Labelling: Dataset for Contour Detection and 3D Reconstruction Hari Santhanam, Nehal Doiphode, Jianbo Shi

Automatically Annotating Indoor Images with CAD Models via RGB-D Scans Stefan Ainetter, Sinisa Stekovic, Friedrich Fraundorfer, Vincent Lepetit

Auxiliary Task-Guided CycleGAN for Black-Box Model Domain Adaptation Michael Essich, Markus Rehmann, Cristóbal Curio

AVE-CLIP: AudioCLIP-Based Multi-Window Temporal Transformer for Audio Visual Event Localization Tanvir Mahmud, Diana Marculescu

Avoiding Lingering in Learning Active Recognition by Adversarial Disturbance Lei Fan, Ying Wu

Back to MLP: A Simple Baseline for Human Motion Prediction Wen Guo, Yuming Du, Xi Shen, Vincent Lepetit, Xavier Alameda-Pineda, Francesc Moreno-Noguer

Backprop Induced Feature Weighting for Adversarial Domain Adaptation with Iterative Label Distribution Alignment Thomas Westfechtel, Hao-Wei Yeh, Qier Meng, Yusuke Mukuta, Tatsuya Harada

Barlow Constrained Optimization for Visual Question Answering Abhishek Jha, Badri Patro, Luc Van Gool, Tinne Tuytelaars

Benchmarking Visual Localization for Autonomous Navigation Lauri Suomela, Jussi Kalliola, Atakan Dag, Harry Edelman, Joni-Kristian Kämäräinen

Bent & Broken Bicycles: Leveraging Synthetic Data for Damaged Object Re-Identification Luca Piano, Filippo Gabriele Pratticò, Alessandro Sebastian Russo, Lorenzo Lanari, Lia Morra, Fabrizio Lamberti

BEVSegFormer: Bird's Eye View Semantic Segmentation from Arbitrary Camera Rigs Lang Peng, Zhirong Chen, Zhangjie Fu, Pengpeng Liang, Erkang Cheng

Beyond RGB: Scene-Property Synthesis with Neural Radiance Fields Mingtong Zhang, Shuhong Zheng, Zhipeng Bao, Martial Hebert, Yu-Xiong Wang

Bi-Directional Frame Interpolation for Unsupervised Video Anomaly Detection Hanqiu Deng, Zhaoxiang Zhang, Shihao Zou, Xingyu Li

BirdSoundsDenoising: Deep Visual Audio Denoising for Bird Sounds Youshan Zhang, Jialu Li

Body Part-Based Representation Learning for Occluded Person Re-Identification Vladimir Somers, Christophe De Vleeschouwer, Alexandre Alahi

Boosting Neural Video Codecs by Exploiting Hierarchical Redundancy Reza Pourreza, Hoang Le, Amir Said, Guillaume Sautière, Auke Wiggers

Boosting Vision Transformers for Image Retrieval Chull Hwan Song, Jooyoung Yoon, Shunghyun Choi, Yannis Avrithis

Bootstrapping the Relationship Between Images and Their Clean and Noisy Labels Brandon Smart, Gustavo Carneiro

BoxMask: Revisiting Bounding Box Supervision for Video Object Detection Khurram Azeem Hashmi, Alain Pagani, Didier Stricker, Muhammad Zeshan Afzal

BrightFlow: Brightness-Change-Aware Unsupervised Learning of Optical Flow Rémi Marsal, Florian Chabot, Angélique Loesch, Hichem Sahbi

Burst Reflection Removal Using Reflection Motion Aggregation Cues B. H. Pawan Prasad, K. S. Green Rosh, R. B. Lokesh, Kaushik Mitra

Burst Vision Using Single-Photon Cameras Sizhuo Ma, Paul Mos, Edoardo Charbon, Mohit Gupta

BURST: A Benchmark for Unifying Object Recognition, Segmentation and Tracking in Video Ali Athar, Jonathon Luiten, Paul Voigtlaender, Tarasha Khurana, Achal Dave, Bastian Leibe, Deva Ramanan

Calibrating Deep Neural Networks Using Explicit Regularisation and Dynamic Data Pruning Rishabh Patra, Ramya Hebbalaguppe, Tirtharaj Dash, Gautam Shroff, Lovekesh Vig

Camera Alignment and Weighted Contrastive Learning for Domain Adaptation in Video Person ReID Djebril Mekhazni, Maximilien Dufau, Christian Desrosiers, Marco Pedersoli, Eric Granger

CameraPose: Weakly-Supervised Monocular 3D Human Pose Estimation by Leveraging In-the-Wild 2D Annotations Cheng-Yen Yang, Jiajia Luo, Lu Xia, Yuyin Sun, Nan Qiao, Ke Zhang, Zhongyu Jiang, Jenq-Neng Hwang, Cheng-Hao Kuo

Can Shadows Reveal Biometric Information? Safa C. Medin, Amir Weiss, Frédo Durand, William T. Freeman, Gregory W. Wornell

CAST: Conditional Attribute Subsampling Toolkit for Fine-Grained Evaluation Wes Robbins, Steven Zhou, Aman Bhatta, Chad Mello, Vítor Albiero, Kevin W. Bowyer, Terrance E. Boult

CellTranspose: Few-Shot Domain Adaptation for Cellular Instance Segmentation Matthew R. Keaton, Ram J. Zaveri, Gianfranco Doretto

Center-Aware Adversarial Augmentation for Single Domain Generalization Tianle Chen, Mahsa Baktashmotlagh, Zijian Wang, Mathieu Salzmann

Centroid Distance Keypoint Detector for Colored Point Clouds Hanzhe Teng, Dimitrios Chatziparaschis, Xinyue Kan, Amit K. Roy-Chowdhury, Konstantinos Karydis

Certified Defense for Content Based Image Retrieval Kazuya Kakizaki, Kazuto Fukuchi, Jun Sakuma

CFL-Net: Image Forgery Localization Using Contrastive Learning Fahim Faisal Niloy, Kishor Kumar Bhaumik, Simon S. Woo

CG-NeRF: Conditional Generative Neural Radiance Fields for 3D-Aware Image Synthesis Kyungmin Jo, Gyumin Shim, Sanghun Jung, Soyoung Yang, Jaegul Choo

Class-Level Confidence Based 3D Semi-Supervised Learning Zhimin Chen, Longlong Jing, Liang Yang, Yingwei Li, Bing Li

Closer Look at the Transferability of Adversarial Examples: How They Fool Different Models Differently Futa Waseda, Sosuke Nishikawa, Trung-Nghia Le, Huy H. Nguyen, Isao Echizen

CNN2Graph: Building Graphs for Image Classification Vivek Trivedy, Longin Jan Latecki

CoKe: Contrastive Learning for Robust Keypoint Detection Yutong Bai, Angtian Wang, Adam Kortylewski, Alan Yuille

Collaborative Multi-Teacher Knowledge Distillation for Learning Low Bit-Width Deep Neural Networks Cuong Pham, Tuan Hoang, Thanh-Toan Do

Color Recommendation for Vector Graphic Documents Based on Multi-Palette Representation Qianru Qiu, Xueting Wang, Mayu Otani, Yuki Iwazaki

Compact and Optimal Deep Learning with Recurrent Parameter Generators Jiayun Wang, Yubei Chen, Stella X. Yu, Brian Cheung, Yann LeCun

Complementary Bi-Directional Feature Compression for Indoor 360deg Semantic Segmentation with Self-Distillation Zishuo Zheng, Chunyu Lin, Lang Nie, Kang Liao, Zhijie Shen, Yao Zhao

Complementary Cues from Audio Help Combat Noise in Weakly-Supervised Object Detection Cagri Gungor, Adriana Kovashka

Composite Learning for Robust and Effective Dense Predictions Menelaos Kanakis, Thomas E. Huang, David Brüggemann, Fisher Yu, Luc Van Gool

Composite Relationship Fields with Transformers for Scene Graph Generation George Adaimi, David Mizrahi, Alexandre Alahi

Compressing Explicit Voxel Grid Representations: Fast NeRFs Become Also Small Chenxi Lola Deng, Enzo Tartaglione

Computer Vision for International Border Legibility Trevor Ortega, Thomas Nelson, Skyler Crane, Josh Myers-Dean, Scott Wehrwein

Computer Vision for Ocean Eddy Detection in Infrared Imagery Evangelos Moschos, Alisa Kugusheva, Paul Coste, Alexandre Stegner

Computer Vision to the Rescue: Infant Postural Symmetry Estimation from Incongruent Annotations Xiaofei Huang, Michael Wan, Lingfei Luan, Bethany Tunik, Sarah Ostadabbas

Concept Correlation and Its Effects on Concept-Based Models Lena Heidemann, Maureen Monnet, Karsten Roscher

ConfMix: Unsupervised Domain Adaptation for Object Detection via Confidence-Based Mixing Giulio Mattolin, Luca Zanella, Elisa Ricci, Yiming Wang

CoNMix for Source-Free Single and Multi-Target Domain Adaptation Vikash Kumar, Rohit Lal, Himanshu Patil, Anirban Chakraborty

Content-Based Music-Image Retrieval Using Self- and Cross-Modal Feature Embedding Memory Takayuki Nakatsuka, Masahiro Hamasaki, Masataka Goto

Context-Empowered Visual Attention Prediction in Pedestrian Scenarios Igor Vozniak, Philipp Müller, Lorena Hell, Nils Lipp, Ahmed Abouelazm, Christian Müller

Continual Learning with Dependency Preserving Hypernetworks Dupati Srikar Chandra, Sakshi Varshney, P. K. Srijith, Sunil Gupta

Contrastive Knowledge-Augmented Meta-Learning for Few-Shot Classification Rakshith Subramanyam, Mark Heimann, T.S. Jayram, Rushil Anirudh, Jayaraman J. Thiagarajan

Contrastive Learning of Semantic Concepts for Open-Set Cross-Domain Retrieval Aishwarya Agarwal, Srikrishna Karanam, Balaji Vasan Srinivasan, Biplab Banerjee

Contrastive Losses Are Natural Criteria for Unsupervised Video Summarization Zongshang Pang, Yuta Nakashima, Mayu Otani, Hajime Nagahara

Control-NeRF: Editable Feature Volumes for Scene Rendering and Manipulation Verica Lazova, Vladimir Guzov, Kyle Olszewski, Sergey Tulyakov, Gerard Pons-Moll

Controllable 3D Generative Adversarial Face Model via Disentangling Shape and Appearance Fariborz Taherkhani, Aashish Rai, Quankai Gao, Shaunak Srivastava, Xuanbai Chen, Fernando de la Torre, Steven Song, Aayush Prakash, Daeil Kim

Cooperative Self-Training for Multi-Target Adaptive Semantic Segmentation Yangsong Zhang, Subhankar Roy, Hongtao Lu, Elisa Ricci, Stéphane Lathuilière

COPE: End-to-End Trainable Constant Runtime Object Pose Estimation Stefan Thalhammer, Timothy Patten, Markus Vincze

CORL: Compositional Representation Learning for Few-Shot Classification Ju He, Adam Kortylewski, Alan Yuille

CountNet3D: A 3D Computer Vision Approach to Infer Counts of Occluded Objects Porter Jenkins, Kyle Armstrong, Stephen Nelson, Siddhesh Gotad, J. Stockton Jenkins, Wade Wilkey, Tanner Watts

Couplformer: Rethinking Vision Transformer with Coupling Attention Hai Lan, Xihao Wang, Hao Shen, Peidong Liang, Xian Wei

Creating a Forensic Database of Shoeprints from Online Shoe-Tread Photos Samia Shafique, Bailey Kong, Shu Kong, Charless Fowlkes

Cross-Domain Video Anomaly Detection Without Target Domain Adaptation Abhishek Aich, Kuan-Chuan Peng, Amit K. Roy-Chowdhury

Cross-Identity Video Motion Retargeting with Joint Transformation and Synthesis Haomiao Ni, Yihao Liu, Sharon X. Huang, Yuan Xue

Cross-Modal Semantic Enhanced Interaction for Image-Sentence Retrieval Xuri Ge, Fuhai Chen, Songpei Xu, Fuxiang Tao, Joemon M. Jose

Cross-Modality Feature Fusion Network for Few-Shot 3D Point Cloud Classification Minmin Yang, Jiajing Chen, Senem Velipasalar

Cross-Resolution Flow Propagation for Foveated Video Super-Resolution Eugene Lee, Lien-Feng Hsu, Evan Chen, Chen-Yi Lee

Cross-Task Attention Mechanism for Dense Multi-Task Learning Ivan Lopes, Tuan-Hung Vu, Raoul de Charette

Cross-View Image Sequence Geo-Localization Xiaohan Zhang, Waqas Sultani, Safwan Wshah

CRT-6D: Fast 6d Object Pose Estimation with Cascaded Refinement Transformers Pedro Castro, Tae-Kyun Kim

CTrGAN: Cycle Transformers GAN for Gait Transfer Shahar Mahpod, Noam Gaash, Hay Hoffman, Gil Ben-Artzi

CUDA-GHR: Controllable Unsupervised Domain Adaptation for Gaze and Head Redirection Swati Jindal, Xin Eric Wang

Cut-Paste Consistency Learning for Semi-Supervised Lesion Segmentation Boon Peng Yap, Beng Koon Ng

CYBORG: Blending Human Saliency into the Loss Improves Deep Learning-Based Synthetic Face Detection Aidan Boyd, Patrick Tinsley, Kevin W. Bowyer, Adam Czajka

D-Extract: Extracting Dimensional Attributes from Product Images Pushpendu Ghosh, Nancy Wang, Promod Yenigalla

D2F2WOD: Learning Object Proposals for Weakly-Supervised Object Detection via Progressive Domain Adaptation Yuting Wang, Ricardo Guerrero, Vladimir Pavlovic

Dance Style Transfer with Cross-Modal Transformer Wenjie Yin, Hang Yin, Kim Baraka, Danica Kragic, Mårten Björkman

Dataset Condensation with Distribution Matching Bo Zhao, Hakan Bilen

DBCE: A Saliency Method for Medical Deep Learning Through Anatomically-Consistent Free-Form Deformations Joshua Peters, Léo Lebrat, Rodrigo Santa Cruz, Aaron Nicolson, Gregg Belous, Salamata Konate, Parnesh Raniga, Vincent Dore, Pierrick Bourgeat, Jurgen Mejan-Fripp, Clinton Fookes, Olivier Salvado

DCVNet: Dilated Cost Volume Networks for Fast Optical Flow Huaizu Jiang, Erik Learned-Miller

DDNeRF: Depth Distribution Neural Radiance Fields David Dadon, Ohad Fried, Yacov Hel-Or

DE-CROP: Data-Efficient Certified Robustness for Pretrained Classifiers Gaurav Kumar Nayak, Ruchit Rawal, Anirban Chakraborty

Deep Learning Methodology for Early Detection and Outbreak Prediction of Invasive Species Growth Nathan Elias

Deep Model-Based Super-Resolution with Non-Uniform Blur Charles Laroche, Andrés Almansa, Matias Tassano

DeepPrivacy2: Towards Realistic Full-Body Anonymization Håkon Hukkelås, Frank Lindseth

DeformIrisNet: An Identity-Preserving Model of Iris Texture Deformation Siamul Karim Khan, Patrick Tinsley, Adam Czajka

DELS-MVS: Deep Epipolar Line Search for Multi-View Stereo Christian Sormann, Emanuele Santellani, Mattia Rossi, Andreas Kuhn, Friedrich Fraundorfer

Delving into Masked Autoencoders for Multi-Label Thorax Disease Classification Junfei Xiao, Yutong Bai, Alan Yuille, Zongwei Zhou

Dense but Efficient VideoQA for Intricate Compositional Reasoning Jihyeon Lee, Wooyoung Kang, Eun-Sol Kim

Dense Prediction with Attentive Feature Aggregation Yung-Hsu Yang, Thomas E. Huang, Min Sun, Samuel Rota Bulò, Peter Kontschieder, Fisher Yu

Dense Voxel Fusion for 3D Object Detection Anas Mahmoud, Jordan S. K. Hu, Steven L. Waslander

Detection Recovery in Online Multi-Object Tracking with Sparse Graph Tracker Jeongseok Hyun, Myunggu Kang, Dongyoon Wee, Dit-Yan Yeung

Diffeomorphic Image Registration with Neural Velocity Field Kun Han, Shanlin Sun, Xiangyi Yan, Chenyu You, Hao Tang, Junayed Naushad, Haoyu Ma, Deying Kong, Xiaohui Xie

Difficulty-Net: Learning to Predict Difficulty for Long-Tailed Recognition Saptarshi Sinha, Hiroki Ohashi

DigiFace-1m: 1 Million Digital Face Images for Face Recognition Gwangbin Bae, Martin de La Gorce, Tadas Baltrušaitis, Charlie Hewitt, Dong Chen, Julien Valentin, Roberto Cipolla, Jingjing Shen

Discrete Cosin TransFormer: Image Modeling from Frequency Domain Xinyu Li, Yanyi Zhang, Jianbo Yuan, Hanlin Lu, Yibo Zhu

Dissecting Deep Metric Learning Losses for Image-Text Retrieval Hong Xuan, Xi Chen

Do Adaptive Active Attacks Pose Greater Risk than Static Attacks? Nathan Drenkow, Max Lennon, I-Jeng Wang, Philippe Burlina

Do Pre-Trained Models Benefit Equally in Continual Learning? Kuan-Ying Lee, Yuanyi Zhong, Yu-Xiong Wang

Domain Adaptation Using Self-Training with Mixup for One-Stage Object Detection Jitender Maurya, Keyur R. Ranipa, Osamu Yamaguchi, Tomoyuki Shibata, Daisuke Kobayashi

Domain Adaptive Object Detection for Autonomous Driving Under Foggy Weather Jinlong Li, Runsheng Xu, Jin Ma, Qin Zou, Jiaqi Ma, Hongkai Yu

Domain Adaptive Video Semantic Segmentation via Cross-Domain Moving Object Mixing Kyusik Cho, Suhyeon Lee, Hongje Seong, Euntai Kim

Domain Invariant Vision Transformer Learning for Face Anti-Spoofing Chen-Hao Liao, Wen-Cheng Chen, Hsuan-Tung Liu, Yi-Ren Yeh, Min-Chun Hu, Chu-Song Chen

DRAMA: Joint Risk Localization and Captioning in Driving Srikanth Malla, Chiho Choi, Isht Dwivedi, Joon Hee Choi, Jiachen Li

DSAG: A Scalable Deep Framework for Action-Conditioned Multi-Actor Full Body Motion Synthesis Debtanu Gupta, Shubh Maheshwari, Sai Shashank Kalakonda, Manasvi Vaidyula, Ravi Kiran Sarvadevabhatla

DSFormer: A Dual-Domain Self-Supervised Transformer for Accelerated Multi-Contrast MRI Reconstruction Bo Zhou, Neel Dey, Jo Schlemper, Seyed Sadegh Mohseni Salehi, Chi Liu, James S. Duncan, Michal Sofka

DSTrans: Dual-Stream Transformer for Hyperspectral Image Restoration Dabing Yu, Qingwu Li, Xiaolin Wang, Zhiliang Zhang, Yixi Qian, Chang Xu

DyAnNet: A Scene Dynamicity Guided Self-Trained Video Anomaly Detection Network Kamalakar Vijay Thakare, Yash Raghuwanshi, Debi Prosad Dogra, Heeseung Choi, Ig-Jae Kim

Dynamic Mixture of Counter Network for Location-Agnostic Crowd Counting Mingjie Wang, Hao Cai, Yong Dai, Minglun Gong

Dynamic Neural Portraits Michail Christos Doukas, Stylianos Ploumpis, Stefanos Zafeiriou

Dynamic Re-Weighting for Long-Tailed Semi-Supervised Learning Hanyu Peng, Weiguo Pian, Mingming Sun, Ping Li

DyStyle: Dynamic Neural Network for Multi-Attribute-Conditioned Style Editings Bingchuan Li, Shaofei Cai, Wei Liu, Peng Zhang, Qian He, Miao Hua, Zili Yi

Effective Invertible Arbitrary Image Rescaling Zhihong Pan, Baopu Li, Dongliang He, Wenhao Wu, Errui Ding

Efficient Few-Shot Learning for Pixel-Precise Handwritten Document Layout Analysis Axel De Nardin, Silvia Zottin, Matteo Paier, Gian Luca Foresti, Emanuela Colombi, Claudio Piciarelli

Efficient Flow-Guided Multi-Frame De-Fencing Stavros Tsogkas, Fengjia Zhang, Allan Jepson, Alex Levinshtein

Efficient Reference-Based Video Super-Resolution (ERVSR): Single Reference Image Is All You Need Youngrae Kim, Jinsu Lim, Hoonhee Cho, Minji Lee, Dongman Lee, Kuk-Jin Yoon, Ho-Jin Choi

Efficient Skeleton-Based Action Recognition via Joint-Mapping Strategies Min-Seok Kang, Dongoh Kang, HanSaem Kim

Efficient Visual Tracking with Exemplar Transformers Philippe Blatter, Menelaos Kanakis, Martin Danelljan, Luc Van Gool

EfficientPhys: Enabling Simple, Fast and Accurate Camera-Based Cardiac Measurement Xin Liu, Brian Hill, Ziheng Jiang, Shwetak Patel, Daniel McDuff

Ego-Vehicle Action Recognition Based on Semi-Supervised Contrastive Learning Chihiro Noguchi, Toshihiro Tanizawa

Elimination of Non-Novel Segments at Multi-Scale for Few-Shot Segmentation Alper Kayabaşı, Gülin Tüfekci, İlkay Ulusoy

ElliPose: Stereoscopic 3D Human Pose Estimation by Fitting Ellipsoids Christian Grund, Julian Tanke, Jürgen Gall

EmbryosFormer: Deformable Transformer and Collaborative Encoding-Decoding for Embryos Stage Development Classification Tien-Phat Nguyen, Trong-Thang Pham, Tri Nguyen, Hieu Le, Dung Nguyen, Hau Lam, Phong Nguyen, Jennifer Fowler, Minh-Triet Tran, Ngan Le

Empirical Generalization Study: Unsupervised Domain Adaptation vs. Domain Generalization Methods for Semantic Segmentation in the Wild Fabrizio J. Piva, Daan de Geus, Gijs Dubbelman

Enabling ISPless Low-Power Computer Vision Gourav Datta, Zeyu Liu, Zihan Yin, Linyu Sun, Akhilesh R. Jaiswal, Peter A. Beerel

Encouraging Disentangled and Convex Representation with Controllable Interpolation Regularization Yunhao Ge, Zhi Xu, Yao Xiao, Gan Xin, Yunkui Pang, Laurent Itti

End-to-End Single-Frame Image Signal Processing for High Dynamic Range Scenes Khanh Quoc Dinh, Kwang Pyo Choi

Enhanced Bi-Directional Motion Estimation for Video Frame Interpolation Xin Jin, Longhai Wu, Guotao Shen, Youxin Chen, Jie Chen, Jayoon Koo, Cheul-hee Hahm

Enriched CNN-Transformer Feature Aggregation Networks for Super-Resolution Jinsu Yoo, Taehoon Kim, Sihaeng Lee, Seung Hwan Kim, Honglak Lee, Tae Hyun Kim

ETR: An Efficient Transformer for Re-Ranking in Visual Place Recognition Hao Zhang, Xin Chen, Heming Jing, Yingbin Zheng, Yuan Wu, Cheng Jin

Ev-NeRF: Event Based Neural Radiance Field Inwoo Hwang, Junho Kim, Young Min Kim

Evaluating Generative Networks Using Gaussian Mixtures of Image Features Lorenzo Luzi, Carlos Ortiz Marrero, Nile Wynar, Richard G. Baraniuk, Michael J. Henry

Event-Based RGB Sensing with Structured Light Seyed Ehsan Marjani Bajestani, Giovanni Beltrame

Event-Specific Audio-Visual Fusion Layers: A Simple and New Perspective on Video Understanding Arda Senocak, Junsik Kim, Tae-Hyun Oh, Dingzeyu Li, In So Kweon

EventPoint: Self-Supervised Interest Point Detection and Description for Event-Based Camera Ze Huang, Li Sun, Cheng Zhao, Song Li, Songzhi Su

Exemplar Guided Deep Neural Network for Spatial Transcriptomics Analysis of Gene Expression Prediction Yan Yang, Md Zakir Hossain, Eric A. Stone, Shafin Rahman

Expansion of Visual Hints for Improved Generalization in Stereo Matching Andrea Pilzer, Yuxin Hou, Niki Loppi, Arno Solin, Juho Kannala

Expert-Defined Keywords Improve Interpretability of Retinal Image Captioning Ting-Wei Wu, Jia-Hong Huang, Joseph Lin, Marcel Worring

Explainability-Aware One Point Attack for Point Cloud Neural Networks Hanxiao Tan, Helena Kotthaus

Exploiting Instance-Based Mixed Sampling via Auxiliary Source Domain Supervision for Domain-Adaptive Action Detection Yifan Lu, Gurkirt Singh, Suman Saha, Luc Van Gool

Exploiting Long-Term Dependencies for Generating Dynamic Scene Graphs Shengyu Feng, Hesham Mostafa, Marcel Nassar, Somdeb Majumdar, Subarna Tripathi

Exploiting Visual Context Semantics for Sound Source Localization Xinchi Zhou, Dongzhan Zhou, Di Hu, Hang Zhou, Wanli Ouyang

FaceDancer: Pose- and Occlusion-Aware High Fidelity Face Swapping Felix Rosberg, Eren Erdal Aksoy, Fernando Alonso-Fernandez, Cristofer Englund

FaceOff: A Video-to-Video Face Swapping System Aditya Agarwal, Bipasha Sen, Rudrabha Mukhopadhyay, Vinay P. Namboodiri, C. V. Jawahar

FAN-Trans: Online Knowledge Distillation for Facial Action Unit Detection Jing Yang, Jie Shen, Yiming Lin, Yordan Hristov, Maja Pantic

Fantastic Style Channels and Where to Find Them: A Submodular Framework for Discovering Diverse Directions in GANs Enis Simsar, Umut Kocasari, Ezgi Gülperi Er, Pinar Yanardag

Far3Det: Towards Far-Field 3D Detection Shubham Gupta, Jeet Kanjani, Mengtian Li, Francesco Ferroni, James Hays, Deva Ramanan, Shu Kong

Fashion Image Retrieval with Text Feedback by Additive Attention Compositional Learning Yuxin Tian, Shawn Newsam, Kofi Boakye

Fast and Accurate: Video Enhancement Using Sparse Depth Yu Feng, Patrick Hansen, Paul N. Whatmough, Guoyu Lu, Yuhao Zhu

Fast Differentiable Transient Rendering for Non-Line-of-Sight Reconstruction Markus Plack, Clara Callenberg, Monika Schneider, Matthias B. Hullin

Fast Online Video Super-Resolution with Deformable Attention Pyramid Dario Fuoli, Martin Danelljan, Radu Timofte, Luc Van Gool

FastSwap: A Lightweight One-Stage Framework for Real-Time Face Swapping Sahng-Min Yoo, Tae-Min Choi, Jae-Woo Choi, Jong-Hwan Kim

Feature Disentanglement Learning with Switching and Aggregation for Video-Based Person Re-Identification Minjung Kim, MyeongAh Cho, Sangyoun Lee

Federated Domain Generalization for Image Recognition via Cross-Client Style Transfer Junming Chen, Meirui Jiang, Qi Dou, Qifeng Chen

Federated Learning for Commercial Image Sources Shreyansh Jain, Koteswar Rao Jerripothula

FeTrIL: Feature Translation for Exemplar-Free Class-Incremental Learning Grégoire Petit, Adrian Popescu, Hugo Schindler, David Picard, Bertrand Delezoide

Few-Shot Learning of Compact Models via Task-Specific Meta Distillation Yong Wu, Shekhor Chanda, Mehrdad Hosseinzadeh, Zhi Liu, Yang Wang

Few-Shot Medical Image Segmentation with Cycle-Resemblance Attention Hao Ding, Changchang Sun, Hao Tang, Dawen Cai, Yan Yan

Few-Shot Object Counting with Similarity-Aware Feature Enhancement Zhiyuan You, Kai Yang, Wenhan Luo, Xin Lu, Lei Cui, Xinyi Le

Few-Shot Object Detection via Improved Classification Features Xinyu Jiang, Zhengjia Li, Maoqing Tian, Jianbo Liu, Shuai Yi, Duoqian Miao

FFM: Injecting Out-of-Domain Knowledge via Factorized Frequency Modification Zijian Wang, Yadan Luo, Zi Huang, Mahsa Baktashmotlagh

Fine Gaze Redirection Learning with Gaze Hardness-Aware Transformation Sangjin Park, Daeha Kim, Byung Cheol Song

Fine-Context Shadow Detection Using Shadow Removal Jeya Maria Jose Valanarasu, Vishal M. Patel

Fine-Grained Activities of People Worldwide Jeffrey Byrne, Gregory Castañón, Zhongheng Li, Gil Ettinger

Fine-Grained Affordance Annotation for Egocentric Hand-Object Interaction Videos Zecheng Yu, Yifei Huang, Ryosuke Furuta, Takuma Yagi, Yusuke Goutsu, Yoichi Sato

FLAVR: Flow-Agnostic Video Representations for Fast Frame Interpolation Tarun Kalluri, Deepak Pathak, Manmohan Chandraker, Du Tran

FLOAT: Fast Learnable Once-for-All Adversarial Training for Tunable Trade-Off Between Accuracy and Robustness Souvik Kundu, Sairam Sundaresan, Massoud Pedram, Peter A. Beerel

Foreground Guidance and Multi-Layer Feature Fusion for Unsupervised Object Discovery with Transformers Zhiwei Lin, Zengyu Yang, Yongtao Wang

Fractual Projection Forest: Fast and Explainable Point Cloud Classifier Hanxiao Tan

Frame Interpolation for Dynamic Scenes with Implicit Flow Encoding Pedro Figueirêdo, Avinash Paliwal, Nima Khademi Kalantari

FreeREA: Training-Free Evolution-Based Architecture Search Niccolò Cavagnero, Luca Robbiano, Barbara Caputo, Giuseppe Averta

Frequency-Aware Self-Supervised Monocular Depth Estimation Xingyu Chen, Thomas H. Li, Ruonan Zhang, Ge Li

From Forks to Forceps: A New Framework for Instance Segmentation of Surgical Instruments Britty Baby, Daksh Thapar, Mustafa Chasmai, Tamajit Banerjee, Kunal Dargan, Ashish Suri, Subhashis Banerjee, Chetan Arora

Full Contextual Attention for Multi-Resolution Transformers in Semantic Segmentation Loic Themyr, Clément Rambour, Nicolas Thome, Toby Collins, Alexandre Hostettler

FUSSL: Fuzzy Uncertain Self Supervised Learning Salman Mohamadi, Gianfranco Doretto, Donald A. Adjeroh

GAF-Net: Improving the Performance of Remote Sensing Image Fusion Using Novel Global Self and Cross Attention Learning Ankit Jha, Shirsha Bose, Biplab Banerjee

GAFNet: A Global Fourier Self Attention Based Novel Network for Multi-Modal Downstream Tasks Onkar Susladkar, Gayatri Deshmukh, Dhruv Makwana, Sparsh Mittal, R. Sai Chandra Teja, Rekha Singhal

GaIA: Graphical Information Gain Based Attention Network for Weakly Supervised Point Cloud Semantic Segmentation Min Seok Lee, Seok Woo Yang, Sung Won Han

Gait Recognition Using 3-D Human Body Shape Inference Haidong Zhu, Zhaoheng Zheng, Ram Nevatia

Gallery Filter Network for Person Search Lucas Jaffe, Avideh Zakhor

GarSim: Particle Based Neural Garment Simulator Lokender Tiwari, Brojeshwar Bhowmick

GEMS: Generating Efficient Meta-Subnets Varad Pimpalkhute, Shruti Kunde, Rekha Singhal

GEMS: Scene Expansion Using Generative Models of Graphs Rishi Agarwal, Tirupati Saketh Chandra, Vaidehi Patil, Aniruddha Mahapatra, Kuldeep Kulkarni, Vishwa Vinay

Generative Alignment of Posterior Probabilities for Source-Free Domain Adaptation Sachin Chhabra, Hemanth Venkateswara, Baoxin Li

Generative Colorization of Structured Mobile Web Pages Kotaro Kikuchi, Naoto Inoue, Mayu Otani, Edgar Simo-Serra, Kota Yamaguchi

Generative Range Imaging for Learning Scene Priors of 3D LiDAR Data Kazuto Nakashima, Yumi Iwashita, Ryo Kurazume

GeoFill: Reference-Based Image Inpainting with Better Geometric Understanding Yunhan Zhao, Connelly Barnes, Yuqian Zhou, Eli Shechtman, Sohrab Amirghodsi, Charless Fowlkes

GLAD: A Global-to-Local Anomaly Detector Aitor Artola, Yannis Kolodziej, Jean-Michel Morel, Thibaud Ehret

GliTr: Glimpse Transformers with Spatiotemporal Consistency for Online Action Prediction Samrudhdhi B. Rangrej, Kevin J. Liang, Tal Hassner, James J. Clark

Global-Local Self-Distillation for Visual Representation Learning Tim Lebailly, Tinne Tuytelaars

GlobalFlowNet: Video Stabilization Using Deep Distilled Global Motion Estimates Jerin Geo James, Devansh Jain, Ajit Rajwade

Gradient-Based Quantification of Epistemic Uncertainty for Deep Object Detectors Tobias Riedlinger, Matthias Rottmann, Marius Schubert, Hanno Gottschalk

Graph-Based Self-Learning for Robust Person Re-Identification Yuqiao Xian, Jinrui Yang, Fufu Yu, Jun Zhang, Xing Sun

Grounding Scene Graphs on Natural Images via Visio-Lingual Message Passing Aditay Tripathi, Anand Mishra, Anirban Chakraborty

Guiding Users to Where to Give Color Hints for Efficient Interactive Sketch Colorization via Unsupervised Region Prioritization Youngin Cho, Junsoo Lee, Soyoung Yang, Juntae Kim, Yeojeong Park, Haneol Lee, Mohammad Azam Khan, Daesik Kim, Jaegul Choo

Guiding Visual Question Answering with Attention Priors Thao Minh Le, Vuong Le, Sunil Gupta, Svetha Venkatesh, Truyen Tran

HandGCNFormer: A Novel Topology-Aware Transformer Network for 3D Hand Pose Estimation Yintong Wang, LiLi Chen, Jiamao Li, Xiaolin Zhang

Handling Image and Label Resolution Mismatch in Remote Sensing Scott Workman, Armin Hadzic, M. Usman Rafique

Hard to Track Objects with Irregular Motions and Similar Appearances? Make It Easier by Buffering the Matching Space Fan Yang, Shigeyuki Odashima, Shoichi Masui, Shan Jiang

Harnessing Unrecognizable Faces for Improving Face Recognition Siqi Deng, Yuanjun Xiong, Meng Wang, Wei Xia, Stefano Soatto

Hear the Flow: Optical Flow-Based Self-Supervised Visual Sound Source Localization Dennis Fedorishin, Deen Dayal Mohan, Bhavin Jawade, Srirangaraj Setlur, Venu Govindaraju

Heatmap-Based Out-of-Distribution Detection Julia Hornauer, Vasileios Belagiannis

Heightfields for Efficient Scene Reconstruction for AR Jamie Watson, Sara Vicente, Oisin Mac Aodha, Clément Godard, Gabriel Brostow, Michael Firman

HiFormer: Hierarchical Multi-Scale Representations Using Transformers for Medical Image Segmentation Moein Heidari, Amirhossein Kazerouni, Milad Soltany, Reza Azad, Ehsan Khodapanah Aghdam, Julien Cohen-Adad, Dorit Merhof

High-Quality RGB-D Reconstruction via Multi-View Uncalibrated Photometric Stereo and Gradient-SDF Lu Sang, Björn Häfner, Xingxing Zuo, Daniel Cremers

High-Resolution Depth Estimation for 360deg Panoramas Through Perspective and Panoramic Depth Images Registration Chi-Han Peng, Jiayao Zhang

HIME: Efficient Headshot Image Super-Resolution with Multiple Exemplars Xiaoyu Xiang, Jon Morton, Fitsum A. Reda, Lucas D. Young, Federico Perazzi, Rakesh Ranjan, Amit Kumar, Andrea Colaco, Jan P. Allebach

HoechstGAN: Virtual Lymphocyte Staining Using Generative Adversarial Networks Georg Wölflein, In Hwa Um, David J. Harrison, Ognjen Arandjelović

Holistic Interaction Transformer Network for Action Detection Gueter Josmy Faure, Min-Hung Chen, Shang-Hong Lai

HOOT: Heavy Occlusions in Object Tracking Benchmark Gozde Sahin, Laurent Itti

How to Practice VQA on a Resource-Limited Target Domain Mingda Zhang, Rebecca Hwa, Adriana Kovashka

Human-in-the-Loop Video Semantic Segmentation Auto-Annotation Nan Qiao, Yuyin Sun, Chong Liu, Lu Xia, Jiajia Luo, Ke Zhang, Cheng-Hao Kuo

HuPR: A Benchmark for Human Pose Estimation Using Millimeter Wave Radar Shih-Po Lee, Niraj Prakash Kini, Wen-Hsiao Peng, Ching-Wen Ma, Jenq-Neng Hwang

Hyperblock Floating Point: Generalised Quantization Scheme for Gradient and Inference Computation Marcelo Gennari do Nascimento, Victor Adrian Prisacariu, Roger Fawcett, Martin Langhammer

Hyperdimensional Feature Fusion for Out-of-Distribution Detection Samuel Wilson, Tobias Fischer, Niko Sünderhauf, Feras Dayoub

HyperPosePDF - Hypernetworks Predicting the Probability Distribution on SO(3) Timon Höfer, Benjamin Kiefer, Martin Messmer, Andreas Zell

HyperShot: Few-Shot Learning by Kernel HyperNetworks Marcin Sendera, Marcin Przewięźlikowski, Konrad Karanowski, Maciej Zięba, Jacek Tabor, Przemysław Spurek

Hyperspherical Quantization: Toward Smaller and More Accurate Models Dan Liu, Xi Chen, Chen Ma, Xue Liu

I See-Through You: A Framework for Removing Foreground Occlusion in Both Sparse and Dense Light Field Images Jiwan Hur, Jae Young Lee, Jaehyun Choi, Junmo Kim

iColoriT: Towards Propagating Local Hints to the Right Region in Interactive Colorization by Leveraging Vision Transformer Jooyeol Yun, Sanghyeon Lee, Minho Park, Jaegul Choo

IDD-3D: Indian Driving Dataset for 3D Unstructured Road Scenes Shubham Dokania, A. H. Abdul Hafez, Anbumani Subramanian, Manmohan Chandraker, C. V. Jawahar

IFQA: Interpretable Face Quality Assessment Byungho Jo, Donghyeon Cho, In Kyu Park, Sungeun Hong

Image Completion with Heterogeneously Filtered Spectral Hints Xingqian Xu, Shant Navasardyan, Vahram Tadevosyan, Andranik Sargsyan, Yadong Mu, Humphrey Shi

Image Segmentation-Based Unsupervised Multiple Objects Discovery Sandra Kara, Hejer Ammar, Florian Chabot, Quoc-Cuong Pham

Image-Consistent Detection of Road Anomalies as Unpredictable Patches Tomáš Vojíř, Jiří Matas

Image-Free Domain Generalization via CLIP for 3D Hand Pose Estimation Seongyeong Lee, Hansoo Park, Dong Uk Kim, Jihyeon Kim, Muhammadjon Boboev, Seungryul Baek

Image-Text Pre-Training for Logo Recognition Mark Hubenthal, Suren Kumar

ImpDet: Exploring Implicit Fields for 3D Object Detection Xuelin Qian, Li Wang, Yi Zhu, Li Zhang, Yanwei Fu, Xiangyang Xue

ImPosing: Implicit Pose Encoding for Efficient Visual Localization Arthur Moreau, Thomas Gilles, Nathan Piasco, Dzmitry Tsishkou, Bogdan Stanciulescu, Arnaud de La Fortelle

Improving Deep Facial Phenotyping for Ultra-Rare Disorder Verification Using Model Ensembles Alexander Hustinx, Fabio Hellmann, Ömer Sümer, Behnam Javanmardi, Elisabeth André, Peter Krawitz, Tzung-Chien Hsieh

Improving Diversity with Adversarially Learned Transformations for Domain Generalization Tejas Gokhale, Rushil Anirudh, Jayaraman J. Thiagarajan, Bhavya Kailkhura, Chitta Baral, Yezhou Yang

Improving Multi-Fidelity Optimization with a Recurring Learning Rate for Hyperparameter Tuning HyunJae Lee, Gihyeon Lee, Junhwan Kim, Sungjun Cho, Dohyun Kim, Donggeun Yoo

Improving Pixel-Level Contrastive Learning by Leveraging Exogenous Depth Information Ahmed Ben Saad, Kristina Prokopetc, Josselin Kherroubi, Axel Davy, Adrien Courtois, Gabriele Facciolo

Improving Predicate Representation in Scene Graph Generation by Self-Supervised Learning So Hasegawa, Masayuki Hiromoto, Akira Nakagawa, Yuhei Umeda

Improving Saliency Models' Predictions of the Next Fixation with Humans' Intrinsic Cost of Gaze Shifts Florian Kadner, Tobias Thomas, David Hoppe, Constantin A. Rothkopf

Improving the Pair Selection and the Model Fusion Steps of Satellite Multi-View Stereo Pipelines Alvaro Gómez, Gregory Randall, Gabriele Facciolo, Rafael Grompone von Gioi

Improving the Robustness of Point Convolution on K-Nearest Neighbor Neighborhoods with a Viewpoint-Invariant Coordinate Transform Xingyi Li, Wenxuan Wu, Xiaoli Z. Fern, Li Fuxin

Indirect Adversarial Losses via an Intermediate Distribution for Training GANs Rui Yang, Duc Minh Vo, Hideki Nakayama

InDiReCT: Language-Guided Zero-Shot Deep Metric Learning for Images Konstantin Kobs, Michael Steininger, Andreas Hotho

Inducing Data Amplification Using Auxiliary Datasets in Adversarial Training Saehyung Lee, Hyungyu Lee

Instance-Dependent Noisy Label Learning via Graphical Modelling Arpit Garg, Cuong Nguyen, Rafael Felix, Thanh-Toan Do, Gustavo Carneiro

Intention-Conditioned Long-Term Human Egocentric Action Anticipation Esteve Valls Mascaró, Hyemin Ahn, Dongheui Lee

Interacting Hand-Object Pose Estimation via Dense Mutual Attention Rong Wang, Wei Mao, Hongdong Li

Interactive Image Manipulation with Complex Text Instructions Ryugo Morita, Zhiqiang Zhang, Man M. Ho, Jinjia Zhou

Interpolated SelectionConv for Spherical Images and Surfaces David Hart, Michael Whitney, Bryan Morse

Interpreting Disparate Privacy-Utility Tradeoff in Adversarial Learning via Attribute Correlation Likun Zhang, Yahong Chen, Ang Li, Binghui Wang, Yiran Chen, Fenghua Li, Jin Cao, Ben Niu

Intra-Batch Supervision for Panoptic Segmentation on High-Resolution Images Daan de Geus, Gijs Dubbelman

Intra-Source Style Augmentation for Improved Domain Generalization Yumeng Li, Dan Zhang, Margret Keuper, Anna Khoreva

Is Bigger Always Better? an Empirical Study on Efficient Architectures for Style Transfer and Beyond Jie An, Tao Li, Haozhi Huang, Jinwen Ma, Jiebo Luo

Is Your Noise Correction Noisy? PLS: Robustness to Label Noise with Two Stage Detection Paul Albert, Eric Arazo, Tarun Krishna, Noel E. O’Connor, Kevin McGuinness

Joint Video Rolling Shutter Correction and Super-Resolution Akash Gupta, Sudhir Kumar Singh, Amit K. Roy-Chowdhury

Jointly Learning Band Selection and Filter Array Design for Hyperspectral Imaging Ke Li, Dengxin Dai, Luc Van Gool

K-VQG: Knowledge-Aware Visual Question Generation for Common-Sense Acquisition Kohei Uehara, Tatsuya Harada

Kernel-Aware Burst Blind Super-Resolution Wenyi Lian, Shanglian Peng

Keys to Better Image Inpainting: Structure and Texture Go Hand in Hand Jitesh Jain, Yuqian Zhou, Ning Yu, Humphrey Shi

Kinematic-Aware Hierarchical Attention Network for Human Pose Estimation in Videos Kyung-Min Jin, Byoung-Sung Lim, Gun-Hee Lee, Tae-Kyung Kang, Seong-Whan Lee

Knowing What to Label for Few Shot Microscopy Image Cell Segmentation Youssef Dawoud, Arij Bouazizi, Katharina Ernst, Gustavo Carneiro, Vasileios Belagiannis

LAB: Learnable Activation Binarizer for Binary Neural Networks Sieger Falkena, Hadi Jamali-Rad, Jan van Gemert

Language-Free Training for Zero-Shot Video Grounding Dahye Kim, Jungin Park, Jiyoung Lee, Seongheon Park, Kwanghoon Sohn

Large-Scale Open-Set Classification Protocols for ImageNet Andres Palechor, Annesha Bhoumik, Manuel Günther

Large-to-Small Image Resolution Asymmetry in Deep Metric Learning Pavel Suma, Giorgos Tolias

LAVA: Label-Efficient Visual Learning and Adaptation Islam Nassar, Munawar Hayat, Ehsan Abbasnejad, Hamid Rezatofighi, Mehrtash Harandi, Gholamreza Haffari

LayerDoc: Layer-Wise Extraction of Spatial Hierarchical Structure in Visually-Rich Documents Puneet Mathur, Rajiv Jain, Ashutosh Mehra, Jiuxiang Gu, Franck Dernoncourt, Anandhavelu N., Quan Tran, Verena Kaynig-Fittkau, Ani Nenkova, Dinesh Manocha, Vlad I. Morariu

LCS: Learning Compressible Subspaces for Efficient, Adaptive, Real-Time Network Compression at Inference Time Elvis Nunez, Maxwell Horton, Anish Prabhu, Anurag Ranjan, Ali Farhadi, Mohammad Rastegari

Learnable Human Mesh Triangulation for 3D Human Pose and Shape Estimation Sungho Chun, Sungbum Park, Ju Yong Chang

Learning 3D Human Pose Estimation from Dozens of Datasets Using a Geometry-Aware Autoencoder to Bridge Between Skeleton Formats István Sárándi, Alexander Hermans, Bastian Leibe

Learning Across Domains and Devices: Style-Driven Source-Free Domain Adaptation in Clustered Federated Learning Donald Shenaj, Eros Fanì, Marco Toldo, Debora Caldarola, Antonio Tavera, Umberto Michieli, Marco Ciccone, Pietro Zanuttigh, Barbara Caputo

Learning Attention Propagation for Compositional Zero-Shot Learning Muhammad Gul Zain Ali Khan, Muhammad Ferjad Naeem, Luc Van Gool, Alain Pagani, Didier Stricker, Muhammad Zeshan Afzal

Learning by Hallucinating: Vision-Language Pre-Training with Weak Supervision Tzu-Jui Julius Wang, Jorma Laaksonen, Tomas Langer, Heikki Arponen, Tom E. Bishop

Learning Classifiers of Prototypes and Reciprocal Points for Universal Domain Adaptation Sungsu Hur, Inkyu Shin, Kwanyong Park, Sanghyun Woo, In So Kweon

Learning Few-Shot Segmentation from Bounding Box Annotations Byeolyi Han, Tae-Hyun Oh

Learning Graph Variational Autoencoders with Constraints and Structured Priors for Conditional Indoor 3D Scene Generation Aditya Chattopadhyay, Xi Zhang, David Paul Wipf, Himanshu Arora, René Vidal

Learning How to MIMIC: Using Model Explanations to Guide Deep Learning Training Matthew Watson, Bashar Awwad Shiekh Hasan, Noura Al Moubayed

Learning Incoherent Light Emission Steering from Metasurfaces Using Generative Models Prasad P. Iyer, Saaketh Desai, Sadhvikas Addamane, Remi Dingreville, Igal Brener

Learning Latent Structural Relations with Message Passing Prior Shaogang Ren, Hongliang Fei, Dingcheng Li, Ping Li

Learning Lightweight Neural Networks via Channel-Split Recurrent Convolution Guojun Wu, Xin Zhang, Ziming Zhang, Yanhua Li, Xun Zhou, Christopher Brinton, Zhenming Liu

Learning Style Subspaces for Controllable Unpaired Domain Translation Gaurav Bhatt, Vineeth N. Balasubramanian

Learning to Detect 3D Lanes by Shape Matching and Embedding Ruixin Liu, Zhihao Guan, Zejian Yuan, Ao Liu, Tong Zhou, Tang Kun, Erlong Li, Chao Zheng, Shuqi Mei

Leveraging Local Patch Differences in Multi-Object Scenes for Generative Adversarial Attacks Abhishek Aich, Shasha Li, Chengyu Song, M. Salman Asif, Srikanth V. Krishnamurthy, Amit K. Roy-Chowdhury

Leveraging Off-the-Shelf Diffusion Model for Multi-Attribute Fashion Image Manipulation Chaerin Kong, DongHyeon Jeon, Ohjoon Kwon, Nojun Kwak

Li3DeTr: A LiDAR Based 3D Detection Transformer Gopi Krishna Erabati, Helder Araujo

Lightweight Network for Video Motion Magnification Jasdeep Singh, Subrahmanyam Murala, G. Sankara Raju Kosuru

Lightweight Video Denoising Using Aggregated Shifted Window Attention Lydia Lindner, Alexander Effland, Filip Ilic, Thomas Pock, Erich Kobler

Line Search-Based Feature Transformation for Fast, Stable, and Tunable Content-Style Control in Photorealistic Style Transfer Tai-Yin Chiu, Danna Gurari

LineEX: Data Extraction from Scientific Line Charts V. P. Shivasankaran, Muhammad Yusuf Hassan, Mayank Singh

LiveSeg: Unsupervised Multimodal Temporal Segmentation of Long Livestream Videos Jielin Qiu, Franck Dernoncourt, Trung Bui, Zhaowen Wang, Ding Zhao, Hailin Jin

LoopDA: Constructing Self-Loops to Adapt Nighttime Semantic Segmentation Fengyi Shen, Zador Pataki, Akhil Gurram, Ziyuan Liu, He Wang, Alois Knoll

Lossy Image Compression with Quantized Hierarchical VAEs Zhihao Duan, Ming Lu, Zhan Ma, Fengqing Zhu

LRA&LDRA: Rethinking Residual Predictions for Efficient Shadow Detection and Removal Mehmet Kerim Yücel, Valia Dimaridou, Bruno Manganelli, Mete Ozay, Anastasios Drosou, Albert Saà-Garriga

M-FUSE: Multi-Frame Fusion for Scene Flow Estimation Lukas Mehl, Azin Jahedi, Jenny Schmalfuss, Andrés Bruhn

Magnification Prior: A Self-Supervised Method for Learning Representations on Breast Cancer Histopathological Images Prakash Chandra Chhipa, Richa Upadhyay, Gustav Grund Pihlgren, Rajkumar Saini, Seiichi Uchida, Marcus Liwicki

Mapping DNN Embedding Manifolds for Network Generalization Prediction Molly O’Brien, Brett Wolfinger, Julia Bukowski, Mathias Unberath, Aria Pezeshk, Gregory D. Hager

Marker-Removal Networks to Collect Precise 3D Hand Data for RGB-Based Estimation and Its Application in Piano Erwin Wu, Hayato Nishioka, Shinichi Furuya, Hideki Koike

Masked Image Modeling Advances 3D Medical Image Analysis Zekai Chen, Devansh Agarwal, Kshitij Aggarwal, Wiem Safta, Mariann Micsinai Balan, Kevin Brown

MASTAF: A Model-Agnostic Spatio-Temporal Attention Fusion Network for Few-Shot Video Classification Xin Liu, Huanle Zhang, Hamed Pirsiavash, Xin Liu

Match Cutting: Finding Cuts with Smooth Visual Transitions Boris Chen, Amir Ziai, Rebecca S. Tucker, Yuchen Xie

Medical Image Segmentation via Cascaded Attention Decoding Md Mostafijur Rahman, Radu Marculescu

Mesh-Tension Driven Expression-Based Wrinkles for Synthetic Faces Chirag Raman, Charlie Hewitt, Erroll Wood, Tadas Baltrušaitis

Meta-Auxiliary Learning for Future Depth Prediction in Videos Huan Liu, Zhixiang Chi, Yuanhao Yu, Yang Wang, Jun Chen, Jin Tang

Meta-Learning for Adaptation of Deep Optical Flow Networks Chaerin Min, Taehyun Kim, Jongwoo Lim

Meta-OLE: Meta-Learned Orthogonal Low-Rank Embedding Ze Wang, Yue Lu, Qiang Qiu

MEVID: Multi-View Extended Videos with Identities for Video Person Re-Identification Daniel Davila, Dawei Du, Bryon Lewis, Christopher Funk, Joseph Van Pelt, Roderic Collins, Kellie Corona, Matt Brown, Scott McCloskey, Anthony Hoogs, Brian Clipp

MFCFlow: A Motion Feature Compensated Multi-Frame Recurrent Network for Optical Flow Estimation Yonghu Chen, Dongchen Zhu, Wenjun Shi, Guanghui Zhang, Tianyu Zhang, Xiaolin Zhang, Jiamao Li

MFFN: Multi-View Feature Fusion Network for Camouflaged Object Detection Dehua Zheng, Xiaochen Zheng, Laurence T. Yang, Yuan Gao, Chenlu Zhu, Yiheng Ruan

Misclassifications of Contact Lens Iris PAD Algorithms: Is It Gender Bias or Environmental Conditions? Akshay Agarwal, Nalini Ratha, Afzel Noore, Richa Singh, Mayank Vatsa

Mixture Outlier Exposure: Towards Out-of-Distribution Detection in Fine-Grained Environments Jingyang Zhang, Nathan Inkawhich, Randolph Linderman, Yiran Chen, Hai Li

MixVPR: Feature Mixing for Visual Place Recognition Amar Ali-bey, Brahim Chaib-draa, Philippe Giguère

ML-Decoder: Scalable and Versatile Classification Head Tal Ridnik, Gilad Sharir, Avi Ben-Cohen, Emanuel Ben-Baruch, Asaf Noy

MMPTRACK: Large-Scale Densely Annotated Multi-Camera Multiple People Tracking Benchmark Xiaotian Han, Quanzeng You, Chunyu Wang, Zhizheng Zhang, Peng Chu, Houdong Hu, Jiang Wang, Zicheng Liu

Mobile Robot Manipulation Using Pure Object Detection Brent Griffin

Modality Mixer for Multi-Modal Action Recognition Sumin Lee, Sangmin Woo, Yeonju Park, Muhammad Adi Nugroho, Changick Kim

Modeling Stroke Mask for End-to-End Text Erasing Xiangcheng Du, Zhao Zhou, Yingbin Zheng, Tianlong Ma, Xingjiao Wu, Cheng Jin

Modeling the Lighting in Scenes as Style for Auto White-Balance Correction Furkan Kınlı, Doğa Yılmaz, Barış Özcan, Furkan Kıraç

MonoDVPS: A Self-Supervised Monocular Depth Estimation Approach to Depth-Aware Video Panoptic Segmentation Andra Petrovai, Sergiu Nedevschi

MonoEdge: Monocular 3D Object Detection Using Local Perspectives Minghan Zhu, Lingting Ge, Panqu Wang, Huei Peng

More Control for Free! Image Synthesis with Semantic Diffusion Guidance Xihui Liu, Dong Huk Park, Samaneh Azadi, Gong Zhang, Arman Chopikyan, Yuxiao Hu, Humphrey Shi, Anna Rohrbach, Trevor Darrell

More Knowledge, Less Bias: Unbiasing Scene Graph Generation with Explicit Ontological Adjustment Zhanwen Chen, Saed Rezayi, Sheng Li

More than Just Attention: Improving Cross-Modal Attentions with Contrastive Constraints for Image-Text Matching Yuxiao Chen, Jianbo Yuan, Long Zhao, Tianlang Chen, Rui Luo, Larry Davis, Dimitris N. Metaxas

MORGAN: Meta-Learning-Based Few-Shot Open-Set Recognition via Generative Adversarial Network Debabrata Pal, Shirsha Bose, Biplab Banerjee, Yogananda Jeppu

Motif Mining: Finding and Summarizing Remixed Image Content William Theisen, Daniel Gonzalez Cedre, Zachariah Carmichael, Daniel Moreira, Tim Weninger, Walter Scheirer

Motion Aware Self-Supervision for Generic Event Boundary Detection Ayush K. Rai, Tarun Krishna, Julia Dietlmeier, Kevin McGuinness, Alan F. Smeaton, Noel E. O’Connor

MovieCLIP: Visual Scene Recognition in Movies Digbalay Bose, Rajat Hebbar, Krishna Somandepalli, Haoyang Zhang, Yin Cui, Kree Cole-McLaughlin, Huisheng Wang, Shrikanth Narayanan

MRI Imputation Based on Fused Index- and Intensity-Registration Jiyoon Shin, Jungwoo Lee

MT-DETR: Robust End-to-End Multimodal Detection with Confidence Fusion Shih-Yun Chu, Ming-Sui Lee

Multi-Frame Attention with Feature-Level Warping for Drone Crowd Tracking Takanori Asanomi, Kazuya Nishimura, Ryoma Bise

Multi-Level Contrastive Learning for Self-Supervised Vision Transformers Shentong Mo, Zhun Sun, Chao Li

Multi-Scale Cell-Based Layout Representation for Document Understanding Yuzhi Shi, Mijung Kim, Yeongnam Chae

Multi-Scale Contrastive Learning for Complex Scene Generation Hanbit Lee, Youna Kim, Sang-goo Lee

Multi-View Action Recognition Using Contrastive Learning Ketul Shah, Anshul Shah, Chun Pong Lau, Celso M. de Melo, Rama Chellappa

Multi-View Photometric Stereo Revisited Berk Kaya, Suryansh Kumar, Carlos Oliveira, Vittorio Ferrari, Luc Van Gool

Multi-View Tracking Using Weakly Supervised Human Motion Prediction Martin Engilberge, Weizhe Liu, Pascal Fua

Multimodal Multi-Head Convolutional Attention with Various Kernel Sizes for Medical Image Super-Resolution Mariana-Iuliana Georgescu, Radu Tudor Ionescu, Andreea-Iuliana Miron, Olivian Savencu, Nicolae-Cătălin Ristea, Nicolae Verga, Fahad Shahbaz Khan

Multimodal Vision Transformers with Forced Attention for Behavior Analysis Tanay Agrawal, Michal Balazia, Philipp Müller, François Brémond

Multivariate Probabilistic Monocular 3D Object Detection Xuepeng Shi, Zhixiang Chen, Tae-Kyun Kim

Mutual Learning for Long-Tailed Recognition Changhwa Park, Junho Yim, Eunji Jun

My Face My Choice: Privacy Enhancing Deepfakes for Social Media Anonymization Umur A. Çiftçi, Gokturk Yuksek, İlke Demir

NAPReg: Nouns as Proxies Regularization for Semantically Aware Cross-Modal Embeddings Bhavin Jawade, Deen Dayal Mohan, Naji Mohamed Ali, Srirangaraj Setlur, Venu Govindaraju

Nearest Neighbors Meet Deep Neural Networks for Point Cloud Analysis Renrui Zhang, Liuhui Wang, Ziyu Guo, Jianbo Shi

Nested Deformable Multi-Head Attention for Facial Image Inpainting Shruti S. Phutke, Subrahmanyam Murala

Neural Distributed Image Compression with Cross-Attention Feature Alignment Nitish Mital, Ezgi Özyilkan, Ali Garjani, Deniz Gündüz

Neural Implicit Representations for Physical Parameter Inference from a Single Video Florian Hofherr, Lukas Koestler, Florian Bernard, Daniel Cremers

Neural Weight Search for Scalable Task Incremental Learning Jian Jiang, Oya Celiktutan

NeuralBF: Neural Bilateral Filtering for Top-Down Instance Segmentation on Point Clouds Weiwei Sun, Daniel Rebain, Renjie Liao, Vladimir Tankovich, Soroosh Yazdani, Kwang Moo Yi, Andrea Tagliasacchi

nLMVS-Net: Deep Non-Lambertian Multi-View Stereo Kohei Yamashita, Yuto Enyo, Shohei Nobuhara, Ko Nishino

No Reference Opinion Unaware Quality Assessment of Authentically Distorted Images Nithin C. Babu, Vignesh Kannan, Rajiv Soundararajan

No Shifted Augmentations (NSA): Compact Distributions for Robust Self-Supervised Anomaly Detection Mohamed Yousef, Marcel Ackermann, Unmesh Kurup, Tom Bishop

Normality Guided Multiple Instance Learning for Weakly Supervised Video Anomaly Detection Seongheon Park, Hanjae Kim, Minsu Kim, Dahye Kim, Kwanghoon Sohn

OCR-VQGAN: Taming Text-Within-Image Generation Juan A. Rodríguez, David Vazquez, Issam Laradji, Marco Pedersoli, Pau Rodriguez

On Quantizing Implicit Neural Representations Cameron Gordon, Shin-Fang Chng, Lachlan MacDonald, Simon Lucey

On the Importance of Denoising When Learning to Compress Images Benoit Brummer, Christophe De Vleeschouwer

One-Shot Doc Snippet Detection: Powering Search in Document Beyond Text Abhinav Java, Shripad Deshmukh, Milan Aggarwal, Surgan Jandial, Mausoom Sarkar, Balaji Krishnamurthy

One-Shot Synthesis of Images and Segmentation Masks Vadim Sushko, Dan Zhang, Jürgen Gall, Anna Khoreva

Online Adaptive Temporal Memory with Certainty Estimation for Human Trajectory Prediction Manh Huynh, Gita Alaghband

Online Knowledge Distillation for Multi-Task Learning Geethu Miriam Jacob, Vishal Agarwal, Björn Stenger

OpenEarthMap: A Benchmark Dataset for Global High-Resolution Land Cover Mapping Junshi Xia, Naoto Yokoya, Bruno Adriano, Clifford Broni-Bediako

Orthogonal Transforms for Learning Invariant Representations in Equivariant Neural Networks Jaspreet Singh, Chandan Singh, Ankur Rana

Out-of-Distribution Detection via Frequency-Regularized Generative Models Mu Cai, Yixuan Li

Out-of-Distribution Detection with Reconstruction Error and Typicality-Based Penalty Genki Osada, Tsubasa Takahashi, Budrul Ahsan, Takashi Nishide

OutfitTransformer: Learning Outfit Representations for Fashion Recommendation Rohan Sarkar, Navaneeth Bodla, Mariya I. Vasileva, Yen-Liang Lin, Anurag Beniwal, Alan Lu, Gerard Medioni

Overlap-Guided Gaussian Mixture Models for Point Cloud Registration Guofeng Mei, Fabio Poiesi, Cristiano Saltori, Jian Zhang, Elisa Ricci, Nicu Sebe

Panoptic-Aware Image-to-Image Translation Liyun Zhang, Photchara Ratsamee, Bowen Wang, Zhaojie Luo, Yuki Uranishi, Manabu Higashida, Haruo Takemura

Partially Calibrated Semi-Generalized Pose from Hybrid Point Correspondences Snehal Bhayani, Torsten Sattler, Viktor Larsson, Janne Heikkilä, Zuzana Kukelova

Patch-Based Privacy Preserving Neural Network for Vision Tasks Mitsuhiro Mabuchi, Tetsuya Ishikawa

Patch-Level Gaze Distribution Prediction for Gaze Following Qiaomu Miao, Minh Hoai, Dimitris Samaras

PatchDropout: Economizing Vision Transformers Using Patch Dropout Yue Liu, Christos Matsoukas, Fredrik Strand, Hossein Azizpour, Kevin Smith

PatchZero: Defending Against Adversarial Patch Attacks by Detecting and Zeroing the Patch Ke Xu, Yao Xiao, Zhaoheng Zheng, Kaijie Cai, Ram Nevatia

Perceiver-VL: Efficient Vision-and-Language Modeling with Iterative Latent Attention Zineng Tang, Jaemin Cho, Jie Lei, Mohit Bansal

Perceptual Image Enhancement for Smartphone Real-Time Applications Marcos V. Conde, Florin Vasluianu, Javier Vazquez-Corral, Radu Timofte

Performance Comparison of DVS Data Spatial Downscaling Methods Using Spiking Neural Networks Amélie Gruel, Jean Martinet, Bernabé Linares-Barranco, Teresa Serrano-Gotarredona

Performer: A Novel PPG-to-ECG Reconstruction Transformer for a Digital Biomarker of Cardiovascular Disease Detection Ella Lan

Phantom Sponges: Exploiting Non-Maximum Suppression to Attack Deep Object Detectors Avishag Shapira, Alon Zolfi, Luca Demetrio, Battista Biggio, Asaf Shabtai

Physically Plausible Animation of Human Upper Body from a Single Image Ziyuan Huang, Zhengping Zhou, Yung-Yu Chuang, Jiajun Wu, C. Karen Liu

PIDS: Joint Point Interaction-Dimension Search for 3D Point Cloud Tunhou Zhang, Mingyuan Ma, Feng Yan, Hai Li, Yiran Chen

Pik-Fix: Restoring and Colorizing Old Photos Runsheng Xu, Zhengzhong Tu, Yuanqi Du, Xiaoyu Dong, Jinlong Li, Zibo Meng, Jiaqi Ma, Alan Bovik, Hongkai Yu

PINER: Prior-Informed Implicit Neural Representation Learning for Test-Time Adaptation in Sparse-View CT Reconstruction Bowen Song, Liyue Shen, Lei Xing

Pixel-Wise Prediction Based Visual Odometry via Uncertainty Estimation Hao-Wei Chen, Ting-Hsuan Liao, Hsuan-Kung Yang, Chun-Yi Lee

Placing Human Animations into 3D Scenes by Learning Interaction- and Geometry-Driven Keyframes James F. Mullen, Divya Kothandaraman, Aniket Bera, Dinesh Manocha

Planar Object Tracking via Weighted Optical Flow Jonáš Šerých, Jiří Matas

PointInverter: Point Cloud Reconstruction and Editing via a Generative Model with Shape Priors Jaeyeon Kim, Binh-Son Hua, Thanh Nguyen, Sai-Kit Yeung

PointNeuron: 3D Neuron Reconstruction via Geometry and Topology Learning of Point Clouds Runkai Zhao, Heng Wang, Chaoyi Zhang, Weidong Cai

PP4AV: A Benchmarking Dataset for Privacy-Preserving Autonomous Driving Linh Trinh, Phuong Pham, Hoang Trinh, Nguyen Bach, Dung Nguyen, Giang Nguyen, Huy Nguyen

PreViTS: Contrastive Pretraining with Video Tracking Supervision Brian Chen, Ramprasaath R. Selvaraju, Shih-Fu Chang, Juan Carlos Niebles, Nikhil Naik

PRN: Panoptic Refinement Network Bo Sun, Jason Kuen, Zhe Lin, Philippos Mordohai, Simon Chen

Proactive Deepfake Defence via Identity Watermarking Yuan Zhao, Bo Liu, Ming Ding, Baoping Liu, Tianqing Zhu, Xin Yu

Probabilistic Integration of Object Level Annotations in Chest X-Ray Classification Tom van Sonsbeek, Xiantong Zhen, Dwarikanath Mahapatra, Marcel Worring

Probabilistic Volumetric Fusion for Dense Monocular SLAM Antoni Rosinol, John J. Leonard, Luca Carlone

Progressive Video Summarization via Multimodal Self-Supervised Learning Haopeng Li, Qiuhong Ke, Mingming Gong, Tom Drummond

ProtoSeg: Interpretable Semantic Segmentation with Prototypical Parts Mikołaj Sacha, Dawid Rymarczyk, Łukasz Struski, Jacek Tabor, Bartosz Zieliński

Pruning-Guided Curriculum Learning for Semi-Supervised Semantic Segmentation Heejo Kong, Gun-Hee Lee, Suneung Kim, Seong-Whan Lee

PSENet: Progressive Self-Enhancement Network for Unsupervised Extreme-Light Image Enhancement Hue Nguyen, Diep Tran, Khoi Nguyen, Rang Nguyen

Pushing the Efficiency Limit Using Structured Sparse Convolutions Vinay Kumar Verma, Nikhil Mehta, Shijing Si, Ricardo Henao, Lawrence Carin

QMagFace: Simple and Accurate Quality-Aware Face Recognition Philipp Terhörst, Malte Ihlefeld, Marco Huber, Naser Damer, Florian Kirchbuchner, Kiran Raja, Arjan Kuijper

RADIANT: Better rPPG Estimation Using Signal Embeddings and Transformer Anup Kumar Gupta, Rupesh Kumar, Lokendra Birla, Puneet Gupta

RANCER: Non-Axis Aligned Anisotropic Certification with Randomized Smoothing Taras Rumezhak, Francisco Girbal Eiras, Philip H.S. Torr, Adel Bibi

Randomness Is the Root of All Evil: More Reliable Evaluation of Deep Active Learning Yilin Ji, Daniel Kaestner, Oliver Wirth, Christian Wressnegger

RAST: Restorable Arbitrary Style Transfer via Multi-Restoration Yingnan Ma, Chenqiu Zhao, Xudong Li, Anup Basu

Real-Time Concealed Weapon Detection on 3D Radar Images for Walk-Through Screening System Nagma S. Khan, Kazumine Ogura, Eric Cosatto, Masayuki Ariyoshi

Real-Time Restoration of Dark Stereo Images Mohit Lamba, M. V. A. Suhas Kumar, Kaushik Mitra

Realistic Full-Body Anonymization with Surface-Guided GANs Håkon Hukkelås, Morten Smebye, Rudolf Mester, Frank Lindseth

Rebalancing Gradient to Improve Self-Supervised Co-Training of Depth, Odometry and Optical Flow Predictions Marwane Hariat, Antoine Manzanera, David Filliat

Recipe2Video: Synthesizing Personalized Videos from Recipe Texts Prateksha Udhayanan, Suryateja Bv, Parth Laturia, Dev Chauhan, Darshan Khandelwal, Stefano Petrangeli, Balaji Vasan Srinivasan

Reconstructing Humpty Dumpty: Multi-Feature Graph Autoencoder for Open Set Action Recognition Dawei Du, Ameya Shringi, Anthony Hoogs, Christopher Funk

Recovering Fine Details for Neural Implicit Surface Reconstruction Decai Chen, Peng Zhang, Ingo Feldmann, Oliver Schreer, Peter Eisert

Recur, Attend or Convolve? on Whether Temporal Modeling Matters for Cross-Domain Robustness in Action Recognition Sofia Broomé, Ernest Pokropek, Boyu Li, Hedvig Kjellström

Reducing Annotation Effort by Identifying and Labeling Contextually Diverse Classes for Semantic Segmentation Under Domain Shift Sharat Agarwal, Saket Anand, Chetan Arora

ReEnFP: Detail-Preserving Face Reconstruction by Encoding Facial Priors Yasheng Sun, Jiangke Lin, Hang Zhou, Zhiliang Xu, Dongliang He, Hideki Koike

Refign: Align and Refine for Adaptation of Semantic Segmentation to Adverse Conditions David Brüggemann, Christos Sakaridis, Prune Truong, Luc Van Gool

Relation Preserving Triplet Mining for Stabilising the Triplet Loss in Re-Identification Systems Adhiraj Ghosh, Kuruparan Shanmugalingam, Wen-Yan Lin

Relaxing Contrastiveness in Multimodal Representation Learning Zudi Lin, Erhan Bas, Kunwar Yashraj Singh, Gurumurthy Swaminathan, Rahul Bhotika

Representation Disentanglement in Generative Models with Contrastive Learning Shentong Mo, Zhun Sun, Chao Li

Representation Recovering for Self-Supervised Pre-Training on Medical Images Xiangyi Yan, Junayed Naushad, Shanlin Sun, Kun Han, Hao Tang, Deying Kong, Haoyu Ma, Chenyu You, Xiaohui Xie

Resolving Class Imbalance for LiDAR-Based Object Detector by Dynamic Weight Average and Contextual Ground Truth Sampling Daeun Lee, Jinkyu Kim

Rethinking Rotation in Self-Supervised Contrastive Learning: Adaptive Positive or Negative Data Augmentation Atsuyuki Miyai, Qing Yu, Daiki Ikami, Go Irie, Kiyoharu Aizawa

Rethinking the Data Annotation Process for Multi-View 3D Pose Estimation with Active Learning and Self-Training Qi Feng, Kun He, He Wen, Cem Keskin, Yuting Ye

Revisiting Training-Free NAS Metrics: An Efficient Training-Based Method Taojiannan Yang, Linjie Yang, Xiaojie Jin, Chen Chen

RIFT: Disentangled Unsupervised Image Translation via Restricted Information Flow Ben Usman, Dina Bashkirova, Kate Saenko

RNAS-MER: A Refined Neural Architecture Search with Hybrid Spatiotemporal Operations for Micro-Expression Recognition Monu Verma, Priyanka Lubal, Santosh Kumar Vipparthi, Mohamed Abdel-Mottaleb

Robust and Efficient Alignment of Calcium Imaging Data Through Simultaneous Low Rank and Sparse Decomposition Junmo Cho, Seungjae Han, Eun-Seo Cho, Kijung Shin, Young-Gyu Yoon

Robust Real-World Image Enhancement Based on Multi-Exposure LDR Images Haoyu Ren, Yi Fan, Stephen Huang

Robustness of Trajectory Prediction Models Under mAP-Based Attacks Zhihao Zheng, Xiaowen Ying, Zhen Yao, Mooi Choo Chuah

ROMA: Run-Time Object Detection to Maximize Real-Time Accuracy JunKyu Lee, Blesson Varghese, Hans Vandierendonck

RSF: Optimizing Rigid Scene Flow from 3D Point Clouds Without Labels David Deng, Avideh Zakhor

SAILOR: Scaling Anchors via Insights into Latent Object Representation Dušan Malić, Christian Fruhwirth-Reisinger, Horst Possegger, Horst Bischof

SALAD: Source-Free Active Label-Agnostic Domain Adaptation for Classification, Segmentation and Detection Divya Kothandaraman, Sumit Shekhar, Abhilasha Sancheti, Manoj Ghuhan, Tripti Shukla, Dinesh Manocha

Saliency Guided Experience Packing for Replay in Continual Learning Gobinda Saha, Kaushik Roy

SAT: Scale-Augmented Transformer for Person Search Mustansar Fiaz, Hisham Cholakkal, Rao Muhammad Anwer, Fahad Shahbaz Khan

Scaling Neural Face Synthesis to High FPS and Low Latency by Neural Caching Frank Yu, Sid Fels, Helge Rhodin

Scaling Novel Object Detection with Weakly Supervised Detection Transformers Tyler LaBonte, Yale Song, Xin Wang, Vibhav Vineet, Neel Joshi

ScanNeRF: A Scalable Benchmark for Neural Radiance Fields Luca De Luigi, Damiano Bolognini, Federico Domeniconi, Daniele De Gregorio, Matteo Poggi, Luigi Di Stefano

ScoreNet: Learning Non-Uniform Attention and Augmentation for Transformer-Based Histopathological Image Classification Thomas Stegmüller, Behzad Bozorgtabar, Antoine Spahr, Jean-Philippe Thiran

SCTS: Instance Segmentation of Single Cells Using a Transformer-Based Semantic-Aware Model and Space-Filling Augmentation Yating Zhou, Wenjing Li, Ge Yang

SD-Conv: Towards the Parameter-Efficiency of Dynamic Convolution Shwai He, Chenbo Jiang, Daize Dong, Liang Ding

SD-Pose: Structural Discrepancy Aware Category-Level 6d Object Pose Estimation Guowei Li, Dongchen Zhu, Guanghui Zhang, Wenjun Shi, Tianyu Zhang, Xiaolin Zhang, Jiamao Li

Searching Efficient Neural Architecture with Multi-Resolution Fusion Transformer for Appearance-Based Gaze Estimation Vikrant Nagpure, Kenji Okuma

Searching for Robust Binary Neural Networks via Bimodal Parameter Perturbation Daehyun Ahn, Hyungjun Kim, Taesu Kim, Eunhyeok Park, Jae-Joon Kim

SeCo: Separating Unknown Musical Visual Sounds with Consistency Guidance Xinchi Zhou, Dongzhan Zhou, Wanli Ouyang, Hang Zhou, Di Hu

Seg&Struct: The Interplay Between Part Segmentation and Structure Inference for 3D Shape Parsing Jeonghyun Kim, Kaichun Mo, Minhyuk Sung, Woontack Woo

Segmentation-Free Direct Iris Localization Networks Takahiro Toizumi, Koichi Takahashi, Masato Tsukada

Select, Label, and Mix: Learning Discriminative Invariant Feature Representations for Partial Domain Adaptation Aadarsh Sahoo, Rameswar Panda, Rogerio Feris, Kate Saenko, Abir Das

Self Supervised Low Dose Computed Tomography Image Denoising Using Invertible Network Exploiting Inter Slice Congruence Sutanu Bera, Prabir Kumar Biswas

Self-Attention Message Passing for Contrastive Few-Shot Learning Ojas Kishorkumar Shirekar, Anuj Singh, Hadi Jamali-Rad

Self-Attentive Pooling for Efficient Deep Learning Fang Chen, Gourav Datta, Souvik Kundu, Peter A. Beerel

Self-Distillation for Unsupervised 3D Domain Adaptation Adriano Cardace, Riccardo Spezialetti, Pierluigi Zama Ramirez, Samuele Salti, Luigi Di Stefano

Self-Distilled Self-Supervised Representation Learning Jiho Jang, Seonhoon Kim, Kiyoon Yoo, Chaerin Kong, Jangho Kim, Nojun Kwak

Self-Improving Multiplane-to-Layer Images for Novel View Synthesis Pavel Solovev, Taras Khakhulin, Denis Korzhenkov

Self-Pair: Synthesizing Changes from Single Source for Object Change Detection in Remote Sensing Imagery Minseok Seo, Hakjin Lee, Yongjin Jeon, Junghoon Seo

Self-Supervised 2D/3D Registration for X-Ray to CT Image Fusion Srikrishna Jaganathan, Maximilian Kukla, Jian Wang, Karthik Shetty, Andreas Maier

Self-Supervised Clustering Based on Manifold Learning and Graph Convolutional Networks Leonardo Tadeu Lopes, Daniel Carlos Guimarães Pedronette

Self-Supervised Correspondence Estimation via Multiview Registration Mohamed El Banani, Ignacio Rocco, David Novotny, Andrea Vedaldi, Natalia Neverova, Justin Johnson, Ben Graham

Self-Supervised Distilled Learning for Multi-Modal Misinformation Identification Michael Mu, Sreyasee Das Bhattacharjee, Junsong Yuan

Self-Supervised Learning with Local Contrastive Loss for Detection and Semantic Segmentation Ashraful Islam, Benjamin Lundell, Harpreet Sawhney, Sudipta N. Sinha, Peter Morales, Richard J. Radke

Self-Supervised Learning with Masked Image Modeling for Teeth Numbering, Detection of Dental Restorations, and Instance Segmentation in Dental Panoramic Radiographs Amani Almalki, Longin Jan Latecki

Self-Supervised Monocular Depth Estimation from Thermal Images via Adversarial Multi-Spectral Adaptation Ukcheol Shin, Kwanyong Park, Byeong-Uk Lee, Kyunghyun Lee, In So Kweon

Self-Supervised Monocular Depth Estimation: Solving the Edge-Fattening Problem Xingyu Chen, Ruonan Zhang, Ji Jiang, Yan Wang, Ge Li, Thomas H. Li

Self-Supervised Pyramid Representation Learning for Multi-Label Visual Analysis and Beyond Cheng-Yen Hsieh, Chih-Jung Chang, Fu-En Yang, Yu-Chiang Frank Wang

Self-Supervised Relative Pose with Homography Model-Fitting in the Loop Bruce R. Muller, William A. P. Smith

Semantic Guided Latent Parts Embedding for Few-Shot Learning Fengyuan Yang, Ruiping Wang, Xilin Chen

Semantic Segmentation in Aerial Imagery Using Multi-Level Contrastive Learning with Local Consistency Maofeng Tang, Konstantinos Georgiou, Hairong Qi, Cody Champion, Marc Bosch

Semantic Segmentation of Degraded Images Using Layer-Wise Feature Adjustor Kazuki Endo, Masayuki Tanaka, Masatoshi Okutomi

Semantic Segmentation with Active Semi-Supervised Learning Aneesh Rangnekar, Christopher Kanan, Matthew Hoffman

Semantics Guided Contrastive Learning of Transformers for Zero-Shot Temporal Activity Detection Sayak Nag, Orpaz Goldstein, Amit K. Roy-Chowdhury

Semantics-Depth-Symbiosis: Deeply Coupled Semi-Supervised Learning of Semantics and Depth Nitin Bansal, Pan Ji, Junsong Yuan, Yi Xu

Semi-Supervised Domain Adaptation with Auto-Encoder via Simultaneous Learning Md Mahmudur Rahman, Rameswar Panda, Mohammad Arif Ul Alam

Semi-Supervised Learning for Low-Light Image Restoration Through Quality Assisted Pseudo-Labeling Sameer Malik, Rajiv Soundararajan

Semi-Supervised Learning for Sparsely-Labeled Sequential Data: Application to Healthcare Video Processing Florian Dubost, Erin Hong, Siyi Tang, Nandita Bhaskhar, Christopher Lee-Messer, Daniel Rubin

Separating Partially-Polarized Diffuse and Specular Reflection Components Under Unpolarized Light Sources Soma Kajiyama, Taihe Piao, Ryo Kawahara, Takahiro Okabe

Seq-UPS: Sequential Uncertainty-Aware Pseudo-Label Selection for Semi-Supervised Text Recognition Gaurav Patel, Jan P. Allebach, Qiang Qiu

SERF: Towards Better Training of Deep Neural Networks Using Log-Softplus ERror Activation Function Sayan Nag, Mayukh Bhattacharyya, Anuraag Mukherjee, Rohit Kundu

SGPCR: Spherical Gaussian Point Cloud Representation and Its Application to Object Registration and Retrieval Driton Salihu, Eckehard Steinbach

SHARDS: Efficient Shadow Removal Using Dual Stage Network for High-Resolution Images Mrinmoy Sen, Sai Pradyumna Chermala, Nazrinbanu Nurmohammad Nagori, Venkat Peddigari, Praful Mathur, B. H. Pawan Prasad, Moonhwan Jeong

Sim2real Transfer Learning for Point Cloud Segmentation: An Industrial Application Case on Autonomous Disassembly Chengzhi Wu, Xuelei Bi, Julius Pfrommer, Alexander Cebulla, Simon Mangold, Jürgen Beyerer

Sim2RealVS: A New Benchmark for Video Stabilization with a Strong Baseline Qi Rao, Xin Yu, Shant Navasardyan, Humphrey Shi

SimGlim: Simplifying Glimpse Based Active Visual Reconstruction Abhishek Jha, Soroush Seifi, Tinne Tuytelaars

Similarity Contrastive Estimation for Self-Supervised Soft Contrastive Learning Julien Denize, Jaonary Rabarisoa, Astrid Orcesi, Romain Hérault, Stéphane Canu

Simultaneous Acquisition of High Quality RGB Image and Polarization Information Using a Sparse Polarization Sensor Teppei Kurita, Yuhi Kondo, Legong Sun, Yusuke Moriuchi

Single Image Super-Resolution via a Dual Interactive Implicit Neural Network Quan H. Nguyen, William J. Beksi

Single Stage Weakly Supervised Semantic Segmentation of Complex Scenes Peri Akiva, Kristin Dana

Single-Image HDR Reconstruction by Multi-Exposure Generation Phuoc-Hieu Le, Quynh Le, Rang Nguyen, Binh-Son Hua

SIRA: Relightable Avatars from a Single Image Pol Caselles, Eduard Ramon, Jaime Garcia, Xavier Giro-i-Nieto, Francesc Moreno-Noguer, Gil Triginer

SIUNet: Sparsity Invariant U-Net for Edge-Aware Depth Completion Avinash Nittur Ramesh, Fabio Giovanneschi, María A. González-Huici

SketchInverter: Multi-Class Sketch-Based Image Generation via GAN Inversion Zirui An, Jingbo Yu, Runtao Liu, Chuang Wang, Qian Yu

Skew-Robust Human-Object Interactions in Videos Apoorva Agarwal, Rishabh Dabral, Arjun Jain, Ganesh Ramakrishnan

SLI-pSp: Injecting Multi-Scale Spatial Layout in pSp Aradhya Neeraj Mathur, Anish Madan, Ojaswa Sharma

SONGs: Self-Organizing Neural Graphs Łukasz Struski, Tomasz Danel, Marek Śmieja, Jacek Tabor, Bartosz Zieliński

Sparsity Agnostic Depth Completion Andrea Conti, Matteo Poggi, Stefano Mattoccia

Spatial Consistency Loss for Training Multi-Label Classifiers from Single-Label Annotations Thomas Verelst, Paul K. Rubenstein, Marcin Eichner, Tinne Tuytelaars, Maxim Berman

Spatially Multi-Conditional Image Generation Nikola Popović, Ritika Chakraborty, Danda Pani Paudel, Thomas Probst, Luc Van Gool

Spatio-Temporal Action Detection Under Large Motion Gurkirt Singh, Vasileios Choutas, Suman Saha, Fisher Yu, Luc Van Gool

Spike-Based Anytime Perception Matthew Dutson, Yin Li, Mohit Gupta

SPIQ: Data-Free Per-Channel Static Input Quantization Edouard Yvinec, Arnaud Dapogny, Matthieu Cord, Kevin Bailly

Splatting-Based Synthesis for Video Frame Interpolation Simon Niklaus, Ping Hu, Jiawen Chen

Split to Learn: Gradient Split for Multi-Task Human Image Analysis Weijian Deng, Yumin Suh, Xiang Yu, Masoud Faraki, Liang Zheng, Manmohan Chandraker

SSFE-Net: Self-Supervised Feature Enhancement for Ultra-Fine-Grained Few-Shot Class Incremental Learning Zicheng Pan, Xiaohan Yu, Miaohua Zhang, Yongsheng Gao

SSSD: Self-Supervised Self Distillation Wei-Chi Chen, Wei-Ta Chu

STAR-Transformer: A Spatio-Temporal Cross Attention Transformer for Human Action Recognition Dasom Ahn, Sangwon Kim, Hyunsu Hong, Byoung Chul Ko

Stop or Forward: Dynamic Layer Skipping for Efficient Action Recognition Jonghyeon Seon, Jaedong Hwang, Jonghwan Mun, Bohyung Han

Structure-Encoding Auxiliary Tasks for Improved Visual Representation in Vision-and-Language Navigation Chia-Wen Kuo, Chih-Yao Ma, Judy Hoffman, Zsolt Kira

Style-Guided Inference of Transformer for High-Resolution Image Synthesis Jonghwa Yim, Minjae Kim

Surface Normal Estimation from Optimized and Distributed Light Sources Using DNN-Based Photometric Stereo Takafumi Iwaguchi, Hiroshi Kawasaki

SVD-NAS: Coupling Low-Rank Approximation and Neural Architecture Search Zhewen Yu, Christos-Savvas Bouganis

Switching to Discriminative Image Captioning by Relieving a Bottleneck of Reinforcement Learning Ukyo Honda, Taro Watanabe, Yuji Matsumoto

Synthetic Latent Fingerprint Generator André Brasil Vieira Wyzykowski, Anil K. Jain

Task Agnostic and Post-Hoc Unseen Distribution Detection Radhika Dua, Seongjun Yang, Yixuan Li, Edward Choi

TCAM: Temporal Class Activation Maps for Object Localization in Weakly-Labeled Unconstrained Videos Soufiane Belharbi, Ismail Ben Ayed, Luke McCaffrey, Eric Granger

Temporal Feature Enhancement Dilated Convolution Network for Weakly-Supervised Temporal Action Localization Jianxiong Zhou, Ying Wu

Temporally Consistent Online Depth Estimation in Dynamic Scenes Zhaoshuo Li, Wei Ye, Dilin Wang, Francis X. Creighton, Russell H. Taylor, Ganesh Venkatesh, Mathias Unberath

TeST: Test-Time Self-Training Under Distribution Shift Samarth Sinha, Peter Gehler, Francesco Locatello, Bernt Schiele

Text and Image Guided 3D Avatar Generation and Manipulation Zehranaz Canfes, M. Furkan Atasoy, Alara Dirik, Pinar Yanardag

Text-Guided Object Detector for Multi-Modal Video Question Answering Ruoyue Shen, Nakamasa Inoue, Koichi Shinoda

The Box Size Confidence Bias Harms Your Object Detector Johannes Gilg, Torben Teepe, Fabian Herzog, Gerhard Rigoll

The Change You Want to See Ragav Sachdeva, Andrew Zisserman

The CropAndWeed Dataset: A Multi-Modal Learning Approach for Efficient Crop and Weed Manipulation Daniel Steininger, Andreas Trondl, Gerardus Croonen, Julia Simon, Verena Widhalm

The Fully Convolutional Transformer for Medical Image Segmentation Athanasios Tragakis, Chaitanya Kaul, Roderick Murray-Smith, Dirk Husmeier

THOR-Net: End-to-End Graformer-Based Realistic Two Hands and Object Reconstruction with Self-Supervision Ahmed Tawfik Aboukhadra, Jameel Malik, Ahmed Elhayek, Nadia Robertini, Didier Stricker

TI2Net: Temporal Identity Inconsistency Network for Deepfake Detection Baoping Liu, Bo Liu, Ming Ding, Tianqing Zhu, Xin Yu

TinyHD: Efficient Video Saliency Prediction with Heterogeneous Decoders Using Hierarchical Maps Distillation Feiyan Hu, Simone Palazzo, Federica Proietto Salanitri, Giovanni Bellitto, Morteza Moradi, Concetto Spampinato, Kevin McGuinness

Token Pooling in Vision Transformers for Image Classification Dmitrii Marin, Jen-Hao Rick Chang, Anurag Ranjan, Anish Prabhu, Mohammad Rastegari, Oncel Tuzel

Toward Edge-Efficient Dense Predictions with Synergistic Multi-Task Neural Architecture Search Thanh Vu, Yanqi Zhou, Chunfeng Wen, Yueqi Li, Jan-Michael Frahm

Towards a Framework for Privacy-Preserving Pedestrian Analysis Anil Kunchala, Mélanie Bouroche, Bianca Schoen-Phelan

Towards Discriminative and Transferable One-Stage Few-Shot Object Detectors Karim Guirguis, Mohamed Abdelsamad, George Eskandar, Ahmed Hendawy, Matthias Kayser, Bin Yang, Jürgen Beyerer

Towards Disturbance-Free Visual Mobile Manipulation Tianwei Ni, Kiana Ehsani, Luca Weihs, Jordi Salvador

Towards Equivariant Optical Flow Estimation with Deep Learning Stefano Savian, Pietro Morerio, Alessio Del Bue, Andrea A. Janes, Tammam Tillo

Towards Few-Annotation Learning for Object Detection: Are Transformer-Based Models More Efficient? Quentin Bouniot, Angélique Loesch, Romaric Audigier, Amaury Habrard

Towards Generating Ultra-High Resolution Talking-Face Videos with Lip Synchronization Anchit Gupta, Rudrabha Mukhopadhyay, Sindhu Balachandra, Faizan Farooq Khan, Vinay P. Namboodiri, C. V. Jawahar

Towards Interpretable Video Anomaly Detection Keval Doshi, Yasin Yilmaz

Towards MOOCs for Lipreading: Using Synthetic Talking Heads to Train Humans in Lipreading at Scale Aditya Agarwal, Bipasha Sen, Rudrabha Mukhopadhyay, Vinay P. Namboodiri, C. V. Jawahar

Towards Online Domain Adaptive Object Detection Vibashan Vs, Poojan Oza, Vishal M. Patel

Tracking Growth and Decay of Plant Roots in Minirhizotron Images Alexander Gillert, Bo Peters, Uwe Freiherr von Lukas, Jürgen Kreyling, Gesche Blume-Werry

Training Auxiliary Prototypical Classifiers for Explainable Anomaly Detection in Medical Image Segmentation Wonwoo Cho, Jeonghoon Park, Jaegul Choo

Trans4Map: Revisiting Holistic Bird's-Eye-View Mapping from Egocentric Images to Allocentric Semantics with Vision Transformers Chang Chen, Jiaming Zhang, Kailun Yang, Kunyu Peng, Rainer Stiefelhagen

Transformers for Recognition in Overhead Imagery: A Reality Check Francesco Luzi, Aneesh Gupta, Leslie Collins, Kyle Bradbury, Jordan Malof

TransMOT: Spatial-Temporal Graph Transformer for Multiple Object Tracking Peng Chu, Jiang Wang, Quanzeng You, Haibin Ling, Zicheng Liu

TransPillars: Coarse-to-Fine Aggregation for Multi-Frame 3D Object Detection Zhipeng Luo, Gongjie Zhang, Changqing Zhou, Tianrui Liu, Shijian Lu, Liang Pan

TransVLAD: Multi-Scale Attention-Based Global Descriptors for Visual Geo-Localization Yifan Xu, Pourya Shamsolmoali, Eric Granger, Claire Nicodeme, Laurent Gardes, Jie Yang

Treating Motion as Option to Reduce Motion Dependency in Unsupervised Video Object Segmentation Suhwan Cho, Minhyeok Lee, Seunghoon Lee, Chaewon Park, Donghyeong Kim, Sangyoun Lee

Treatment Learning Causal Transformer for Noisy Image Classification Chao-Han Huck Yang, I-Te Hung, Yi-Chieh Liu, Pin-Yu Chen

TTTFlow: Unsupervised Test-Time Training with Normalizing Flow David Osowiechi, Gustavo A. Vargas Hakim, Mehrdad Noori, Milad Cheraghalikhani, Ismail Ben Ayed, Christian Desrosiers

TVCalib: Camera Calibration for Sports Field Registration in Soccer Jonas Theiner, Ralph Ewerth

TVT: Transferable Vision Transformer for Unsupervised Domain Adaptation Jinyu Yang, Jingjing Liu, Ning Xu, Junzhou Huang

Two-Level Data Augmentation for Calibrated Multi-View Detection Martin Engilberge, Haixin Shi, Zhiye Wang, Pascal Fua

Uncertainty-Aware Interactive LiDAR Sampling for Deep Depth Completion Kensuke Taguchi, Shogo Morita, Yusuke Hayashi, Wataru Imaeda, Hironobu Fujiyoshi

Uncertainty-Aware Label Distribution Learning for Facial Expression Recognition Nhat Le, Khanh Nguyen, Quang Tran, Erman Tjiputra, Bac Le, Anh Nguyen

Understanding the Role of Mixup in Knowledge Distillation: An Empirical Study Hongjun Choi, Eun Som Jeon, Ankita Shukla, Pavan Turaga

Unifying Distribution Alignment as a Loss for Imbalanced Semi-Supervised Learning Justin Lazarow, Kihyuk Sohn, Chen-Yu Lee, Chun-Liang Li, Zizhao Zhang, Tomas Pfister

Unifying Margin-Based SoftMax Losses in Face Recognition Yang Zhang, Simao Herdade, Kapil Thadani, Eric Dodds, Jack Culpepper, Yueh-Ning Ku

Universal Deep Image Compression via Content-Adaptive Optimization with Adapters Koki Tsubota, Hiroaki Akutsu, Kiyoharu Aizawa

Unsupervised 4D LiDAR Moving Object Segmentation in Stationary Settings with Multivariate Occupancy Time Series Thomas Kreutz, Max Mühlhäuser, Alejandro Sanchez Guinea

Unsupervised Audio-Visual Lecture Segmentation Darshan Singh S., Anchit Gupta, C. V. Jawahar, Makarand Tapaswi

Unsupervised Multi-Object Segmentation Using Attention and Soft-Argmax Bruno Sauvalle, Arnaud de La Fortelle

Unsupervised Video Object Segmentation via Prototype Memory Network Minhyeok Lee, Suhwan Cho, Seunghoon Lee, Chaewon Park, Sangyoun Lee

UPAR: Unified Pedestrian Attribute Recognition and Person Retrieval Andreas Specker, Mickael Cormier, Jürgen Beyerer

Uplift and Upsample: Efficient 3D Human Pose Estimation with Uplifting Transformers Moritz Einfalt, Katja Ludwig, Rainer Lienhart

Urban Scene Semantic Segmentation with Low-Cost Coarse Annotation Anurag Das, Yongqin Xian, Yang He, Zeynep Akata, Bernt Schiele

UVCGAN: UNet Vision Transformer Cycle-Consistent GAN for Unpaired Image-to-Image Translation Dmitrii Torbunov, Yi Huang, Haiwang Yu, Jin Huang, Shinjae Yoo, Meifeng Lin, Brett Viren, Yihui Ren

Video Joint Denoising and Demosaicing with Recurrent CNNs Valéry Dewil, Adrien Courtois, Mariano Rodríguez, Thibaud Ehret, Nicola Brandonisio, Denis Bujoreanu, Gabriele Facciolo, Pablo Arias

Video Object Matting via Hierarchical Space-Time Semantic Guidance Yumeng Wang, Bo Xu, Ziwen Li, Han Huang, Cheng Lu, Yandong Guo

ViewCLR: Learning Self-Supervised Video Representation for Unseen Viewpoints Srijan Das, Michael S. Ryoo

VirtualHome Action Genome: A Simulated Spatio-Temporal Scene Graph Dataset with Consistent Relationship Labels Yue Qiu, Yoshiki Nagasaki, Kensho Hara, Hirokatsu Kataoka, Ryota Suzuki, Kenji Iwata, Yutaka Satoh

Vis2Rec: A Large-Scale Visual Dataset for Visit Recommendation Michaël Soumm, Adrian Popescu, Bertrand Delezoide

Vision Transformer for NeRF-Based View Synthesis from a Single Input Image Kai-En Lin, Yen-Chen Lin, Wei-Sheng Lai, Tsung-Yi Lin, Yi-Chang Shih, Ravi Ramamoorthi

Visualizing Global Explanations of Point Cloud DNNs Hanxiao Tan

Visually Explaining 3D-CNN Predictions for Video Classification with an Adaptive Occlusion Sensitivity Analysis Tomoki Uchiyama, Naoya Sogi, Koichiro Niinuma, Kazuhiro Fukui

VLC-BERT: Visual Question Answering with Contextualized Commonsense Knowledge Sahithya Ravi, Aditya Chinchure, Leonid Sigal, Renjie Liao, Vered Shwartz

VSGD-Net: Virtual Staining Guided Melanocyte Detection on Histopathological Images Kechun Liu, Beibin Li, Wenjun Wu, Caitlin May, Oliver Chang, Stevan Knezevich, Lisa Reisch, Joann Elmore, Linda Shapiro

Watch Those Words: Video Falsification Detection Using Word-Conditioned Facial Motion Shruti Agarwal, Liwen Hu, Evonne Ng, Trevor Darrell, Hao Li, Anna Rohrbach

Watching the News: Towards VideoQA Models That Can Read Soumya Jahagirdar, Minesh Mathew, Dimosthenis Karatzas, C. V. Jawahar

Wavelength-Aware 2D Convolutions for Hyperspectral Imaging Leon Amadeus Varga, Martin Messmer, Nuri Benbarka, Andreas Zell

Weakly Supervised Cell-Instance Segmentation with Two Types of Weak Labels by Single Instance Pasting Kazuya Nishimura, Ryoma Bise

Weakly Supervised Face Naming with Symmetry-Enhanced Contrastive Loss Tingyu Qu, Tinne Tuytelaars, Marie-Francine Moens

Weakly-Supervised Optical Flow Estimation for Time-of-Flight Michael Schelling, Pedro Hermosilla, Timo Ropinski

Weakly-Supervised Point Cloud Instance Segmentation with Geometric Priors Heming Du, Xin Yu, Farookh Hussain, Mohammad Ali Armin, Lars Petersson, Weihao Li

What Can We Learn by Predicting Accuracy? Olivier Risser-Maroix, Benjamin Chamand

WHFL: Wavelet-Domain High Frequency Loss for Sketch-to-Image Translation Min Woo Kim, Nam Ik Cho

Wiener Guided DIP for Unsupervised Blind Image Deconvolution Gustav Bredell, Ertunc Erdil, Bruno Weber, Ender Konukoglu

WSNet: Towards an Effective Method for Wound Image Segmentation Subba Reddy Oota, Vijay Rowtula, Shahid Mohammed, Minghsun Liu, Manish Gupta

X-Align: Cross-Modal Cross-View Alignment for Bird's-Eye-View Segmentation Shubhankar Borse, Marvin Klingner, Varun Ravi Kumar, Hong Cai, Abdulaziz Almuzairee, Senthil Yogamani, Fatih Porikli

X-NeRF: Explicit Neural Radiance Field for Multi-Scene 360deg Insufficient RGB-D Views Haoyi Zhu

Zero-Shot Versus Many-Shot: Unsupervised Texture Anomaly Detection Toshimichi Aota, Lloyd Teh Tzer Tong, Takayuki Okatani