ECCV 2022

1645 papers

“This Is My Unicorn, Fluffy”: Personalizing Frozen Vision-Language Representations Niv Cohen, Rinon Gal, Eli A. Meirom, Gal Chechik, Yuval Atzmon

PDF

2D Amodal Instance Segmentation Guided by 3D Shape Prior Zhixuan Li, Weining Ye, Tingting Jiang, Tiejun Huang

PDF

2D GANs Meet Unsupervised Single-View 3D Reconstruction Feng Liu, Xiaoming Liu

PDF

2DPASS: 2D Priors Assisted Semantic Segmentation on LiDAR Point Clouds Xu Yan, Jiantao Gao, Chaoda Zheng, Chao Zheng, Ruimao Zhang, Shuguang Cui, Zhen Li

PDF

3D Clothed Human Reconstruction in the Wild Gyeongsik Moon, Hyeongjin Nam, Takaaki Shiratori, Kyoung Mu Lee

PDF

3D CoMPaT: Composition of Materials on Parts of 3D Things Yuchen Li, Ujjwal Upadhyay, Habib Slim, Tezuesh Varshney, Ahmed Abdelreheem, Arpit Prajapati, Suhail Pothigara, Peter Wonka, Mohamed Elhoseiny

PDF

3D Compositional Zero-Shot Learning with DeCompositional Consensus Muhammad Ferjad Naeem, Evin Pınar Örnek, Yongqin Xian, Luc Van Gool, Federico Tombari

PDF

3D Equivariant Graph Implicit Functions Yunlu Chen, Basura Fernando, Hakan Bilen, Matthias Nießner, Efstratios Gavves

PDF

3D Face Reconstruction with Dense Landmarks Erroll Wood, Tadas Baltrušaitis, Charlie Hewitt, Matthew Johnson, Jingjing Shen, Nikola Milosavljević, Daniel Wilde, Stephan Garbin, Toby Sharp, Ivan Stojiljković, Tom Cashman, Julien Valentin

PDF

3D Human Pose Estimation Using Möbius Graph Convolutional Networks Niloofar Azizi, Horst Possegger, Emanuele Rodolà, Horst Bischof

PDF

3D Instances as 1d Kernels Yizheng Wu, Min Shi, Shuaiyuan Du, Hao Lu, Zhiguo Cao, Weicai Zhong

PDF

3D Interacting Hand Pose Estimation by Hand De-Occlusion and Removal Hao Meng, Sheng Jin, Wentao Liu, Chen Qian, Mengxiang Lin, Wanli Ouyang, Ping Luo

PDF

3D Object Detection with a Self-Supervised LiDAR Scene Flow Backbone Emeç Erçelik, Ekim Yurtsever, Mingyu Liu, Zhijie Yang, Hanzhen Zhang, Pınar Topçam, Maximilian Listl, Yılmaz Kaan Çaylı, Alois Knoll

PDF

3D Random Occlusion and Multi-Layer Projection for Deep Multi-Camera Pedestrian Localization Rui Qiu, Ming Xu, Yuyao Yan, Jeremy S. Smith, Xi Yang

PDF

3D Room Layout Estimation from a Cubemap of Panorama Image via Deep Manhattan Hough Transform Yining Zhao, Chao Wen, Zhou Xue, Yue Gao

PDF

3D Scene Inference from Transient Histograms Sacha Jungerman, Atul Ingle, Yin Li, Mohit Gupta

PDF

3D Shape Sequence of Human Comparison and Classification Using Current and Varifolds Emery Pierson, Mohamed Daoudi, Sylvain Arguillere

PDF

3D Siamese Transformer Network for Single Object Tracking on Point Clouds Le Hui, Lingpeng Wang, Linghua Tang, Kaihao Lan, Jin Xie, Jian Yang

PDF

3D-Aware Indoor Scene Synthesis with Depth Priors Zifan Shi, Yujun Shen, Jiapeng Zhu, Dit-Yan Yeung, Qifeng Chen

PDF

3D-Aware Semantic-Guided Generative Model for Human Synthesis Jichao Zhang, Enver Sangineto, Hao Tang, Aliaksandr Siarohin, Zhun Zhong, Nicu Sebe, Wei Wang

PDF

3D-FM GAN: Towards 3D-Controllable Face Manipulation Yuchen Liu, Zhixin Shu, Yijun Li, Zhe Lin, Richard Zhang, S.Y. Kung

PDF

3D-PL: Domain Adaptive Depth Estimation with 3D-Aware Pseudo-Labeling Yu-Ting Yen, Chia-Ni Lu, Wei-Chen Chiu, Yi-Hsuan Tsai

PDF

3DG-STFM: 3D Geometric Guided Student-Teacher Feature Matching Runyu Mao, Chen Bai, Yatong An, Fengqing Zhu, Cheng Lu

PDF

4DContrast: Contrastive Learning with Dynamic Correspondences for 3D Scene Understanding Yujin Chen, Matthias Nießner, Angela Dai

PDF

A Broad Study of Pre-Training for Domain Generalization and Adaptation Donghyun Kim, Kaihong Wang, Stan Sclaroff, Kate Saenko

PDF

A Closer Look at Invariances in Self-Supervised Pre-Training for 3D Vision Lanxiao Li, Michael Heizmann

PDF

A Cloud 3D Dataset and Application-Specific Learned Image Compression in Cloud 3D Tianyi Liu, Sen He, Vinodh Kumaran Jayakumar, Wei Wang

PDF

A Codec Information Assisted Framework for Efficient Compressed Video Super-Resolution Hengsheng Zhang, Xueyi Zou, Jiaming Guo, Youliang Yan, Rong Xie, Li Song

PDF

A Comparative Study of Graph Matching Algorithms in Computer Vision Stefan Haller, Lorenz Feineis, Lisa Hutschenreiter, Florian Bernard, Carsten Rother, Dagmar Kainmüller, Paul Swoboda, Bogdan Savchynskyy

PDF

A Contrastive Objective for Learning Disentangled Representations Jonathan Kahana, Yedid Hoshen

PDF

A Data-Centric Approach for Improving Ambiguous Labels with Combined Semi-Supervised Classification and Clustering Lars Schmarje, Monty Santarossa, Simon-Martin Schröder, Claudius Zelenka, Rainer Kiko, Jenny Stracke, Nina Volkmann, Reinhard Koch

PDF

A Dataset for Interactive Vision-Language Navigation with Unknown Command Feasibility Andrea Burns, Deniz Arsan, Sanjna Agrawal, Ranjitha Kumar, Kate Saenko, Bryan A. Plummer

PDF

A Dataset Generation Framework for Evaluating Megapixel Image Classifiers & Their Explanations Gautam Machiraju, Sylvia Plevritis, Parag Mallick

PDF

A Deep Moving-Camera Background Model Guy Erez, Ron Shapira Weber, Oren Freifeld

PDF

A Dense Material Segmentation Dataset for Indoor and Outdoor Scene Parsing Paul Upchurch, Ransen Niu

PDF

A Fast Knowledge Distillation Framework for Visual Recognition Zhiqiang Shen, Eric Xing

PDF

A Generalized & Robust Framework for Timestamp Supervision in Temporal Action Segmentation Rahul Rahaman, Dipika Singhania, Alexandre Thiery, Angela Yao

PDF

A Gyrovector Space Approach for Symmetric Positive Semi-Definite Matrix Learning Xuan Son Nguyen

PDF

A Kendall Shape Space Approach to 3D Shape Estimation from 2D Landmarks Martha Paskin, Daniel Baum, Mason N. Dean, Christoph von Tycowicz

PDF

A Large-Scale Multiple-Objective Method for Black-Box Attack Against Object Detection Siyuan Liang, Longkang Li, Yanbo Fan, Xiaojun Jia, Jingzhi Li, Baoyuan Wu, Xiaochun Cao

PDF

A Level Set Theory for Neural Implicit Evolution Under Explicit Flows Ishit Mehta, Manmohan Chandraker, Ravi Ramamoorthi

PDF

A Max-Flow Based Approach for Neural Architecture Search Chao Xue, Xiaoxing Wang, Junchi Yan, Chun-Guang Li

PDF

A Non-Isotropic Probabilistic Take on Proxy-Based Deep Metric Learning Michael Kirchhof, Karsten Roth, Zeynep Akata, Enkelejda Kasneci

PDF

A Perceptual Quality Metric for Video Frame Interpolation Qiqi Hou, Abhijay Ghildyal, Feng Liu

PDF

A Perturbation-Constrained Adversarial Attack for Evaluating the Robustness of Optical Flow Jenny Schmalfuss, Philipp Scholze, Andrés Bruhn

PDF

A Real World Dataset for Multi-View 3D Reconstruction Rakesh Shrestha, Siqi Hu, Minghao Gou, Ziyuan Liu, Ping Tan

PDF

A Reliable Online Method for Joint Estimation of Focal Length and Camera Rotation Yiming Qian, James H. Elder

PDF

A Repulsive Force Unit for Garment Collision Handling in Neural Networks Qingyang Tan, Yi Zhou, Tuanfeng Wang, Duygu Ceylan, Xin Sun, Dinesh Manocha

PDF

A Simple and Robust Correlation Filtering Method for Text-Based Person Search Wei Suo, Mengyang Sun, Kai Niu, Yiqi Gao, Peng Wang, Yanning Zhang, Qi Wu

PDF

A Simple Approach and Benchmark for 21,000-Category Object Detection Yutong Lin, Chen Li, Yue Cao, Zheng Zhang, Jianfeng Wang, Lijuan Wang, Zicheng Liu, Han Hu

PDF

A Simple Baseline for Open-Vocabulary Semantic Segmentation with Pre-Trained Vision-Language Model Mengde Xu, Zheng Zhang, Fangyun Wei, Yutong Lin, Yue Cao, Han Hu, Xiang Bai

PDF

A Simple Single-Scale Vision Transformer for Object Detection and Instance Segmentation Wuyang Chen, Xianzhi Du, Fan Yang, Lucas Beyer, Xiaohua Zhai, Tsung-Yi Lin, Huizhong Chen, Jing Li, Xiaodan Song, Zhangyang Wang, Denny Zhou

PDF

A Sketch Is Worth a Thousand Words: Image Retrieval with Text and Sketch Patsorn Sangkloy, Wittawat Jitkrittum, Diyi Yang, James Hays

PDF

A Sliding Window Scheme for Online Temporal Action Localization Young Hwi Kim, Hyolim Kang, Seon Joo Kim

PDF

A Spectral View of Randomized Smoothing Under Common Corruptions: Benchmarking and Improving Certified Robustness Jiachen Sun, Akshay Mehra, Bhavya Kailkhura, Pin-Yu Chen, Dan Hendrycks, Jihun Hamm, Z. Morley Mao

PDF

A Style-Based GAN Encoder for High Fidelity Reconstruction of Images and Videos Xu Yao, Alasdair Newson, Yann Gousseau, Pierre Hellier

PDF

A Transformer-Based Decoder for Semantic Segmentation with Multi-Level Context Mining Bowen Shi, Dongsheng Jiang, Xiaopeng Zhang, Han Li, Wenrui Dai, Junni Zou, Hongkai Xiong, Qi Tian

PDF

A Unified Framework for Domain Adaptive Pose Estimation Donghyun Kim, Kaihong Wang, Kate Saenko, Margrit Betke, Stan Sclaroff

PDF

A Visual Navigation Perspective for Category-Level Object Pose Estimation Jiaxin Guo, Fangxun Zhong, Rong Xiong, Yun-Hui Liu, Yue Wang, Yiyi Liao

PDF

A-OKVQA: A Benchmark for Visual Question Answering Using World Knowledge Dustin Schwenk, Apoorv Khandelwal, Christopher Clark, Kenneth Marino, Roozbeh Mottaghi

PDF

Abstracting Sketches Through Simple Primitives Stephan Alaniz, Massimiliano Mancini, Anjan Dutta, Diego Marcos, Zeynep Akata

PDF

Accelerating Score-Based Generative Models with Preconditioned Diffusion Sampling Hengyuan Ma, Li Zhang, Xiatian Zhu, Jianfeng Feng

PDF

Accurate Detection of Proteins in Cryo-Electron Tomograms from Sparse Labels Qinwen Huang, Ye Zhou, Hsuan-Fu Liu, Alberto Bartesaghi

PDF

Acknowledging the Unknown for Multi-Label Learning with Single Positive Labels Donghao Zhou, Pengfei Chen, Qiong Wang, Guangyong Chen, Pheng-Ann Heng

PDF

AcroFOD: An Adaptive Method for Cross-Domain Few-Shot Object Detection Yipeng Gao, Lingxiao Yang, Yunmu Huang, Song Xie, Shiyong Li, Wei-Shi Zheng

PDF

Action Quality Assessment with Temporal Parsing Transformer Yang Bai, Desen Zhou, Songyang Zhang, Jian Wang, Errui Ding, Yu Guan, Yang Long, Jingdong Wang

PDF

Action-Based Contrastive Learning for Trajectory Prediction Marah Halawa, Olaf Hellwich, Pia Bideau

PDF

ActionFormer: Localizing Moments of Actions with Transformers Chen-Lin Zhang, Jianxin Wu, Yin Li

PDF

Active Audio-Visual Separation of Dynamic Sound Sources Sagnik Majumder, Kristen Grauman

PDF

Active Label Correction Using Robust Parameter Update and Entropy Propagation Kwang In Kim

PDF

Active Learning Strategies for Weakly-Supervised Object Detection Huy V. Vo, Oriane Siméoni, Spyros Gidaris, Andrei Bursuc, Patrick Pérez, Jean Ponce

PDF

Active Pointly-Supervised Instance Segmentation Chufeng Tang, Lingxi Xie, Gang Zhang, Xiaopeng Zhang, Qi Tian, Xiaolin Hu

PDF

ActiveNeRF: Learning Where to See with Uncertainty Estimation Xuran Pan, Zihang Lai, Shiji Song, Gao Huang

PDF

Actor-Centered Representations for Action Localization in Streaming Videos Sathyanarayanan Aakur, Sudeep Sarkar

PDF

AdaAfford: Learning to Adapt Manipulation Affordance for 3D Articulated Objects via Few-Shot Interactions Yian Wang, Ruihai Wu, Kaichun Mo, Jiaqi Ke, Qingnan Fan, Leonidas J. Guibas, Hao Dong

PDF

AdaBest: Minimizing Client Drift in Federated Learning via Adaptive Bias Estimation Farshid Varno, Marzie Saghayi, Laya Rafiee Sevyeri, Sharut Gupta, Stan Matwin, Mohammad Havaei

PDF

AdaBin: Improving Binary Neural Networks with Adaptive Binary Sets Zhijun Tu, Xinghao Chen, Pengju Ren, Yunhe Wang

PDF

AdaFocusV3: On Unified Spatial-Temporal Dynamic Video Recognition Yulin Wang, Yang Yue, Xinhong Xu, Ali Hassani, Victor Kulikov, Nikita Orlov, Shiji Song, Humphrey Shi, Gao Huang

PDF

AdaNeRF: Adaptive Sampling for Real-Time Rendering of Neural Radiance Fields Andreas Kurz, Thomas Neff, Zhaoyang Lv, Michael Zollhöfer, Markus Steinberger

PDF

Adaptive Agent Transformer for Few-Shot Segmentation Yuan Wang, Rui Sun, Zhe Zhang, Tianzhu Zhang

PDF

Adaptive Co-Teaching for Unsupervised Monocular Depth Estimation Weisong Ren, Lijun Wang, Yongri Piao, Miao Zhang, Huchuan Lu, Ting Liu

PDF

Adaptive Cross-Domain Learning for Generalizable Person Re-Identification Pengyi Zhang, Huanzhang Dou, Yunlong Yu, Xi Li

PDF

Adaptive Face Forgery Detection in Cross Domain Luchuan Song, Zheng Fang, Xiaodan Li, Xiaoyi Dong, Zhenchao Jin, Yuefeng Chen, Siwei Lyu

PDF

Adaptive Feature Interpolation for Low-Shot Image Generation Mengyu Dai, Haibin Hang, Xiaoyang Guo

PDF

Adaptive Fine-Grained Sketch-Based Image Retrieval Ayan Kumar Bhunia, Aneeshan Sain, Parth Hiren Shah, Animesh Gupta, Pinaki Nath Chowdhury, Tao Xiang, Yi-Zhe Song

PDF

Adaptive Image Transformations for Transfer-Based Adversarial Attack Zheng Yuan, Jie Zhang, Shiguang Shan

PDF

Adaptive Patch Exiting for Scalable Single Image Super-Resolution Shizun Wang, Jiaming Liu, Kaixin Chen, Xiaoqi Li, Ming Lu, Yandong Guo

PDF

Adaptive Spatial-BCE Loss for Weakly Supervised Semantic Segmentation Tong Wu, Guangyu Gao, Junshi Huang, Xiaolin Wei, Xiaoming Wei, Chi Harold Liu

PDF

Adaptive Token Sampling for Efficient Vision Transformers Mohsen Fayyaz, Soroush Abbasi Koohpayegani, Farnoush Rezaei Jafari, Sunando Sengupta, Hamid Reza Vaezi Joze, Eric Sommerlade, Hamed Pirsiavash, Jürgen Gall

PDF

Adaptive Transformers for Robust Few-Shot Cross-Domain Face Anti-Spoofing Hsin-Ping Huang, Deqing Sun, Yaojie Liu, Wen-Sheng Chu, Taihong Xiao, Jinwei Yuan, Hartwig Adam, Ming-Hsuan Yang

PDF

Addressing Heterogeneity in Federated Learning via Distributional Transformation Haolin Yuan, Bo Hui, Yuchen Yang, Philippe Burlina, Neil Zhenqiang Gong, Yinzhi Cao

PDF

AdvDO: Realistic Adversarial Attacks for Trajectory Prediction Yulong Cao, Chaowei Xiao, Anima Anandkumar, Danfei Xu, Marco Pavone

PDF

Adversarial Contrastive Learning via Asymmetric InfoNCE Qiying Yu, Jieming Lou, Xianyuan Zhan, Qizhang Li, Wangmeng Zuo, Yang Liu, Jingjing Liu

PDF

Adversarial Erasing Framework via Triplet with Gated Pyramid Pooling Layer for Weakly Supervised Semantic Segmentation Sung-Hoon Yoon, Hyeokjun Kweon, Jegyeong Cho, Shinjeong Kim, Kuk-Jin Yoon

PDF

Adversarial Feature Augmentation for Cross-Domain Few-Shot Classification Yanxu Hu, Andy J. Ma

PDF

Adversarial Label Poisoning Attack on Graph Neural Networks via Label Propagation Ganlin Liu, Xiaowei Huang, Xinping Yi

PDF

Adversarial Partial Domain Adaptation by Cycle Inconsistency Kun-Yu Lin, Jiaming Zhou, Yukun Qiu, Wei-Shi Zheng

PDF

Adversarially-Aware Robust Object Detector Ziyi Dong, Pengxu Wei, Liang Lin

PDF

Affine Correspondences Between Multi-Camera Systems for 6DOF Relative Pose Estimation Banglei Guan, Ji Zhao

PDF

AgeTransGAN for Facial Age Transformation with Rectified Performance Metrics Gee-Sern Hsu, Rui-Cang Xie, Zhi-Ting Chen, Yu-Hong Lin

PDF

AiATrack: Attention in Attention for Transformer Visual Tracking Shenyuan Gao, Chunluan Zhou, Chao Ma, Xinggang Wang, Junsong Yuan

PDF

AirDet: Few-Shot Detection Without Fine-Tuning for Autonomous Exploration Bowen Li, Chen Wang, Pranay Reddy, Seungchan Kim, Sebastian Scherer

PDF

AlignSDF: Pose-Aligned Signed Distance Fields for Hand-Object Reconstruction Zerui Chen, Yana Hasson, Cordelia Schmid, Ivan Laptev

PDF

All You Need Is RAW: Defending Against Adversarial Attacks with Camera Image Pipelines Yuxuan Zhang, Bo Dong, Felix Heide

PDF

Almost-Orthogonal Layers for Efficient General-Purpose Lipschitz Networks Bernd Prach, Christoph H. Lampert

PDF

AlphaVC: High-Performance and Efficient Learned Video Compression Yibo Shi, Yunying Ge, Jing Wang, Jue Mao

PDF

AMixer: Adaptive Weight Mixing for Self-Attention Free Vision Transformers Yongming Rao, Wenliang Zhao, Jie Zhou, Jiwen Lu

PDF

An Efficient Person Clustering Algorithm for Open Checkout-Free Groceries Junde Wu, Yu Zhang, Rao Fu, Yuanpei Liu, Jing Gao

PDF

An Efficient Spatio-Temporal Pyramid Transformer for Action Detection Yuetian Weng, Zizheng Pan, Mingfei Han, Xiaojun Chang, Bohan Zhuang

PDF

An Embedded Feature Whitening Approach to Deep Neural Network Optimization Hongwei Yong, Lei Zhang

PDF

An End-to-End Transformer Model for Crowd Localization Dingkang Liang, Wei Xu, Xiang Bai

PDF

An Impartial Take to the CNN vs Transformer Robustness Contest Francesco Pinto, Philip H. S. Torr, Puneet K. Dokania

PDF

An Information Theoretic Approach for Attention-Driven Face Forgery Detection Ke Sun, Hong Liu, Taiping Yao, Xiaoshuai Sun, Shen Chen, Shouhong Ding, Rongrong Ji

PDF

An Invisible Black-Box Backdoor Attack Through Frequency Domain Tong Wang, Yuan Yao, Feng Xu, Shengwei An, Hanghang Tong, Ting Wang

PDF

Animation from Blur: Multi-Modal Blur Decomposition with Motion Guidance Zhihang Zhong, Xiao Sun, Zhirong Wu, Yinqiang Zheng, Stephen Lin, Imari Sato

PDF

AnimeCeleb: Large-Scale Animation CelebHeads Dataset for Head Reenactment Kangyeol Kim, Sunghyun Park, Jaeseong Lee, Sunghyo Chung, Junsoo Lee, Jaegul Choo

PDF

Anti-Neuron Watermarking: Protecting Personal Data Against Unauthorized Neural Networks Zihang Zou, Boqing Gong, Liqiang Wang

PDF

Anti-Retroactive Interference for Lifelong Learning Runqi Wang, Yuxiang Bao, Baochang Zhang, Jianzhuang Liu, Wentao Zhu, Guodong Guo

PDF

Any-Resolution Training for High-Resolution Image Synthesis Lucy Chai, Michaël Gharbi, Eli Shechtman, Phillip Isola, Richard Zhang

PDF

Approximate Differentiable Rendering with Algebraic Surfaces Leonid Keselman, Martial Hebert

PDF

Approximate Discrete Optimal Transport Plan with Auxiliary Measure Method Dongsheng An, Na Lei, Xianfeng Gu

PDF

ARAH: Animatable Volume Rendering of Articulated Human SDFs Shaofei Wang, Katja Schwarz, Andreas Geiger, Siyu Tang

PDF

Are Vision Transformers Robust to Patch Perturbations? Jindong Gu, Volker Tresp, Yao Qin

PDF

ARF: Artistic Radiance Fields Kai Zhang, Nick Kolkin, Sai Bi, Fujun Luan, Zexiang Xu, Eli Shechtman, Noah Snavely

PDF

ARM: Any-Time Super-Resolution Method Bohong Chen, Mingbao Lin, Kekai Sheng, Mengdan Zhang, Peixian Chen, Ke Li, Liujuan Cao, Rongrong Ji

PDF

ART-SS: An Adaptive Rejection Technique for Semi-Supervised Restoration for Adverse Weather-Affected Images Rajeev Yasarla, Carey E. Priebe, Vishal M. Patel

PDF

ASpanFormer: Detector-Free Image Matching with Adaptive Span Transformer Hongkai Chen, Zixin Luo, Lei Zhou, Yurun Tian, Mingmin Zhen, Tian Fang, David McKinnon, Yanghai Tsin, Long Quan

PDF

ASSISTER: Assistive Navigation via Conditional Instruction Generation Zanming Huang, Zhongkai Shangguan, Jimuyang Zhang, Gilad Bar, Matthew Boyd, Eshed Ohn-Bar

PDF

AssistQ: Affordance-Centric Question-Driven Task Completion for Egocentric Assistant Benita Wong, Joya Chen, You Wu, Stan Weixian Lei, Dongxing Mao, Difei Gao, Mike Zheng Shou

PDF

Asymmetric Relation Consistency Reasoning for Video Relation Grounding Huan Li, Ping Wei, Jiapeng Li, Zeyu Ma, Jiahui Shang, Nanning Zheng

PDF

Attaining Class-Level Forgetting in Pretrained Model Using Few Samples Pravendra Singh, Pratik Mazumder, Mohammed Asad Karim

PDF

Attention Diversification for Domain Generalization Rang Meng, Xianfeng Li, Weijie Chen, Shicai Yang, Jie Song, Xinchao Wang, Lei Zhang, Mingli Song, Di Xie, Shiliang Pu

PDF

Attention-Aware Learning for Hyperparameter Prediction in Image Processing Pipelines Haina Qin, Longfei Han, Juan Wang, Congxuan Zhang, Yanwei Li, Bing Li, Weiming Hu

PDF

AU-Aware 3D Face Reconstruction Through Personalized AU-Specific Blendshape Learning Chenyi Kuang, Zijun Cui, Jeffrey O. Kephart, Qiang Ji

PDF

Audio-Driven Stylized Gesture Generation with Flow-Based Model Sheng Ye, Yu-Hui Wen, Yanan Sun, Ying He, Ziyang Zhang, Yaoyuan Wang, Weihua He, Yong-Jin Liu

PDF

Audio-Visual Mismatch-Aware Video Retrieval via Association and Adjustment Sangmin Lee, Sungjune Park, Yong Man Ro

PDF

Audio—Visual Segmentation Jinxing Zhou, Jianyuan Wang, Jiayi Zhang, Weixuan Sun, Jing Zhang, Stan Birchfield, Dan Guo, Lingpeng Kong, Meng Wang, Yiran Zhong

PDF

AudioScopeV2: Audio-Visual Attention Architectures for Calibrated Open-Domain On-Screen Sound Separation Efthymios Tzinis, Scott Wisdom, Tal Remez, John R. Hershey

PDF

Augmentation of rPPG Benchmark Datasets: Learning to Remove and Embed rPPG Signals via Double Cycle Consistent Learning from Unpaired Facial Videos Cheng-Ju Hsieh, Wei-Hao Chung, Chiou-Ting Hsu

PDF

Augmenting Deep Classifiers with Polynomial Neural Networks Grigorios G. Chrysos, Markos Georgopoulos, Jiankang Deng, Jean Kossaifi, Yannis Panagakis, Anima Anandkumar

PDF

Auto-FedRL: Federated Hyperparameter Optimization for Multi-Institutional Medical Image Segmentation Pengfei Guo, Dong Yang, Ali Hatamizadeh, An Xu, Ziyue Xu, Wenqi Li, Can Zhao, Daguang Xu, Stephanie Harmon, Evrim Turkbey, Baris Turkbey, Bradford Wood, Francesca Patella, Elvira Stellato, Gianpaolo Carrafiello, Vishal M. Patel, Holger R. Roth

PDF

Auto-Regressive Image Synthesis with Integrated Quantization Fangneng Zhan, Yingchen Yu, Rongliang Wu, Jiahui Zhang, Kaiwen Cui, Changgong Zhang, Shijian Lu

PDF

AutoAvatar: Autoregressive Neural Fields for Dynamic Avatar Modeling Ziqian Bai, Timur Bagautdinov, Javier Romero, Michael Zollhöfer, Ping Tan, Shunsuke Saito

PDF

Automatic Check-Out via Prototype-Based Classifier Learning from Single-Product Exemplars Hao Chen, Xiu-Shen Wei, Faen Zhang, Yang Shen, Hui Xu, Liang Xiao

PDF

Automatic Dense Annotation of Large-Vocabulary Sign Language Videos Liliane Momeni, Hannah Bull, K R Prajwal, Samuel Albanie, Gül Varol, Andrew Zisserman

PDF

AutoMix: Unveiling the Power of Mixup for Stronger Classifiers Zicheng Liu, Siyuan Li, Di Wu, Zihan Liu, Zhiyuan Chen, Lirong Wu, Stan Z. Li

PDF

Autoregressive 3D Shape Generation via Canonical Mapping An-Chieh Cheng, Xueting Li, Sifei Liu, Min Sun, Ming-Hsuan Yang

PDF

Autoregressive Uncertainty Modeling for 3D Bounding Box Prediction YuXuan Liu, Nikhil Mishra, Maximilian Sieb, Yide Shentu, Pieter Abbeel, Xi Chen

PDF

AutoTransition: Learning to Recommend Video Transition Effects Yaojie Shen, Libo Zhang, Kai Xu, Xiaojie Jin

PDF

AvatarCap: Animatable Avatar Conditioned Monocular Human Volumetric Capture Zhe Li, Zerong Zheng, Hongwen Zhang, Chaonan Ji, Yebin Liu

PDF

AvatarPoser: Articulated Full-Body Pose Tracking from Sparse Motion Sensing Jiaxi Jiang, Paul Streli, Huajian Qiu, Andreas Fender, Larissa Laich, Patrick Snape, Christian Holz

PDF

Aware of the History: Trajectory Forecasting with the Local Behavior Data Yiqi Zhong, Zhenyang Ni, Siheng Chen, Ulrich Neumann

PDF

BA-Net: Bridge Attention for Deep Convolutional Neural Networks Yue Zhao, Junzhou Chen, Zirui Zhang, Ronghui Zhang

PDF

Backbone Is All Your Need: A Simplified Architecture for Visual Object Tracking Boyu Chen, Peixia Li, Lei Bai, Lei Qiao, Qiuhong Shen, Bo Li, Weihao Gan, Wei Wu, Wanli Ouyang

PDF

Background-Insensitive Scene Text Recognition with Text Semantic Segmentation Liang Zhao, Zhenyao Wu, Xinyi Wu, Greg Wilsbacher, Song Wang

PDF

Bagging Regional Classification Activation Maps for Weakly Supervised Object Localization Lei Zhu, Qian Chen, Lujia Jin, Yunfei You, Yanye Lu

PDF

Balancing Between Forgetting and Acquisition in Incremental Subpopulation Learning Mingfu Liang, Jiahuan Zhou, Wei Wei, Ying Wu

PDF

Balancing Stability and Plasticity Through Advanced Null Space in Continual Learning Yajing Kong, Liu Liu, Zhen Wang, Dacheng Tao

PDF

Bandwidth-Aware Adaptive Codec for DNN Inference Offloading in IoT Xiufeng Xie, Ning Zhou, Wentao Zhu, Ji Liu

PDF

BASQ: Branch-Wise Activation-Clipping Search Quantization for Sub-4-Bit Neural Networks Han-Byul Kim, Eunhyeok Park, Sungjoo Yoo

PDF

Batch-Efficient EigenDecomposition for Small and Medium Matrices Yue Song, Nicu Sebe, Wei Wang

PDF

BATMAN: Bilateral Attention Transformer in Motion-Appearance Neighboring Space for Video Object Segmentation Ye Yu, Jialin Yuan, Gaurav Mittal, Li Fuxin, Mei Chen

PDF

BayesCap: Bayesian Identity Cap for Calibrated Uncertainty in Frozen Neural Networks Uddeshya Upadhyay, Shyamgopal Karthik, Yanbei Chen, Massimiliano Mancini, Zeynep Akata

PDF

Bayesian Optimization with Clustering and Rollback for CNN Auto Pruning Hanwei Fan, Jiandong Mu, Wei Zhang

PDF

Bayesian Tracking of Video Graphs Using Joint Kalman Smoothing and Registration Aditi Basu Bal, Ramy Mounir, Sathyanarayanan Aakur, Sudeep Sarkar, Anuj Srivastava

PDF

BEAT: A Large-Scale Semantic and Emotional Multi-Modal Dataset for Conversational Gestures Synthesis Haiyang Liu, Zihao Zhu, Naoya Iwamoto, Yichen Peng, Zhengqing Li, You Zhou, Elif Bozkurt, Bo Zheng

PDF

Benchmarking Omni-Vision Representation Through the Lens of Visual Realms Yuanhan Zhang, Zhenfei Yin, Jing Shao, Ziwei Liu

PDF

BEVFormer: Learning Bird’s-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers Zhiqi Li, Wenhai Wang, Hongyang Li, Enze Xie, Chonghao Sima, Tong Lu, Yu Qiao, Jifeng Dai

PDF

Beyond Periodicity: Towards a Unifying Framework for Activations in Coordinate-MLPs Sameera Ramasinghe, Simon Lucey

PDF

BézierPalm: A Free Lunch for Palmprint Recognition Kai Zhao, Lei Shen, Yingyi Zhang, Chuhan Zhou, Tao Wang, Ruixin Zhang, Shouhong Ding, Wei Jia, Wei Shen

PDF

Bi-Directional Contrastive Learning for Domain Adaptive Semantic Segmentation Geon Lee, Chanho Eom, Wonkyung Lee, Hyekang Park, Bumsub Ham

PDF

Bi-Level Feature Alignment for Versatile Image Translation and Manipulation Fangneng Zhan, Yingchen Yu, Rongliang Wu, Jiahui Zhang, Kaiwen Cui, Aoran Xiao, Shijian Lu, Chunyan Miao

PDF

Bi-PointFlowNet: Bidirectional Learning for Point Cloud Based Scene Flow Estimation Wencan Cheng, Jong Hwan Ko

PDF

BigColor: Colorization Using a Generative Color Prior for Natural Images Geonung Kim, Kyoungkook Kang, Seongtae Kim, Hwayoon Lee, Sehoon Kim, Jonghyun Kim, Seung-Hwan Baek, Sunghyun Cho

PDF

Bilateral Normal Integration Xu Cao, Hiroaki Santo, Boxin Shi, Fumio Okura, Yasuyuki Matsushita

PDF

BIPS: Bi-Modal Indoor Panorama Synthesis via Residual Depth-Aided Adversarial Learning Changgyoon Oh, Wonjune Cho, Yujeong Chae, Daehee Park, Lin Wang, Kuk-Jin Yoon

PDF

Bitwidth-Adaptive Quantization-Aware Neural Network Training: A Meta-Learning Approach Jiseok Youn, Jaehun Song, Hyung-Sin Kim, Saewoong Bahk

PDF

Black-Box Dissector: Towards Erasing-Based Hard-Label Model Stealing Attack Yixu Wang, Jie Li, Hong Liu, Yan Wang, Yongjian Wu, Feiyue Huang, Rongrong Ji

PDF

Black-Box Few-Shot Knowledge Distillation Dang Nguyen, Sunil Gupta, Kien Do, Svetha Venkatesh

PDF

Blind Image Decomposition Junlin Han, Weihao Li, Pengfei Fang, Chunyi Sun, Jie Hong, Mohammad Ali Armin, Lars Petersson, Hongdong Li

PDF

BlobGAN: Spatially Disentangled Scene Representations Dave Epstein, Taesung Park, Richard Zhang, Eli Shechtman, Alexei A. Efros

PDF

BLT: Bidirectional Layout Transformer for Controllable Layout Generation Xiang Kong, Lu Jiang, Huiwen Chang, Han Zhang, Yuan Hao, Haifeng Gong, Irfan Essa

PDF

BMD: A General Class-Balanced Multicentric Dynamic Prototype Strategy for Source-Free Domain Adaptation Sanqing Qu, Guang Chen, Jing Zhang, Zhijun Li, Wei He, Dacheng Tao

PDF

BodySLAM: Joint Camera Localisation, Mapping, and Human Motion Tracking Dorian F. Henning, Tristan Laidlow, Stefan Leutenegger

PDF

Boosting Event Stream Super-Resolution with a Recurrent Neural Network Wenming Weng, Yueyi Zhang, Zhiwei Xiong

PDF

Boosting Supervised Dehazing Methods via Bi-Level Patch Reweighting Xingyu Jiang, Hongkun Dou, Chengwei Fu, Bingquan Dai, Tianrun Xu, Yue Deng

PDF

Boosting Transferability of Targeted Adversarial Examples via Hierarchical Generative Networks Xiao Yang, Yinpeng Dong, Tianyu Pang, Hang Su, Jun Zhu

PDF

Bootstrapped Masked Autoencoders for Vision BERT Pretraining Xiaoyi Dong, Jianmin Bao, Ting Zhang, Dongdong Chen, Weiming Zhang, Lu Yuan, Dong Chen, Fang Wen, Nenghai Yu

PDF

Bottom up Top Down Detection Transformers for Language Grounding in Images and Point Clouds Ayush Jain, Nikolaos Gkanatsios, Ishita Mediratta, Katerina Fragkiadaki

PDF

BoundaryFace: A Mining Framework with Noise Label Self-Correction for Face Recognition Shijie Wu, Xun Gong

PDF

Box-Supervised Instance Segmentation with Level Set Evolution Wentong Li, Wenyu Liu, Jianke Zhu, Miaomiao Cui, Xian-Sheng Hua, Lei Zhang

PDF

Box2Mask: Weakly Supervised 3D Semantic Instance Segmentation Using Bounding Boxes Julian Chibane, Francis Engelmann, Tuan Anh Tran, Gerard Pons-Moll

PDF

BRACE: The Breakdancing Competition Dataset for Dance Motion Synthesis Davide Moltisanti, Jinyi Wu, Bo Dai, Chen Change Loy

PDF

Breadcrumbs: Adversarial Class-Balanced Sampling for Long-Tailed Recognition Bo Liu, Haoxiang Li, Hao Kang, Gang Hua, Nuno Vasconcelos

PDF

Break and Make: Interactive Structural Understanding Using LEGO Bricks Aaron Walsman, Muru Zhang, Klemen Kotar, Karthik Desingh, Ali Farhadi, Dieter Fox

PDF

Bridging Images and Videos: A Simple Learning Framework for Large Vocabulary Video Object Detection Sanghyun Woo, Kwanyong Park, Seoung Wug Oh, In So Kweon, Joon-Young Lee

PDF

Bridging the Domain Gap Towards Generalization in Automatic Colorization Hyejin Lee, Daehee Kim, Daeun Lee, Jinkyu Kim, Jaekoo Lee

PDF

Bridging the Visual Semantic Gap in VLN via Semantically Richer Instructions Joaquín Ossandón, Benjamín Earle, Alvaro Soto

PDF

Bringing Rolling Shutter Images Alive with Dual Reversed Distortion Zhihang Zhong, Mingdeng Cao, Xiao Sun, Zhirong Wu, Zhongyi Zhou, Yinqiang Zheng, Stephen Lin, Imari Sato

PDF

BRNet: Exploring Comprehensive Features for Monocular Depth Estimation Wencheng Han, Junbo Yin, Xiaogang Jin, Xiangdong Dai, Jianbing Shen

PDF

BungeeNeRF: Progressive Neural Radiance Field for Extreme Multi-Scale Scene Rendering Yuanbo Xiangli, Linning Xu, Xingang Pan, Nanxuan Zhao, Anyi Rao, Christian Theobalt, Bo Dai, Dahua Lin

PDF

Burn After Reading: Online Adaptation for Cross-Domain Streaming Data Luyu Yang, Mingfei Gao, Zeyuan Chen, Ran Xu, Abhinav Shrivastava, Chetan Ramaiah

PDF

ByteTrack: Multi-Object Tracking by Associating Every Detection Box Yifu Zhang, Peize Sun, Yi Jiang, Dongdong Yu, Fucheng Weng, Zehuan Yuan, Ping Luo, Wenyu Liu, Xinggang Wang

PDF

C3P: Cross-Domain Pose Prior Propagation for Weakly Supervised 3D Human Pose Estimation Cunlin Wu, Yang Xiao, Boshen Zhang, Mingyang Zhang, Zhiguo Cao, Joey Tianyi Zhou

PDF

CA-SSL: Class-Agnostic Semi-Supervised Learning for Detection and Segmentation Lu Qi, Jason Kuen, Zhe Lin, Jiuxiang Gu, Fengyun Rao, Dian Li, Weidong Guo, Zhen Wen, Ming-Hsuan Yang, Jiaya Jia

PDF

CADyQ: Content-Aware Dynamic Quantization for Image Super-Resolution Cheeun Hong, Sungyong Baik, Heewon Kim, Seungjun Nah, Kyoung Mu Lee

PDF

Calibration-Free Multi-View Crowd Counting Qi Zhang, Antoni B. Chan

PDF

Camera Auto-Calibration from the Steiner Conic of the Fundamental Matrix Yu Liu, Hui Zhang

PDF

Camera Pose Auto-Encoders for Improving Pose Regression Yoli Shavit, Yosi Keller

PDF

Camera Pose Estimation and Localization with Active Audio Sensing Karren Yang, Michael Firman, Eric Brachmann, Clément Godard

PDF

Can Shuffling Video Benefit Temporal Bias Problem: A Novel Training Framework for Temporal Grounding Jiachang Hao, Haifeng Sun, Pengfei Ren, Jingyu Wang, Qi Qi, Jianxin Liao

PDF

CANF-VC: Conditional Augmented Normalizing Flows for Video Compression Yung-Han Ho, Chih-Peng Chang, Peng-Yu Chen, Alessandro Gnutti, Wen-Hsiao Peng

PDF

Capturing, Reconstructing, and Simulating: The UrbanScene3D Dataset Liqiang Lin, Yilin Liu, Yue Hu, Xingguang Yan, Ke Xie, Hui Huang

PDF

CAR: Class-Aware Regularizations for Semantic Segmentation Ye Huang, Di Kang, Liang Chen, Xuefei Zhe, Wenjing Jia, Linchao Bao, Xiangjian He

PDF

Cartoon Explanations of Image Classifiers Stefan Kolek, Duc Anh Nguyen, Ron Levie, Joan Bruna, Gitta Kutyniok

PDF

Category-Level 6d Object Pose and Size Estimation Using Self-Supervised Deep Prior Deformation Networks Jiehong Lin, Zewei Wei, Changxing Ding, Kui Jia

PDF

CATRE: Iterative Point Clouds Alignment for Category-Level Object Pose Refinement Xingyu Liu, Gu Wang, Yi Li, Xiangyang Ji

PDF

CAViT: Contextual Alignment Vision Transformer for Video Object Re-Identification Jinlin Wu, Lingxiao He, Wu Liu, Yang Yang, Zhen Lei, Tao Mei, Stan Z. Li

PDF

CCPL: Contrastive Coherence Preserving Loss for Versatile Style Transfer Zijie Wu, Zhen Zhu, Junping Du, Xiang Bai

PDF

CelebV-HQ: A Large-Scale Video Facial Attributes Dataset Hao Zhu, Wayne Wu, Wentao Zhu, Liming Jiang, Siwei Tang, Li Zhang, Ziwei Liu, Chen Change Loy

PDF

CenterFormer: Center-Based Transformer for 3D Object Detection Zixiang Zhou, Xiangchen Zhao, Yu Wang, Panqu Wang, Hassan Foroosh

PDF

Centrality and Consistency: Two-Stage Clean Samples Identification for Learning with Instance-Dependent Noisy Labels Ganlong Zhao, Guanbin Li, Yipeng Qin, Feng Liu, Yizhou Yu

PDF

Chairs Can Be Stood on: Overcoming Object Bias in Human-Object Interaction Detection Guangzhi Wang, Yangyang Guo, Yongkang Wong, Mohan Kankanhalli

PDF

Check and Link: Pairwise Lesion Correspondence Guides Mammogram Mass Detection Ziwei Zhao, Dong Wang, Yihong Chen, Ziteng Wang, Liwei Wang

PDF

CHORE: Contact, Human and Object REconstruction from a Single RGB Image Xianghui Xie, Bharat Lal Bhatnagar, Gerard Pons-Moll

PDF

ChunkyGAN: Real Image Inversion via Segments Adéla Šubrtová, David Futschik, Jan Čech, Michal Lukáč, Eli Shechtman, Daniel Sýkora

PDF

CIRCLE: Convolutional Implicit Reconstruction and Completion for Large-Scale Indoor Scene Hao-Xiang Chen, Jiahui Huang, Tai-Jiang Mu, Shi-Min Hu

PDF

Class Is Invariant to Context and Vice Versa: On Learning Invariance for Out-of-Distribution Generalization Jiaxin Qi, Kaihua Tang, Qianru Sun, Xian-Sheng Hua, Hanwang Zhang

PDF

Class-Agnostic Object Counting Robust to Intraclass Diversity Shenjian Gong, Shanshan Zhang, Jian Yang, Dengxin Dai, Bernt Schiele

PDF

Class-Agnostic Object Detection with Multi-Modal Transformer Muhammad Maaz, Hanoona Rasheed, Salman Khan, Fahad Shahbaz Khan, Rao Muhammad Anwer, Ming-Hsuan Yang

PDF

Class-Incremental Learning with Cross-Space Clustering and Controlled Transfer Arjun Ashok, K J Joseph, Vineeth N Balasubramanian

PDF

Class-Incremental Novel Class Discovery Subhankar Roy, Mingxuan Liu, Zhun Zhong, Nicu Sebe, Elisa Ricci

PDF

Classification-Regression for Chart Comprehension Matan Levy, Rami Ben-Ari, Dani Lischinski

PDF

CLASTER: Clustering with Reinforcement Learning for Zero-Shot Action Recognition Shreyank N Gowda, Laura Sevilla-Lara, Frank Keller, Marcus Rohrbach

PDF

ClearPose: Large-Scale Transparent Object Dataset and Benchmark Xiaotong Chen, Huijie Zhang, Zeren Yu, Anthony Opipari, Odest Chadwicke Jenkins

PDF

CLIFF: Carrying Location Information in Full Frames into Human Pose and Shape Estimation Zhihao Li, Jianzhuang Liu, Zhensong Zhang, Songcen Xu, Youliang Yan

PDF

CLIP-Actor: Text-Driven Recommendation and Stylization for Animating Human Meshes Kim Youwang, Kim Ji-Yeon, Tae-Hyun Oh

PDF

CLOSE: Curriculum Learning on the Sharing Extent Towards Better One-Shot NAS Zixuan Zhou, Xuefei Ning, Yi Cai, Jiashu Han, Yiping Deng, Yuhan Dong, Huazhong Yang, Yu Wang

PDF

CMD: Self-Supervised 3D Action Representation Learning with Cross-Modal Mutual Distillation Yunyao Mao, Wengang Zhou, Zhenbo Lu, Jiajun Deng, Houqiang Li

PDF

CMT: Context-Matching-Guided Transformer for 3D Tracking in Point Clouds Zhiyang Guo, Yunyao Mao, Wengang Zhou, Min Wang, Houqiang Li

PDF

Coarse-to-Fine Incremental Few-Shot Learning Xiang Xiang, Yuwen Tan, Qian Wan, Jing Ma, Alan Yuille, Gregory D. Hager

PDF

Coarse-to-Fine Sparse Transformer for Hyperspectral Image Reconstruction Yuanhao Cai, Jing Lin, Xiaowan Hu, Haoqian Wang, Xin Yuan, Yulun Zhang, Radu Timofte, Luc Van Gool

PDF

CODA: A Real-World Road Corner Case Dataset for Object Detection in Autonomous Driving Kaican Li, Kai Chen, Haoyu Wang, Lanqing Hong, Chaoqiang Ye, Jianhua Han, Yukuai Chen, Wei Zhang, Chunjing Xu, Dit-Yan Yeung, Xiaodan Liang, Zhenguo Li, Hang Xu

PDF

CODER: Coupled Diversity-Sensitive Momentum Contrastive Learning for Image-Text Retrieval Haoran Wang, Dongliang He, Wenhao Wu, Boyang Xia, Min Yang, Fu Li, Yunlong Yu, Zhong Ji, Errui Ding, Jingdong Wang

PDF

CoGS: Controllable Generation and Search from Sketch and Style Cusuh Ham, Gemma Canet Tarrés, Tu Bui, James Hays, Zhe Lin, John Collomosse

PDF

Collaborating Domain-Shared and Target-Specific Feature Clustering for Cross-Domain 3D Action Recognition Qinying Liu, Zilei Wang

PDF

ColorFormer: Image Colorization via Color Memory Assisted Hybrid-Attention Transformer Xiaozhong Ji, Boyuan Jiang, Donghao Luo, Guangpin Tao, Wenqing Chu, Zhifeng Xie, Chengjie Wang, Ying Tai

PDF

Colorization for in Situ Marine Plankton Images Guannan Guo, Qi Lin, Tao Chen, Zhenghui Feng, Zheng Wang, Jianping Li

PDF

Combating Label Distribution Shift for Active Domain Adaptation Sehyun Hwang, Sohyun Lee, Sungyeon Kim, Jungseul Ok, Suha Kwak

PDF

Combining Internal and External Constraints for Unrolling Shutter in Videos Eyal Naor, Itai Antebi, Shai Bagon, Michal Irani

PDF

CoMER: Modeling Coverage for Transformer-Based Handwritten Mathematical Expression Recognition Wenqi Zhao, Liangcai Gao

PDF

Compiler-Aware Neural Architecture Search for On-Mobile Real-Time Super-Resolution Yushu Wu, Yifan Gong, Pu Zhao, Yanyu Li, Zheng Zhan, Wei Niu, Hao Tang, Minghai Qin, Bin Ren, Yanzhi Wang

PDF

Complementing Brightness Constancy with Deep Networks for Optical Flow Prediction Vincent Le Guen, Clément Rambour, Nicolas Thome

PDF

Completely Self-Supervised Crowd Counting via Distribution Matching Deepak Babu Sam, Abhinav Agarwalla, Jimmy Joseph, Vishwanath A. Sindagi, R. Venkatesh Babu, Vishal M. Patel

PDF

CompNVS: Novel View Synthesis with Scene Completion Zuoyue Li, Tianxing Fan, Zhenqiang Li, Zhaopeng Cui, Yoichi Sato, Marc Pollefeys, Martin R. Oswald

PDF

COMPOSER: Compositional Reasoning of Group Activity in Videos with Keypoint-Only Modality Honglu Zhou, Asim Kadav, Aviv Shamsian, Shijie Geng, Farley Lai, Long Zhao, Ting Liu, Mubbasir Kapadia, Hans Peter Graf

PDF

Compositional Human-Scene Interaction Synthesis with Semantic Control Kaifeng Zhao, Shaofei Wang, Yan Zhang, Thabo Beeler, Siyu Tang

PDF

Compositional Visual Generation with Composable Diffusion Models Nan Liu, Shuang Li, Yilun Du, Antonio Torralba, Joshua B. Tenenbaum

PDF

Compound Prototype Matching for Few-Shot Action Recognition Yifei Huang, Lijin Yang, Yoichi Sato

PDF

ConCL: Concept Contrastive Learning for Dense Prediction Pre-Training in Pathology Images Jiawei Yang, Hanbo Chen, Yuan Liang, Junzhou Huang, Lei He, Jianhua Yao

PDF

Concurrent Subsidiary Supervision for Unsupervised Source-Free Domain Adaptation Jogendra Nath Kundu, Suvaansh Bhambri, Akshay Kulkarni, Hiran Sarkar, Varun Jampani, R. Venkatesh Babu

PDF

Conditional Stroke Recovery for Fine-Grained Sketch-Based Image Retrieval Zhixin Ling, Zhen Xing, Jian Zhou, Xiangdong Zhou

PDF

Conditional-Flow NeRF: Accurate 3D Modelling with Reliable Uncertainty Quantification Jianxiong Shen, Antonio Agudo, Francesc Moreno-Noguer, Adria Ruiz

PDF

ConMatch: Semi-Supervised Learning with Confidence-Guided Consistency Regularization Jiwon Kim, Youngjo Min, Daehwan Kim, Gyuseong Lee, Junyoung Seo, Kwangrok Ryoo, Seungryong Kim

PDF

Connecting Compression Spaces with Transformer for Approximate Nearest Neighbor Search Haokui Zhang, Buzhou Tang, Wenze Hu, Xiaoyu Wang

PDF

Constrained Mean Shift Using Distant yet Related Neighbors for Representation Learning K L Navaneet, Soroush Abbasi Koohpayegani, Ajinkya Tejankar, Kossar Pourahmadi, Akshayvarun Subramanya, Hamed Pirsiavash

PDF

Constructing Balance from Imbalance for Long-Tailed Image Recognition Yue Xu, Yong-Lu Li, Jiefeng Li, Cewu Lu

PDF

Content Adaptive Latents and Decoder for Neural Image Compression Guanbo Pan, Guo Lu, Zhihao Hu, Dong Xu

PDF

Content-Oriented Learned Image Compression Meng Li, Shangyin Gao, Yihui Feng, Yibo Shi, Jing Wang

PDF

Context-Aware Streaming Perception in Dynamic Environments Gur-Eyal Sela, Ionel Gog, Justin Wong, Kumar Krishna Agrawal, Xiangxi Mo, Sukrit Kalra, Peter Schafhalter, Eric Leong, Xin Wang, Bharathan Balaji, Joseph Gonzalez, Ion Stoica

PDF

Context-Consistent Semantic Image Editing with Style-Preserved Modulation Wuyang Luo, Su Yang, Hong Wang, Bo Long, Weishan Zhang

PDF

Context-Enhanced Stereo Transformer Weiyu Guo, Zhaoshuo Li, Yongkui Yang, Zheng Wang, Russell H. Taylor, Mathias Unberath, Alan Yuille, Yingwei Li

PDF

Contextformer: A Transformer with Spatio-Channel Attention for Context Modeling in Learned Image Compression A. Burakhan Koyuncu, Han Gao, Atanas Boev, Georgii Gaikov, Elena Alshina, Eckehard Steinbach

PDF

Contextual Text Block Detection Towards Scene Text Understanding Chuhui Xue, Jiaxing Huang, Wenqing Zhang, Shijian Lu, Changhu Wang, Song Bai

PDF

Continual 3D Convolutional Neural Networks for Real-Time Processing of Videos Lukas Hedegaard, Alexandros Iosifidis

PDF

Continual Semantic Segmentation via Structure Preserving and Projected Feature Alignment Zihan Lin, Zilei Wang, Yixin Zhang

PDF

Continual Variational Autoencoder Learning via Online Cooperative Memorization Fei Ye, Adrian G. Bors

PDF

Contrast-Phys: Unsupervised Video-Based Remote Physiological Measurement via Spatiotemporal Contrast Zhaodong Sun, Xiaobai Li

PDF

Contrasting Quadratic Assignments for Set-Based Representation Learning Artem Moskalev, Ivan Sosnovik, Volker Fischer, Arnold Smeulders

PDF

Contrastive Deep Supervision Linfeng Zhang, Xin Chen, Junbo Zhang, Runpei Dong, Kaisheng Ma

PDF

Contrastive Learning for Diverse Disentangled Foreground Generation Yuheng Li, Yijun Li, Jingwan Lu, Eli Shechtman, Yong Jae Lee, Krishna Kumar Singh

PDF

Contrastive Monotonic Pixel-Level Modulation Kun Lu, Rongpeng Li, Honggang Zhang

PDF

Contrastive Positive Mining for Unsupervised 3D Action Representation Learning Haoyuan Zhang, Yonghong Hou, Wenjing Zhang, Wanqing Li

PDF

Contrastive Prototypical Network with Wasserstein Confidence Penalty Haoqing Wang, Zhi-Hong Deng

PDF

Contrastive Vicinal Space for Unsupervised Domain Adaptation Jaemin Na, Dongyoon Han, Hyung Jin Chang, Wonjun Hwang

PDF

Contrastive Vision-Language Pre-Training with Limited Resources Quan Cui, Boyan Zhou, Yu Guo, Weidong Yin, Hao Wu, Osamu Yoshie, Yubo Chen

PDF

Contributions of Shape, Texture, and Color in Visual Recognition Yunhao Ge, Yao Xiao, Zhi Xu, Xingrui Wang, Laurent Itti

PDF

Controllable and Guided Face Synthesis for Unconstrained Face Recognition Feng Liu, Minchul Kim, Anil Jain, Xiaoming Liu

PDF

Controllable Shadow Generation Using Pixel Height Maps Yichen Sheng, Yifan Liu, Jianming Zhang, Wei Yin, A. Cengiz Oztireli, He Zhang, Zhe Lin, Eli Shechtman, Bedrich Benes

PDF

Controllable Video Generation Through Global and Local Motion Dynamics Aram Davtyan, Paolo Favaro

PDF

Convolutional Embedding Makes Hierarchical Vision Transformer Stronger Cong Wang, Hongmin Xu, Xiong Zhang, Li Wang, Zhitong Zheng, Haifeng Liu

PDF

COO: Comic Onomatopoeia Dataset for Recognizing Arbitrary or Truncated Texts Jeonghun Baek, Yusuke Matsui, Kiyoharu Aizawa

PDF

Cornerformer: Purifying Instances for Corner-Based Detectors Haoran Wei, Xin Chen, Lingxi Xie, Qi Tian

PDF

Correspondence Reweighted Translation Averaging Lalit Manam, Venu Madhav Govindu

PDF

CoSCL: Cooperation of Small Continual Learners Is Stronger than a Big One Liyuan Wang, Xingxing Zhang, Qian Li, Jun Zhu, Yi Zhong

PDF

CoSMix: Compositional Semantic Mix for Domain Adaptation in 3D LiDAR Segmentation Cristiano Saltori, Fabio Galasso, Giuseppe Fiameni, Nicu Sebe, Elisa Ricci, Fabio Poiesi

PDF

Cost Aggregation with 4D Convolutional Swin Transformer for Few-Shot Segmentation Sunghwan Hong, Seokju Cho, Jisu Nam, Stephen Lin, Seungryong Kim

PDF

CostDCNet: Cost Volume Based Depth Completion for a Single RGB-D Image Jaewon Kam, Jungeon Kim, Soongjin Kim, Jaesik Park, Seungyong Lee

PDF

COUCH: Towards Controllable Human-Chair Interactions Xiaohan Zhang, Bharat Lal Bhatnagar, Sebastian Starke, Vladimir Guzov, Gerard Pons-Moll

PDF

Counterfactual Intervention Feature Transfer for Visible-Infrared Person Re-Identification Xulin Li, Yan Lu, Bin Liu, Yating Liu, Guojun Yin, Qi Chu, Jinyang Huang, Feng Zhu, Rui Zhao, Nenghai Yu

PDF

CoupleFace: Relation Matters for Face Recognition Distillation Jiaheng Liu, Haoyu Qin, Yichao Wu, Jinyang Guo, Ding Liang, Ke Xu

PDF

CoVisPose: Co-Visibility Pose Transformer for Wide-Baseline Relative Pose Estimation in 360° Indoor Panoramas Will Hutchcroft, Yuguang Li, Ivaylo Boyadzhiev, Zhiqiang Wan, Haiyan Wang, Sing Bing Kang

PDF

CP2: Copy-Paste Contrastive Pretraining for Semantic Segmentation Feng Wang, Huiyu Wang, Chen Wei, Alan Yuille, Wei Shen

PDF

CPO: Change Robust Panorama to Point Cloud Localization Junho Kim, Hojun Jang, Changwoon Choi, Young Min Kim

PDF

CPrune: Compiler-Informed Model Pruning for Efficient Target-Aware DNN Execution Taeho Kim, Yongin Kwon, Jemin Lee, Taeho Kim, Sangtae Ha

PDF

CramNet: Camera-Radar Fusion with Ray-Constrained Cross-Attention for Robust 3D Object Detection Jyh-Jing Hwang, Henrik Kretzschmar, Joshua Manela, Sean Rafferty, Nicholas Armstrong-Crews, Tiffany Chen, Dragomir Anguelov

PDF

Cross Attention Based Style Distribution for Controllable Person Image Synthesis Xinyue Zhou, Mingyu Yin, Xinyuan Chen, Li Sun, Changxin Gao, Qingli Li

PDF

Cross-Attention of Disentangled Modalities for 3D Human Mesh Recovery with Transformers Junhyeong Cho, Kim Youwang, Tae-Hyun Oh

PDF

Cross-Domain Cross-Set Few-Shot Learning via Learning Compact and Aligned Representations Wentao Chen, Zhang Zhang, Wei Wang, Liang Wang, Zilei Wang, Tieniu Tan

PDF

Cross-Domain Ensemble Distillation for Domain Generalization Kyungmoon Lee, Sungyeon Kim, Suha Kwak

PDF

Cross-Domain Few-Shot Semantic Segmentation Shuo Lei, Xuchao Zhang, Jianfeng He, Fanglan Chen, Bowen Du, Chang-Tien Lu

PDF

Cross-Modal 3D Shape Generation and Manipulation Zezhou Cheng, Menglei Chai, Jian Ren, Hsin-Ying Lee, Kyle Olszewski, Zeng Huang, Subhransu Maji, Sergey Tulyakov

PDF

Cross-Modal Knowledge Transfer Without Task-Relevant Source Data Sk Miraj Ahmed, Suhas Lohit, Kuan-Chuan Peng, Michael J. Jones, Amit K. Roy-Chowdhury

PDF

Cross-Modal Prototype Driven Network for Radiology Report Generation Jun Wang, Abhir Bhalerao, Yulan He

PDF

Cross-Modality Knowledge Distillation Network for Monocular 3D Object Detection Yu Hong, Hang Dai, Yong Ding

PDF

Cross-Modality Transformer for Visible-Infrared Person Re-Identification Kongzhu Jiang, Tianzhu Zhang, Xiang Liu, Bingqiao Qian, Yongdong Zhang, Feng Wu

PDF

CryoAI: Amortized Inference of Poses for Ab Initio Reconstruction of 3D Molecular Volumes from Real Cryo-EM Images Axel Levy, Frédéric Poitevin, Julien Martel, Youssef Nashed, Ariana Peck, Nina Miolane, Daniel Ratner, Mike Dunne, Gordon Wetzstein

PDF

CT2: Colorization Transformer via Color Tokens Shuchen Weng, Jimeng Sun, Yu Li, Si Li, Boxin Shi

PDF

Custom Structure Preservation in Face Aging Guillermo Gomez-Trenado, Stéphane Lathuilière, Pablo Mesejo, Óscar Cordón

PDF

CXR Segmentation by AdaIN-Based Domain Adaptation and Knowledge Distillation Yujin Oh, Jong Chul Ye

PDF

CYBORGS: Contrastively Bootstrapping Object Representations by Grounding in Segmentation Renhao Wang, Hang Zhao, Yang Gao

PDF

CycDA: Unsupervised Cycle Domain Adaptation to Learn from Image to Video Wei Lin, Anna Kukleva, Kunyang Sun, Horst Possegger, Hilde Kuehne, Horst Bischof

PDF

D&D: Learning Human Dynamics from Dynamic Camera Jiefeng Li, Siyuan Bian, Chao Xu, Gang Liu, Gang Yu, Cewu Lu

PDF

D2-TPred: Discontinuous Dependency for Trajectory Prediction Under Traffic Lights Yuzhen Zhang, Wentong Wang, Weizhi Guo, Pei Lv, Mingliang Xu, Wei Chen, Dinesh Manocha

PDF

D2ADA: Dynamic Density-Aware Active Domain Adaptation for Semantic Segmentation Tsung-Han Wu, Yi-Syuan Liou, Shao-Ji Yuan, Hsin-Ying Lee, Tung-I Chen, Kuan-Chih Huang, Winston H. Hsu

PDF

D2C-SR: A Divergence to Convergence Approach for Real-World Image Super-Resolution Youwei Li, Haibin Huang, Lanpeng Jia, Haoqiang Fan, Shuaicheng Liu

PDF

D2HNet: Joint Denoising and Deblurring with Hierarchical Network for Robust Night Image Restoration Yuzhi Zhao, Yongzhe Xu, Qiong Yan, Dingdong Yang, Xuehui Wang, Lai-Man Po

PDF

D3Net: A Unified Speaker-Listener Architecture for 3D Dense Captioning and Visual Grounding Zhenyu Chen, Qirui Wu, Matthias Nießner, Angel X. Chang

PDF

DANBO: Disentangled Articulated Neural Body Representations via Graph Neural Networks Shih-Yang Su, Timur Bagautdinov, Helge Rhodin

PDF

DAS: Densely-Anchored Sampling for Deep Metric Learning Lizhao Liu, Shangxin Huang, Zhuangwei Zhuang, Ran Yang, Mingkui Tan, Yaowei Wang

PDF

Data Association Between Event Streams and Intensity Frames Under Diverse Baselines Dehao Zhang, Qiankun Ding, Peiqi Duan, Chu Zhou, Boxin Shi

PDF

Data Efficient 3D Learner via Knowledge Transferred from 2D Model Ping-Chung Yu, Cheng Sun, Min Sun

PDF

Data Invariants to Understand Unsupervised Out-of-Distribution Detection Lars Doorenbos, Raphael Sznitman, Pablo Márquez-Neila

PDF

Data-Free Backdoor Removal Based on Channel Lipschitzness Runkai Zheng, Rongjun Tang, Jianze Li, Li Liu

PDF

Data-Free Neural Architecture Search via Recursive Label Calibration Zechun Liu, Zhiqiang Shen, Yun Long, Eric Xing, Kwang-Ting Cheng, Chas Leichner

PDF

DaViT: Dual Attention Vision Transformers Mingyu Ding, Bin Xiao, Noel Codella, Ping Luo, Jingdong Wang, Lu Yuan

PDF

DCCF: Deep Comprehensible Color Filter Learning Framework for High-Resolution Image Harmonization Ben Xue, Shenghui Ran, Quan Chen, Rongfei Jia, Binqiang Zhao, Xing Tang

PDF

DCL-Net: Deep Correspondence Learning Network for 6d Pose Estimation Hongyang Li, Jiehong Lin, Kui Jia

PDF

DeciWatch: A Simple Baseline for 10× Efficient 2D and 3D Pose Estimation Ailing Zeng, Xuan Ju, Lei Yang, Ruiyuan Gao, Xizhou Zhu, Bo Dai, Qiang Xu

PDF

Decomposing the Tangent of Occluding Boundaries According to Curvatures and Torsions Huizong Yang, Anthony Yezzi

PDF

Decouple-and-Sample: Protecting Sensitive Information in Task Agnostic Data Release Abhishek Singh, Ethan Garza, Ayush Chopra, Praneeth Vepakomma, Vivek Sharma, Ramesh Raskar

PDF

Decoupled Adversarial Contrastive Learning for Self-Supervised Adversarial Robustness Chaoning Zhang, Kang Zhang, Chenshuang Zhang, Axi Niu, Jiu Feng, Chang D. Yoo, In So Kweon

PDF

Decoupled Contrastive Learning Chun-Hsiao Yeh, Cheng-Yao Hong, Yen-Chi Hsu, Tyng-Luh Liu, Yubei Chen, Yann LeCun

PDF

DecoupleNet: Decoupled Network for Domain Adaptive Semantic Segmentation Xin Lai, Zhuotao Tian, Xiaogang Xu, Yingcong Chen, Shu Liu, Hengshuang Zhao, Liwei Wang, Jiaya Jia

PDF

Deep 360° Optical Flow Estimation Based on Multi-Projection Fusion Yiheng Li, Connelly Barnes, Kun Huang, Fang-Lue Zhang

PDF

Deep Bayesian Video Frame Interpolation Zhiyang Yu, Yu Zhang, Xujie Xiang, Dongqing Zou, Xijun Chen, Jimmy S. Ren

PDF

Deep Ensemble Learning by Diverse Knowledge Distillation for Fine-Grained Object Classification Naoki Okamoto, Tsubasa Hirakawa, Takayoshi Yamashita, Hironobu Fujiyoshi

PDF

Deep Fourier-Based Exposure Correction Network with Spatial-Frequency Interaction Jie Huang, Yajing Liu, Feng Zhao, Keyu Yan, Jinghao Zhang, Yukun Huang, Man Zhou, Zhiwei Xiong

PDF

Deep Hash Distillation for Image Retrieval Young Kyun Jang, Geonmo Gu, Byungsoo Ko, Isaac Kang, Nam Ik Cho

PDF

Deep Partial Updating: Towards Communication Efficient Updating for On-Device Inference Zhongnan Qu, Cong Liu, Lothar Thiele

PDF

Deep Portrait Delighting Joshua Weir, Junhong Zhao, Andrew Chalmers, Taehyun Rhee

PDF

Deep Radial Embedding for Visual Sequence Learning Yuecong Min, Peiqi Jiao, Yanan Li, Xiaotao Wang, Lei Lei, Xiujuan Chai, Xilin Chen

PDF

Deep Semantic Statistics Matching (D2SM) Denoising Network Kangfu Mei, Vishal M. Patel, Rui Huang

PDF

DeepMend: Learning Occupancy Functions to Represent Shape for Repair Nikolas Lamb, Sean Banerjee, Natasha Kholgade Banerjee

PDF

DeepPS2: Revisiting Photometric Stereo Using Two Differently Illuminated Images Ashish Tiwari, Shanmuganathan Raman

PDF

DeepShadow: Neural Shape from Shadow Asaf Karnieli, Ohad Fried, Yacov Hel-Or

PDF

Deformable Feature Aggregation for Dynamic Multi-Modal 3D Object Detection Zehui Chen, Zhenyu Li, Shiquan Zhang, Liangji Fang, Qinhong Jiang, Feng Zhao

PDF

Deforming Radiance Fields with Cages Tianhan Xu, Tatsuya Harada

PDF

DeiT III: Revenge of the ViT Hugo Touvron, Matthieu Cord, Hervé Jégou

PDF

Delta Distillation for Efficient Video Processing Amirhossein Habibian, Haitam Ben Yahia, Davide Abati, Efstratios Gavves, Fatih Porikli

PDF

DeltaGAN: Towards Diverse Few-Shot Image Generation with Sample-Specific Delta Yan Hong, Li Niu, Jianfu Zhang, Liqing Zhang

PDF

DELTAR: Depth Estimation from a Light-Weight ToF Sensor and RGB Image Yijin Li, Xinyang Liu, Wenqi Dong, Han Zhou, Hujun Bao, Guofeng Zhang, Yinda Zhang, Zhaopeng Cui

PDF

Delving into Details: Synopsis-to-Detail Networks for Video Recognition Shuxian Liang, Xu Shen, Jianqiang Huang, Xian-Sheng Hua

PDF

Delving into Universal Lesion Segmentation: Method, Dataset, and Benchmark Yu Qiu, Jing Xu

PDF

DeMFI: Deep Joint Deblurring and Multi-Frame Interpolation with Flow-Guided Attentive Correlation and Recursive Boosting Jihyong Oh, Munchurl Kim

PDF

Demystifying Unsupervised Semantic Correspondence Estimation Mehmet Aygün, Oisin Mac Aodha

PDF

Dense Cross-Query-and-Support Attention Weighted Mask Aggregation for Few-Shot Segmentation Xinyu Shi, Dong Wei, Yu Zhang, Donghuan Lu, Munan Ning, Jiashun Chen, Kai Ma, Yefeng Zheng

PDF

Dense Gaussian Processes for Few-Shot Segmentation Joakim Johnander, Johan Edstedt, Michael Felsberg, Fahad Shahbaz Khan, Martin Danelljan

PDF

Dense Siamese Network for Dense Unsupervised Learning Wenwei Zhang, Jiangmiao Pang, Kai Chen, Chen Change Loy

PDF

Dense Teacher: Dense Pseudo-Labels for Semi-Supervised Object Detection Hongyu Zhou, Zheng Ge, Songtao Liu, Weixin Mao, Zeming Li, Haiyan Yu, Jian Sun

PDF

DenseHybrid: Hybrid Anomaly Detection for Dense Open-Set Recognition Matej Grcić, Petra Bevandić, Siniša Šegvić

PDF

Densely Constrained Depth Estimator for Monocular 3D Object Detection Yingyan Li, Yuntao Chen, Jiawei He, Zhaoxiang Zhang

PDF

Depth Field Networks for Generalizable Multi-View Scene Representation Vitor Guizilini, Igor Vasiljevic, Jiading Fang, Rareș Ambruș, Greg Shakhnarovich, Matthew R. Walter, Adrien Gaidon

PDF

Depth mAP Decomposition for Monocular Depth Estimation Jinyoung Jun, Jae-Han Lee, Chul Lee, Chang-Su Kim

PDF

Designing One Unified Framework for High-Fidelity Face Reenactment and Swapping Chao Xu, Jiangning Zhang, Yue Han, Guanzhong Tian, Xianfang Zeng, Ying Tai, Yabiao Wang, Chengjie Wang, Yong Liu

PDF

Detecting and Recovering Sequential DeepFake Manipulation Rui Shao, Tianxing Wu, Ziwei Liu

PDF

Detecting Generated Images by Real Images Bo Liu, Fan Yang, Xiuli Bi, Bin Xiao, Weisheng Li, Xinbo Gao

PDF

Detecting Tampered Scene Text in the Wild Yuxin Wang, Hongtao Xie, Mengting Xing, Jing Wang, Shenggao Zhu, Yongdong Zhang

PDF

Detecting Twenty-Thousand Classes Using Image-Level Supervision Xingyi Zhou, Rohit Girdhar, Armand Joulin, Philipp Krähenbühl, Ishan Misra

PDF

DetMatch: Two Teachers Are Better than One for Joint 2D and 3D Semi-Supervised Object Detection Jinhyung Park, Chenfeng Xu, Yiyang Zhou, Masayoshi Tomizuka, Wei Zhan

PDF

DEVIANT: Depth EquiVarIAnt NeTwork for Monocular 3D Object Detection Abhinav Kumar, Garrick Brazil, Enrique Corona, Armin Parchami, Xiaoming Liu

PDF

DevNet: Self-Supervised Monocular Depth Learning via Density Volume Construction Kaichen Zhou, Lanqing Hong, Changhao Chen, Hang Xu, Chaoqiang Ye, Qingyong Hu, Zhenguo Li

PDF

DexMV: Imitation Learning for Dexterous Manipulation from Human Videos Yuzhe Qin, Yueh-Hua Wu, Shaowei Liu, Hanwen Jiang, Ruihan Yang, Yang Fu, Xiaolong Wang

PDF

DFNet: Enhance Absolute Pose Regression with Direct Feature Matching Shuai Chen, Xinghui Li, Zirui Wang, Victor Adrian Prisacariu

PDF

DH-AUG: DH Forward Kinematics Model Driven Augmentation for 3D Human Pose Estimation Linzhi Huang, Jiahao Liang, Weihong Deng

PDF

DICE: Leveraging Sparsification for Out-of-Distribution Detection Yiyou Sun, Yixuan Li

PDF

DID-M3D: Decoupling Instance Depth for Monocular 3D Object Detection Liang Peng, Xiaopei Wu, Zheng Yang, Haifeng Liu, Deng Cai

PDF

diffConv: Analyzing Irregular Point Clouds with an Irregular View Manxi Lin, Aasa Feragen

PDF

Differentiable Raycasting for Self-Supervised Occupancy Forecasting Tarasha Khurana, Peiyun Hu, Achal Dave, Jason Ziglar, David Held, Deva Ramanan

PDF

Differentiable Zooming for Multiple Instance Learning on Whole-Slide Images Kevin Thandiackal, Boqi Chen, Pushpak Pati, Guillaume Jaume, Drew F. K. Williamson, Maria Gabrani, Orcun Goksel

PDF

Difficulty-Aware Simulator for Open Set Recognition WonJun Moon, Junho Park, Hyun Seok Seong, Cheol-Ho Cho, Jae-Pil Heo

PDF

DiffuseMorph: Unsupervised Deformable Image Registration Using Diffusion Model Boah Kim, Inhwa Han, Jong Chul Ye

PDF

DiffuStereo: High Quality Human Reconstruction via Diffusion-Based Stereo Using Sparse Cameras Ruizhi Shao, Zerong Zheng, Hongwen Zhang, Jingxiang Sun, Yebin Liu

PDF

Digging into Radiance Grid for Real-Time View Synthesis with Detail Preservation Jian Zhang, Jinchi Huang, Bowen Cai, Huan Fu, Mingming Gong, Chaohui Wang, Jiaming Wang, Hongchen Luo, Rongfei Jia, Binqiang Zhao, Xing Tang

PDF

Directed Ray Distance Functions for 3D Scene Reconstruction Nilesh Kulkarni, Justin Johnson, David F. Fouhey

PDF

DisCo: Remedying Self-Supervised Learning on Lightweight Models with Distilled Contrastive Learning Yuting Gao, Jia-Xin Zhuang, Shaohui Lin, Hao Cheng, Xing Sun, Ke Li, Chunhua Shen

PDF

Discover and Mitigate Unknown Biases with Debiasing Alternate Networks Zhiheng Li, Anthony Hoogs, Chenliang Xu

PDF

Discovering Deformable Keypoint Pyramids Jianing Qian, Anastasios Panagopoulos, Dinesh Jayaraman

PDF

Discovering Human-Object Interaction Concepts via Self-Compositional Learning Zhi Hou, Baosheng Yu, Dacheng Tao

PDF

Discovering Transferable Forensic Features for CNN-Generated Images Detection Keshigeyan Chandrasegaran, Ngoc-Trung Tran, Alexander Binder, Ngai-Man Cheung

PDF

Discrete-Constrained Regression for Local Counting Models Haipeng Xiong, Angela Yao

PDF

Discriminability-Transferability Trade-Off: An Information-Theoretic Perspective Quan Cui, Bingchen Zhao, Zhao-Min Chen, Borui Zhao, Renjie Song, Boyan Zhou, Jiajun Liang, Osamu Yoshie

PDF

Disentangled Differentiable Network Pruning Shangqian Gao, Feihu Huang, Yanfu Zhang, Heng Huang

PDF

Disentangling Architecture and Training for Optical Flow Deqing Sun, Charles Herrmann, Fitsum Reda, Michael Rubinstein, David J. Fleet, William T. Freeman

PDF

Disentangling Object Motion and Occlusion for Unsupervised Multi-Frame Monocular Depth Ziyue Feng, Liang Yang, Longlong Jing, Haiyan Wang, YingLi Tian, Bing Li

PDF

DISP6D: Disentangled Implicit Shape and Pose Learning for Scalable 6d Pose Estimation Yilin Wen, Xiangyu Li, Hao Pan, Lei Yang, Zheng Wang, Taku Komura, Wenping Wang

PDF

Distilling Object Detectors with Global Knowledge Sanli Tang, Zhongyu Zhang, Zhanzhan Cheng, Jing Lu, Yunlu Xu, Yi Niu, Fan He

PDF

Distilling the Undistillable: Learning from a Nasty Teacher Surgan Jandial, Yash Khasbage, Arghya Pal, Vineeth N Balasubramanian, Balaji Krishnamurthy

PDF

DistPro: Searching a Fast Knowledge Distillation Process via Meta Optimization Xueqing Deng, Dawei Sun, Shawn Newsam, Peng Wang

PDF

Diverse Generation from a Single Video Made Possible Niv Haim, Ben Feinstein, Niv Granot, Assaf Shocher, Shai Bagon, Tali Dekel, Michal Irani

PDF

Diverse Human Motion Prediction Guided by Multi-Level Spatial-Temporal Anchors Sirui Xu, Yu-Xiong Wang, Liang-Yan Gui

PDF

Diverse Image Inpainting with Normalizing Flow Cairong Wang, Yiming Zhu, Chun Yuan

PDF

Diverse Learner: Exploring Diverse Supervision for Semi-Supervised Object Detection Linfeng Li, Minyue Jiang, Yue Yu, Wei Zhang, Xiangru Lin, Yingying Li, Xiao Tan, Jingdong Wang, Errui Ding

PDF

DLCFT: Deep Linear Continual Fine-Tuning for General Incremental Learning Hyounguk Shon, Janghyeon Lee, Seung Hwan Kim, Junmo Kim

PDF

DLME: Deep Local-Flatness Manifold Embedding Zelin Zang, Siyuan Li, Di Wu, Ge Wang, Kai Wang, Lei Shang, Baigui Sun, Hao Li, Stan Z. Li

PDF

DNA: Improving Few-Shot Transfer Learning with Low-Rank Decomposition and Alignment Ziyu Jiang, Tianlong Chen, Xuxi Chen, Yu Cheng, Luowei Zhou, Lu Yuan, Ahmed Awadallah, Zhangyang Wang

PDF

DODA: Data-Oriented Sim-to-Real Domain Adaptation for 3D Semantic Segmentation Runyu Ding, Jihan Yang, Li Jiang, Xiaojuan Qi

PDF

Domain Adaptive Hand Keypoint and Pixel Localization in the Wild Takehiko Ohkawa, Yu-Jhe Li, Qichen Fu, Ryosuke Furuta, Kris M. Kitani, Yoichi Sato

PDF

Domain Adaptive Person Search Junjie Li, Yichao Yan, Guanshuo Wang, Fufu Yu, Qiong Jia, Shouhong Ding

PDF

Domain Adaptive Video Segmentation via Temporal Pseudo Supervision Yun Xing, Dayan Guan, Jiaxing Huang, Shijian Lu

PDF

Domain Generalization by Mutual-Information Regularization with Pre-Trained Models Junbum Cha, Kyungjae Lee, Sungrae Park, Sanghyuk Chun

PDF

Domain Invariant Masked Autoencoders for Self-Supervised Learning from Multi-Domains Haiyang Yang, Shixiang Tang, Meilin Chen, Yizhou Wang, Feng Zhu, Lei Bai, Rui Zhao, Wanli Ouyang

PDF

Domain Knowledge-Informed Self-Supervised Representations for Workout Form Assessment Paritosh Parmar, Amol Gharat, Helge Rhodin

PDF

Domain Randomization-Enhanced Depth Simulation and Restoration for Perceiving and Grasping Specular and Transparent Objects Qiyu Dai, Jiyao Zhang, Qiwei Li, Tianhao Wu, Hao Dong, Ziyuan Liu, Ping Tan, He Wang

PDF

Don’t Forget Me: Accurate Background Recovery for Text Removal via Modeling Local-Global Context Chongyu Liu, Lianwen Jin, Yuliang Liu, Canjie Luo, Bangdong Chen, Fengjun Guo, Kai Ding

PDF

DoodleFormer: Creative Sketch Drawing with Transformers Ankan Kumar Bhunia, Salman Khan, Hisham Cholakkal, Rao Muhammad Anwer, Fahad Shahbaz Khan, Jorma Laaksonen, Michael Felsberg

PDF

Doubly Deformable Aggregation of Covariance Matrices for Few-Shot Segmentation Zhitong Xiong, Haopeng Li, Xiao Xiang Zhu

PDF

Doubly-Fused ViT: Fuse Information from Vision Transformer Doubly with Local Representation Li Gao, Dong Nie, Bo Li, Xiaofeng Ren

PDF

DProST: Dynamic Projective Spatial Transformer Network for 6d Pose Estimation Jaewoo Park, Nam Ik Cho

PDF

DRCNet: Dynamic Image Restoration Contrastive Network Fei Li, Lingfeng Shen, Yang Mi, Zhenbo Li

PDF

Dress Code: High-Resolution Multi-Category Virtual Try-on Davide Morelli, Matteo Fincato, Marcella Cornia, Federico Landi, Fabio Cesari, Rita Cucchiara

PDF

Drive&Segment: Unsupervised Semantic Segmentation of Urban Scenes via Cross-Modal Distillation Antonin Vobecky, David Hurych, Oriane Siméoni, Spyros Gidaris, Andrei Bursuc, Patrick Pérez, Josef Sivic

PDF

DSR – A Dual Subspace Re-Projection Network for Surface Anomaly Detection Vitjan Zavrtanik, Matej Kristan, Danijel Skočaj

PDF

Dual Adaptive Transformations for Weakly Supervised Point Cloud Segmentation Zhonghua Wu, Yicheng Wu, Guosheng Lin, Jianfei Cai, Chen Qian

PDF

Dual Contrastive Learning with Anatomical Auxiliary Supervision for Few-Shot Medical Image Segmentation Huisi Wu, Fangyan Xiao, Chongxin Liang

PDF

Dual Perspective Network for Audio-Visual Event Localization Varshanth Rao, Md Ibrahim Khalil, Haoda Li, Peng Dai, Juwei Lu

PDF

Dual-Domain Self-Supervised Learning and Model Adaption for Deep Compressive Imaging Yuhui Quan, Xinran Qin, Tongyao Pang, Hui Ji

PDF

Dual-Evidential Learning for Weakly-Supervised Temporal Action Localization Mengyuan Chen, Junyu Gao, Shicai Yang, Changsheng Xu

PDF

Dual-Stream Knowledge-Preserving Hashing for Unsupervised Video Retrieval Pandeng Li, Hongtao Xie, Jiannan Ge, Lei Zhang, Shaobo Min, Yongdong Zhang

PDF

DualFormer: Local-Global Stratified Transformer for Efficient Video Recognition Yuxuan Liang, Pan Zhou, Roger Zimmermann, Shuicheng Yan

PDF

DualPrompt: Complementary Prompting for Rehearsal-Free Continual Learning Zifeng Wang, Zizhao Zhang, Sayna Ebrahimi, Ruoxi Sun, Han Zhang, Chen-Yu Lee, Xiaoqi Ren, Guolong Su, Vincent Perot, Jennifer Dy, Tomas Pfister

PDF

DuelGAN: A Duel Between Two Discriminators Stabilizes the GAN Training Jiaheng Wei, Minghao Liu, Jiahao Luo, Andrew Zhu, James Davis, Yang Liu

PDF

DVS-Voltmeter: Stochastic Process-Based Event Simulator for Dynamic Vision Sensors Songnan Lin, Ye Ma, Zhenhua Guo, Bihan Wen

PDF

Dynamic 3D Scene Analysis by Point Cloud Accumulation Shengyu Huang, Zan Gojcic, Jiahui Huang, Andreas Wieser, Konrad Schindler

PDF

Dynamic Dual Trainable Bounds for Ultra-Low Precision Super-Resolution Networks Yunshan Zhong, Mingbao Lin, Xunchao Li, Ke Li, Yunhang Shen, Fei Chao, Yongjian Wu, Rongrong Ji

PDF

Dynamic Local Aggregation Network with Adaptive Clusterer for Anomaly Detection Zhiwei Yang, Peng Wu, Jing Liu, Xiaotao Liu

PDF

Dynamic Low-Resolution Distillation for Cost-Efficient End-to-End Text Spotting Ying Chen, Liang Qiao, Zhanzhan Cheng, Shiliang Pu, Yi Niu, Xi Li

PDF

Dynamic Metric Learning with Cross-Level Concept Distillation Wenzhao Zheng, Yuanhui Huang, Borui Zhang, Jie Zhou, Jiwen Lu

PDF

Dynamic Spatio-Temporal Specialization Learning for Fine-Grained Action Recognition Tianjiao Li, Lin Geng Foo, Qiuhong Ke, Hossein Rahmani, Anran Wang, Jinghua Wang, Jun Liu

PDF

Dynamic Temporal Filtering in Video Models Fuchen Long, Zhaofan Qiu, Yingwei Pan, Ting Yao, Chong-Wah Ngo, Tao Mei

PDF

Dynamically Transformed Instance Normalization Network for Generalizable Person Re-Identification Bingliang Jiao, Lingqiao Liu, Liying Gao, Guosheng Lin, Lu Yang, Shizhou Zhang, Peng Wang, Yanning Zhang

PDF

DynaST: Dynamic Sparse Transformer for Exemplar-Guided Image Generation Songhua Liu, Jingwen Ye, Sucheng Ren, Xinchao Wang

PDF

E-Graph: Minimal Solution for Rigid Rotation with Extensibility Graphs Yanyan Li, Federico Tombari

PDF

E-NeRV: Expedite Neural Video Representation with Disentangled Spatial-Temporal Context Zizhang Li, Mengmeng Wang, Huaijin Pi, Kechun Xu, Jianbiao Mei, Yong Liu

PDF

EAGAN: Efficient Two-Stage Evolutionary Architecture Search for GANs Guohao Ying, Xin He, Bin Gao, Bo Han, Xiaowen Chu

PDF

EASNet: Searching Elastic and Accurate Network Architecture for Stereo Matching Qiang Wang, Shaohuai Shi, Kaiyong Zhao, Xiaowen Chu

PDF

EAutoDet: Efficient Architecture Search for Object Detection Xiaoxing Wang, Jiale Lin, Juanping Zhao, Xiaokang Yang, Junchi Yan

PDF

ECCV Caption: Correcting False Negatives by Collecting Machine-and-Human-Verified Image-Caption Associations for MS-COCO Sanghyuk Chun, Wonjae Kim, Song Park, Minsuk Chang, Seong Joon Oh

PDF

ECLIPSE: Efficient Long-Range Video Retrieval Using Sight and Sound Yan-Bo Lin, Jie Lei, Mohit Bansal, Gedas Bertasius

PDF

ECO-TR: Efficient Correspondences Finding via Coarse-to-Fine Refinement Dongli Tan, Jiang-Jiang Liu, Xingyu Chen, Chao Chen, Ruixin Zhang, Yunhang Shen, Shouhong Ding, Rongrong Ji

PDF

EdgeViTs: Competing Light-Weight CNNs on Mobile Devices with Vision Transformers Junting Pan, Adrian Bulat, Fuwen Tan, Xiatian Zhu, Lukasz Dudziak, Hongsheng Li, Georgios Tzimiropoulos, Brais Martinez

PDF

Editable Indoor Lighting Estimation Henrique Weber, Mathieu Garon, Jean-François Lalonde

PDF

Editing Out-of-Domain GAN Inversion via Differential Activations Haorui Song, Yong Du, Tianyi Xiang, Junyu Dong, Jing Qin, Shengfeng He

PDF

Effective Presentation Attack Detection Driven by Face Related Task Wentian Zhang, Haozhe Liu, Feng Liu, Raghavendra Ramachandra, Christoph Busch

PDF

Efficient and Degradation-Adaptive Network for Real-World Image Super-Resolution Jie Liang, Hui Zeng, Lei Zhang

PDF

Efficient Decoder-Free Object Detection with Transformers Peixian Chen, Mengdan Zhang, Yunhang Shen, Kekai Sheng, Yuting Gao, Xing Sun, Ke Li, Chunhua Shen

PDF

Efficient Deep Visual and Inertial Odometry with Adaptive Visual Modality Selection Mingyu Yang, Yu Chen, Hun-Seok Kim

PDF

Efficient Long-Range Attention Network for Image Super-Resolution Xindong Zhang, Hui Zeng, Shi Guo, Lei Zhang

PDF

Efficient Meta-Tuning for Content-Aware Neural Video Delivery Xiaoqi Li, Jiaming Liu, Shizun Wang, Cheng Lyu, Ming Lu, Yurong Chen, Anbang Yao, Yandong Guo, Shanghang Zhang

PDF

Efficient One Pass Self-Distillation with Zipf’s Label Smoothing Jiajun Liang, Linze Li, Zhaodong Bing, Borui Zhao, Yao Tang, Bo Lin, Haoqiang Fan

PDF

Efficient One-Stage Video Object Detection by Exploiting Temporal Consistency Guanxiong Sun, Yang Hua, Guosheng Hu, Neil Robertson

PDF

Efficient Point Cloud Analysis Using Hilbert Curve Wanli Chen, Xinge Zhu, Guojin Chen, Bei Yu

PDF

Efficient Point Cloud Segmentation with Geometry-Aware Sparse Networks Maosheng Ye, Rui Wan, Shuangjie Xu, Tongyi Cao, Qifeng Chen

PDF

Efficient Video Deblurring Guided by Motion Magnitude Yusheng Wang, Yunfan Lu, Ye Gao, Lin Wang, Zhihang Zhong, Yinqiang Zheng, Atsushi Yamashita

PDF

Efficient Video Transformers with Spatial-Temporal Token Selection Junke Wang, Xitong Yang, Hengduo Li, Li Liu, Zuxuan Wu, Yu-Gang Jiang

PDF

EgoBody: Human Body Shape and Motion of Interacting People from Head-Mounted Devices Siwei Zhang, Qianli Ma, Yan Zhang, Zhiyin Qian, Taein Kwon, Marc Pollefeys, Federica Bogo, Siyu Tang

PDF

Egocentric Activity Recognition and Localization on a 3D mAP Miao Liu, Lingni Ma, Kiran Somasundaram, Yin Li, Kristen Grauman, James M. Rehg, Chao Li

PDF

EleGANt: Exquisite and Locally Editable GAN for Makeup Transfer Chenyu Yang, Wanrong He, Yingqing Xu, Yang Gao

PDF

Eliminating Gradient Conflict in Reference-Based Line-Art Colorization Zekun Li, Zhengyang Geng, Zhao Kang, Wenyu Chen, Yibo Yang

PDF

Embedding Contrastive Unsupervised Features to Cluster In- and Out-of-Distribution Noise in Corrupted Image Datasets Paul Albert, Eric Arazo, Noel E. O’Connor, Kevin McGuinness

PDF

Emotion Recognition for Multiple Context Awareness Dingkang Yang, Shuai Huang, Shunli Wang, Yang Liu, Peng Zhai, Liuzhen Su, Mingcheng Li, Lihua Zhang

PDF

Emotion-Aware Multi-View Contrastive Learning for Facial Emotion Recognition Daeha Kim, Byung Cheol Song

PDF

End-to-End Active Speaker Detection Juan León Alcázar, Moritz Cordes, Chen Zhao, Bernard Ghanem

PDF

End-to-End Graph-Constrained Vectorized Floorplan Generation with Panoptic Refinement Jiachen Liu, Yuan Xue, Jose Duarte, Krishnendra Shekhawat, Zihan Zhou, Xiaolei Huang

PDF

End-to-End Visual Editing with a Generatively Pre-Trained Artist Andrew Brown, Cheng-Yang Fu, Omkar Parkhi, Tamara L. Berg, Andrea Vedaldi

PDF

End-to-End Weakly Supervised Object Detection with Sparse Proposal Evolution Mingxiang Liao, Fang Wan, Yuan Yao, Zhenjun Han, Jialing Zou, Yuze Wang, Bailan Feng, Peng Yuan, Qixiang Ye

PDF

Enhanced Accuracy and Robustness via Multi-Teacher Adversarial Distillation Shiji Zhao, Jie Yu, Zhenlong Sun, Bo Zhang, Xingxing Wei

PDF

Enhancing Multi-Modal Features Using Local Self-Attention for 3D Object Detection Hao Li, Zehan Zhang, Xian Zhao, Yulong Wang, Yuxi Shen, Shiliang Pu, Hui Mao

PDF

Ensemble Knowledge Guided Sub-Network Search and Fine-Tuning for Filter Pruning Seunghyun Lee, Byung Cheol Song

PDF

Ensemble Learning Priors Driven Deep Unfolding for Scalable Video Snapshot Compressive Imaging Chengshuai Yang, Shiyu Zhang, Xin Yuan

PDF

Entropy-Driven Sampling and Training Scheme for Conditional Diffusion Generation Guangcong Zheng, Shengming Li, Hui Wang, Taiping Yao, Yang Chen, Shouhong Ding, Xi Li

PDF

Entry-Flipped Transformer for Inference and Prediction of Participant Behavior Bo Hu, Tat-Jen Cham

PDF

Equivariance and Invariance Inductive Bias for Learning from Insufficient Data Tan Wang, Qianru Sun, Sugiri Pranata, Karlekar Jayashree, Hanwang Zhang

PDF

Equivariant Hypergraph Neural Networks Jinwoo Kim, Saeyoon Oh, Sungjun Cho, Seunghoon Hong

PDF

ERA: Enhanced Rational Activations Martin Trimmel, Mihai Zanfir, Richard Hartley, Cristian Sminchisescu

PDF

ERA: Expert Retrieval and Assembly for Early Action Prediction Lin Geng Foo, Tianjiao Li, Hossein Rahmani, Qiuhong Ke, Jun Liu

PDF

ERDN: Equivalent Receptive Field Deformable Network for Video Deblurring Bangrui Jiang, Zhihuai Xie, Zhen Xia, Songnan Li, Shan Liu

PDF

Error Compensation Framework for Flow-Guided Video Inpainting Jaeyeon Kang, Seoung Wug Oh, Seon Joo Kim

PDF

ESS: Learning Event-Based Semantic Segmentation from Still Images Zhaoning Sun, Nico Messikommer, Daniel Gehrig, Davide Scaramuzza

PDF

Estimating Spatially-Varying Lighting in Urban Scenes with Disentangled Representation Jiajun Tang, Yongjie Zhu, Haoyu Wang, Jun Hoong Chan, Si Li, Boxin Shi

PDF

EvAC3D: From Event-Based Apparent Contours to 3D Models via Continuous Visual Hulls Ziyun Wang, Kenneth Chaney, Kostas Daniilidis

PDF

Event Neural Networks Matthew Dutson, Yin Li, Mohit Gupta

PDF

Event-Based Fusion for Motion Deblurring with Cross-Modal Attention Lei Sun, Christos Sakaridis, Jingyun Liang, Qi Jiang, Kailun Yang, Peng Sun, Yaozu Ye, Kaiwei Wang, Luc Van Gool

PDF

Event-Guided Deblurring of Unknown Exposure Time Videos Taewoo Kim, Jeongmin Lee, Lin Wang, Kuk-Jin Yoon

PDF

Expanded Adaptive Scaling Normalization for End to End Image Compression Chajin Shin, Hyeongmin Lee, Hanbin Son, Sangjin Lee, Dogyoon Lee, Sangyoun Lee

PDF

Expanding Language-Image Pretrained Models for General Video Recognition Bolin Ni, Houwen Peng, Minghao Chen, Songyang Zhang, Gaofeng Meng, Jianlong Fu, Shiming Xiang, Haibin Ling

PDF

Explaining Deepfake Detection by Analysing Image Matching Shichao Dong, Jin Wang, Jiajun Liang, Haoqiang Fan, Renhe Ji

PDF

Explicit Image Caption Editing Zhen Wang, Long Chen, Wenbo Ma, Guangxing Han, Yulei Niu, Jian Shao, Jun Xiao

PDF

Explicit Model Size Control and Relaxation via Smooth Regularization for Mixed-Precision Quantization Vladimir Chikin, Kirill Solodskikh, Irina Zhelavskaya

PDF

Explicit Occlusion Reasoning for Multi-Person 3D Human Pose Estimation Qihao Liu, Yi Zhang, Song Bai, Alan Yuille

PDF

Exploiting the Local Parabolic Landscapes of Adversarial Losses to Accelerate Black-Box Adversarial Attack Hoang Tran, Dan Lu, Guannan Zhang

PDF

Exploiting Unlabeled Data with Vision and Language Models for Object Detection Shiyu Zhao, Zhixing Zhang, Samuel Schulter, Long Zhao, B G Vijay Kumar, Anastasis Stathopoulos, Manmohan Chandraker, Dimitris N. Metaxas

PDF

Exploring Disentangled Content Information for Face Forgery Detection Jiahao Liang, Huafeng Shi, Weihong Deng

PDF

Exploring Fine-Grained Audiovisual Categorization with the SSW60 Dataset Grant Van Horn, Rui Qian, Kimberly Wilber, Hartwig Adam, Oisin Mac Aodha, Serge Belongie

PDF

Exploring Gradient-Based Multi-Directional Controls in GANs Zikun Chen, Ruowei Jiang, Brendan Duke, Han Zhao, Parham Aarabi

PDF

Exploring Hierarchical Graph Representation for Large-Scale Zero-Shot Image Classification Kai Yi, Xiaoqian Shen, Yunhao Gou, Mohamed Elhoseiny

PDF

Exploring Lottery Ticket Hypothesis in Spiking Neural Networks Youngeun Kim, Yuhang Li, Hyoungseob Park, Yeshwanth Venkatesha, Ruokai Yin, Priyadarshini Panda

PDF

Exploring Plain Vision Transformer Backbones for Object Detection Yanghao Li, Hanzi Mao, Ross Girshick, Kaiming He

PDF

Exploring Resolution and Degradation Clues as Self-Supervised Signal for Low Quality Object Detection Ziteng Cui, Yingying Zhu, Lin Gu, Guo-Jun Qi, Xiaoxiao Li, Renrui Zhang, Zenghui Zhang, Tatsuya Harada

PDF

Exploring the Devil in Graph Spectral Domain for 3D Point Cloud Attacks Qianjiang Hu, Daizong Liu, Wei Hu

PDF

Exposure-Aware Dynamic Weighted Learning for Single-Shot HDR Imaging An Gia Vien, Chul Lee

PDF

Extract Free Dense Labels from CLIP Chong Zhou, Chen Change Loy, Bo Dai

PDF

ExtrudeNet: Unsupervised Inverse Sketch-and-Extrude for Shape Parsing Daxuan Ren, Jianmin Zheng, Jianfei Cai, Jiatong Li, Junzhe Zhang

PDF

Fabric Material Recovery from Video Using Multi-Scale Geometric Auto-Encoder Junbang Liang, Ming Lin

PDF

Face2Faceρ: Real-Time High-Resolution One-Shot Face Reenactment Kewei Yang, Kang Chen, Daoliang Guo, Song-Hai Zhang, Yuan-Chen Guo, Weidong Zhang

PDF

Facial Depth and Normal Estimation Using Single Dual-Pixel Camera Minjun Kang, Jaesung Choe, Hyowon Ha, Hae-Gon Jeon, Sunghoon Im, In So Kweon, Kuk-Jin Yoon

PDF

Factorizing Knowledge in Neural Networks Xingyi Yang, Jingwen Ye, Xinchao Wang

PDF

FADE: Fusing the Assets of Decoder and Encoder for Task-Agnostic Upsampling Hao Lu, Wenze Liu, Hongtao Fu, Zhiguo Cao

PDF

FairGRAPE: Fairness-Aware GRAdient Pruning mEthod for Face Attribute Classification Xiaofeng Lin, Seungbae Kim, Jungseock Joo

PDF

FairStyle: Debiasing StyleGAN2 with Style Channel Manipulations Cemre Efe Karakas, Alara Dirik, Eylül Yalçınkaya, Pinar Yanardag

PDF

FakeCLR: Exploring Contrastive Learning for Solving Latent Discontinuity in Data-Efficient GANs Ziqiang Li, Chaoyue Wang, Heliang Zheng, Jing Zhang, Bin Li

PDF

FAR: Fourier Aerial Video Recognition Divya Kothandaraman, Tianrui Guan, Xijun Wang, Shuowen Hu, Ming Lin, Dinesh Manocha

PDF

Fashionformer: A Simple, Effective and Unified Baseline for Human Fashion Segmentation and Recognition Shilin Xu, Xiangtai Li, Jingbo Wang, Guangliang Cheng, Yunhai Tong, Dacheng Tao

PDF

FashionViL: Fashion-Focused Vision-and-Language Representation Learning Xiao Han, Licheng Yu, Xiatian Zhu, Li Zhang, Yi-Zhe Song, Tao Xiang

PDF

Fast and High Quality Image Denoising via Malleable Convolution Yifan Jiang, Bartlomiej Wronski, Ben Mildenhall, Jonathan T. Barron, Zhangyang Wang, Tianfan Xue

PDF

Fast Two-Step Blind Optical Aberration Correction Thomas Eboli, Jean-Michel Morel, Gabriele Facciolo

PDF

Fast Two-View Motion Segmentation Using Christoffel Polynomials Bengisu Ozbay, Octavia Camps, Mario Sznaier

PDF

Fast-MoCo: Boost Momentum-Based Contrastive Learning with Combinatorial Patches Yuanzheng Ci, Chen Lin, Lei Bai, Wanli Ouyang

PDF

Fast-Vid2Vid: Spatial-Temporal Compression for Video-to-Video Synthesis Long Zhuo, Guangcong Wang, Shikai Li, Wayne Wu, Ziwei Liu

PDF

FAST-VQA: Efficient End-to-End Video Quality Assessment with Fragment Sampling Haoning Wu, Chaofeng Chen, Jingwen Hou, Liang Liao, Annan Wang, Wenxiu Sun, Qiong Yan, Weisi Lin

PDF

Faster VoxelPose: Real-Time 3D Human Pose Estimation by Orthographic Projection Hang Ye, Wentao Zhu, Chunyu Wang, Rujie Wu, Yizhou Wang

PDF

FBNet: Feedback Network for Point Cloud Completion Xuejun Yan, Hongyu Yan, Jingjing Wang, Hang Du, Zhihong Wu, Di Xie, Shiliang Pu, Li Lu

PDF

FCAF3D: Fully Convolutional Anchor-Free 3D Object Detection Danila Rukhovich, Anna Vorontsova, Anton Konushin

PDF

FEAR: Fast, Efficient, Accurate and Robust Visual Tracker Vasyl Borsuk, Roman Vei, Orest Kupyn, Tetiana Martyniuk, Igor Krashenyi, Jiři Matas

PDF

Feature Representation Learning for Unsupervised Cross-Domain Image Retrieval Conghui Hu, Gim Hee Lee

PDF

Federated Self-Supervised Learning for Video Understanding Yasar Abbas Ur Rehman, Yan Gao, Jiajun Shen, Pedro Porto Buarque de Gusmão, Nicholas Lane

PDF

FedLTN: Federated Learning for Sparse and Personalized Lottery Ticket Networks Vaikkunth Mugunthan, Eric Lin, Vignesh Gokul, Christian Lau, Lalana Kagal, Steve Pieper

PDF

FedVLN: Privacy-Preserving Federated Vision-and-Language Navigation Kaiwen Zhou, Xin Eric Wang

PDF

FedX: Unsupervised Federated Learning with Cross Knowledge Distillation Sungwon Han, Sungwon Park, Fangzhao Wu, Sundong Kim, Chuhan Wu, Xing Xie, Meeyoung Cha

PDF

Few ‘Zero Level Set’-Shot Learning of Shape Signed Distance Functions in Feature Space Amine Ouasfi, Adnane Boukhayma

PDF

Few-Shot Action Recognition with Hierarchical Matching and Contrastive Learning Sipeng Zheng, Shizhe Chen, Qin Jin

PDF

Few-Shot Class-Incremental Learning for 3D Point Cloud Objects Townim Chowdhury, Ali Cheraghian, Sameera Ramasinghe, Sahar Ahmadi, Morteza Saberi, Shafin Rahman

PDF

Few-Shot Class-Incremental Learning from an Open-Set Perspective Can Peng, Kun Zhao, Tianren Wang, Meng Li, Brian C. Lovell

PDF

Few-Shot Class-Incremental Learning via Entropy-Regularized Data-Free Replay Huan Liu, Li Gu, Zhixiang Chi, Yang Wang, Yuanhao Yu, Jun Chen, Jin Tang

PDF

Few-Shot Classification with Contrastive Learning Zhanyuan Yang, Jinghua Wang, Yingying Zhu

PDF

Few-Shot End-to-End Object Detection via Constantly Concentrated Encoding Across Heads Jiawei Ma, Guangxing Han, Shiyuan Huang, Yuncong Yang, Shih-Fu Chang

PDF

Few-Shot Image Generation with Mixup-Based Distance Learning Chaerin Kong, Jeesoo Kim, Donghoon Han, Nojun Kwak

PDF

Few-Shot Object Counting and Detection Thanh Nguyen, Chau Pham, Khoi Nguyen, Minh Hoai

PDF

Few-Shot Object Detection by Knowledge Distillation Using Bag-of-Visual-Words Representations Wenjie Pei, Shuang Wu, Dianwen Mei, Fanglin Chen, Jiandong Tian, Guangming Lu

PDF

Few-Shot Object Detection with Model Calibration Qi Fan, Chi-Keung Tang, Yu-Wing Tai

PDF

Few-Shot Single-View 3D Reconstruction with Memory Prior Contrastive Network Zhen Xing, Yijiang Chen, Zhixin Ling, Xiangdong Zhou, Yu Xiang

PDF

Few-Shot Video Object Detection Qi Fan, Chi-Keung Tang, Yu-Wing Tai

PDF

FH-Net: A Fast Hierarchical Network for Scene Flow Estimation on Real-World Point Clouds Lihe Ding, Shaocong Dong, Tingfa Xu, Xinli Xu, Jie Wang, Jianan Li

PDF

FILM: Frame Interpolation for Large Motion Fitsum Reda, Janne Kontkanen, Eric Tabellion, Deqing Sun, Caroline Pantofaru, Brian Curless

PDF

Filter Pruning via Feature Discrimination in Deep Neural Networks Zhiqiang He, Yaguan Qian, Yuqi Wang, Bin Wang, Xiaohui Guan, Zhaoquan Gu, Xiang Ling, Shaoning Zeng, Haijiang Wang, Wujie Zhou

PDF

FindIt: Generalized Localization with Natural Language Queries Weicheng Kuo, Fred Bertsch, Wei Li, Aj Piergiovanni, Mohammad Saffar, Anelia Angelova

PDF

Fine-Grained Data Distribution Alignment for Post-Training Quantization Yunshan Zhong, Mingbao Lin, Mengzhao Chen, Ke Li, Yunhang Shen, Fei Chao, Yongjian Wu, Rongrong Ji

PDF

Fine-Grained Egocentric Hand-Object Segmentation: Dataset, Model, and Applications Lingzhi Zhang, Shenghao Zhou, Simon Stent, Jianbo Shi

PDF

Fine-Grained Fashion Representation Learning by Online Deep Clustering Yang Jiao, Ning Xie, Yan Gao, Chien-chih Wang, Yi Sun

PDF

Fine-Grained Scene Graph Generation with Data Transfer Ao Zhang, Yuan Yao, Qianyu Chen, Wei Ji, Zhiyuan Liu, Maosong Sun, Tat-Seng Chua

PDF

Fine-Grained Visual Entailment Christopher Thomas, Yipeng Zhang, Shih-Fu Chang

PDF

FingerprintNet: Synthesized Fingerprints for Generated Image Detection Yonghyun Jeong, Doyeon Kim, Youngmin Ro, Pyounggeon Kim, Jongwon Choi

PDF

FLEX: Extrinsic Parameters-Free Multi-View 3D Human Motion Reconstruction Brian Gordon, Sigal Raab, Guy Azov, Raja Giryes, Daniel Cohen-Or

PDF

FloatingFusion: Depth from ToF and Image-Stabilized Stereo Cameras Andreas Meuleman, Hakyeong Kim, James Tompkin, Min H. Kim

PDF

Flow Graph to Video Grounding for Weakly-Supervised Multi-Step Localization Nikita Dvornik, Isma Hadji, Hai Pham, Dhaivat Bhatt, Brais Martinez, Afsaneh Fazly, Allan D. Jepson

PDF

Flow-Guided Transformer for Video Inpainting Kaidong Zhang, Jingjing Fu, Dong Liu

PDF

FlowFormer: A Transformer Architecture for Optical Flow Zhaoyang Huang, Xiaoyu Shi, Chao Zhang, Qiang Wang, Ka Chun Cheung, Hongwei Qin, Jifeng Dai, Hongsheng Li

PDF

FOSTER: Feature Boosting and Compression for Class-Incremental Learning Fu-Yun Wang, Da-Wei Zhou, Han-Jia Ye, De-Chuan Zhan

PDF

Free-Viewpoint RGB-D Human Performance Capture and Rendering Phong Nguyen-Ha, Nikolaos Sarafianos, Christoph Lassner, Janne Heikkilä, Tony Tung

PDF

Frequency and Spatial Dual Guidance for Image Dehazing Hu Yu, Naishan Zheng, Man Zhou, Jie Huang, Zeyu Xiao, Feng Zhao

PDF

Frequency Domain Model Augmentation for Adversarial Attack Yuyang Long, Qilong Zhang, Boheng Zeng, Lianli Gao, Xianglong Liu, Jian Zhang, Jingkuan Song

PDF

FrequencyLowCut Pooling – Plug & Play Against Catastrophic Overfitting Julia Grabinski, Steffen Jung, Janis Keuper, Margret Keuper

PDF

From Face to Natural Image: Learning Real Degradation for Blind Image Super-Resolution Xiaoming Li, Chaofeng Chen, Xianhui Lin, Wangmeng Zuo, Lei Zhang

PDF

Frozen CLIP Models Are Efficient Video Learners Ziyi Lin, Shijie Geng, Renrui Zhang, Peng Gao, Gerard de Melo, Xiaogang Wang, Jifeng Dai, Yu Qiao, Hongsheng Li

PDF

FS-COCO: Towards Understanding of Freehand Sketches of Common Objects in Context Pinaki Nath Chowdhury, Aneeshan Sain, Ayan Kumar Bhunia, Tao Xiang, Yulia Gryaditskaya, Yi-Zhe Song

PDF

FurryGAN: High Quality Foreground-Aware Image Synthesis Jeongmin Bae, Mingi Kwon, Youngjung Uh

PDF

Fusing Local Similarities for Retrieval-Based 3D Orientation Estimation of Unseen Objects Chen Zhao, Yinlin Hu, Mathieu Salzmann

PDF

Fusion from Decomposition: A Self-Supervised Decomposition Approach for Image Fusion Pengwei Liang, Junjun Jiang, Xianming Liu, Jiayi Ma

PDF

FusionVAE: A Deep Hierarchical Variational Autoencoder for RGB Image Fusion Fabian Duffhauss, Ngo Anh Vien, Hanna Ziesche, Gerhard Neumann

PDF

GaitEdge: Beyond Plain End-to-End Gait Recognition for Better Practicality Junhao Liang, Chao Fan, Saihui Hou, Chuanfu Shen, Yongzhen Huang, Shiqi Yu

PDF

GALA: Toward Geometry-and-Lighting-Aware Object Search for Compositing Sijie Zhu, Zhe Lin, Scott Cohen, Jason Kuen, Zhifei Zhang, Chen Chen

PDF

GAMa: Cross-View Video Geo-Localization Shruti Vyas, Chen Chen, Mubarak Shah

PDF

GAN Cocktail: Mixing GANs Without Dataset Access Omri Avrahami, Dani Lischinski, Ohad Fried

PDF

GAN with Multivariate Disentangling for Controllable Hair Editing Xuyang Guo, Meina Kan, Tianle Chen, Shiguang Shan

PDF

Gaussian Activated Neural Radiance Fields for High Fidelity Reconstruction & Pose Estimation Shin-Fang Chng, Sameera Ramasinghe, Jamie Sherrah, Simon Lucey

PDF

GCISG: Guided Causal Invariant Learning for Improved Syn-to-Real Generalization Gilhyun Nam, Gyeongjae Choi, Kyungmin Lee

PDF

GEB+: A Benchmark for Generic Event Boundary Captioning, Grounding and Retrieval Yuxuan Wang, Difei Gao, Licheng Yu, Weixian Lei, Matt Feiszli, Mike Zheng Shou

PDF

Gen6D: Generalizable Model-Free 6-DoF Object Pose Estimation from RGB Images Yuan Liu, Yilin Wen, Sida Peng, Cheng Lin, Xiaoxiao Long, Taku Komura, Wenping Wang

PDF

General Object Pose Transformation Network from Unpaired Data Yukun Su, Guosheng Lin, Ruizhou Sun, Qingyao Wu

PDF

Generalizable Medical Image Segmentation via Random Amplitude Mixup and Domain-Specific Image Restoration Ziqi Zhou, Lei Qi, Yinghuan Shi

PDF

Generalizable Patch-Based Neural Rendering Mohammed Suhail, Carlos Esteves, Leonid Sigal, Ameesh Makadia

PDF

Generalized Brain Image Synthesis with Transferable Convolutional Sparse Coding Networks Yawen Huang, Feng Zheng, Xu Sun, Yuexiang Li, Ling Shao, Yefeng Zheng

PDF

Generating Natural Images with Direct Patch Distributions Matching Ariel Elnekave, Yair Weiss

PDF

Generative Adversarial Network for Future Hand Segmentation from Egocentric Video Wenqi Jia, Miao Liu, James M. Rehg

PDF

Generative Domain Adaptation for Face Anti-Spoofing Qianyu Zhou, Ke-Yue Zhang, Taiping Yao, Ran Yi, Kekai Sheng, Shouhong Ding, Lizhuang Ma

PDF

Generative Meta-Adversarial Network for Unseen Object Navigation Sixian Zhang, Weijie Li, Xinhang Song, Yubing Bai, Shuqiang Jiang

PDF

Generative Multiplane Images: Making a 2D GAN 3D-Aware Xiaoming Zhao, Fangchang Ma, David Güera, Zhile Ren, Alexander G. Schwing, Alex Colburn

PDF

Generative Negative Text Replay for Continual Vision-Language Pretraining Shipeng Yan, Lanqing Hong, Hang Xu, Jianhua Han, Tinne Tuytelaars, Zhenguo Li, Xuming He

PDF

Generative Subgraph Contrast for Self-Supervised Graph Representation Learning Yuehui Han, Le Hui, Haobo Jiang, Jianjun Qian, Jin Xie

PDF

Generator Knows What Discriminator Should Learn in Unconditional GANs Gayoung Lee, Hyunsu Kim, Junho Kim, Seonghyeon Kim, Jung-Woo Ha, Yunjey Choi

PDF

GeoAug: Data Augmentation for Few-Shot NeRF with Geometry Constraints Di Chen, Yu Liu, Lianghua Huang, Bin Wang, Pan Pan

PDF

Geodesic-Former: A Geodesic-Guided Few-Shot 3D Point Cloud Instance Segmenter Tuan Ngo, Khoi Nguyen

PDF

Geometric Features Informed Multi-Person Human-Object Interaction Recognition in Videos Tanqiu Qiao, Qianhui Men, Frederick W. B. Li, Yoshiki Kubotani, Shigeo Morishima, Hubert P. H. Shum

PDF

Geometric Representation Learning for Document Image Rectification Hao Feng, Wengang Zhou, Jiajun Deng, Yuechen Wang, Houqiang Li

PDF

Geometry-Aware Single-Image Full-Body Human Relighting Chaonan Ji, Tao Yu, Kaiwen Guo, Jingxin Liu, Yebin Liu

PDF

Geometry-Guided Progressive NeRF for Generalizable and Efficient Neural Human Rendering Mingfei Chen, Jianfeng Zhang, Xiangyu Xu, Lijuan Liu, Yujun Cai, Jiashi Feng, Shuicheng Yan

PDF

GeoRefine: Self-Supervised Online Depth Refinement for Accurate Dense Mapping Pan Ji, Qingan Yan, Yuxin Ma, Yi Xu

PDF

Ghost-Free High Dynamic Range Imaging with Context-Aware Transformer Zhen Liu, Yinglong Wang, Bing Zeng, Shuaicheng Liu

PDF

GigaDepth: Learning Depth from Structured Light with Branching Neural Networks Simon Schreiberhuber, Jean-Baptiste Weibel, Timothy Patten, Markus Vincze

PDF

GIMO: Gaze-Informed Human Motion Prediction in Context Yang Zheng, Yanchao Yang, Kaichun Mo, Jiaman Li, Tao Yu, Yebin Liu, Karen Liu, Leonidas J. Guibas

PDF

GIPSO: Geometrically Informed Propagation for Online Adaptation in 3D LiDAR Segmentation Cristiano Saltori, Evgeny Krivosheev, Stéphane Lathuilière, Nicu Sebe, Fabio Galasso, Giuseppe Fiameni, Elisa Ricci, Fabio Poiesi

PDF

GitNet: Geometric Prior-Based Transformation for Birds-Eye-View Segmentation Shi Gong, Xiaoqing Ye, Xiao Tan, Jingdong Wang, Errui Ding, Yu Zhou, Xiang Bai

PDF

GLAMD: Global and Local Attention Mask Distillation for Object Detectors Younho Jang, Wheemyung Shin, Jinbeom Kim, Simon Woo, Sung-Ho Bae

PDF

GLASS: Global to Local Attention for Scene-Text Spotting Roi Ronen, Shahar Tsiper, Oron Anschel, Inbal Lavi, Amir Markovitz, R. Manmatha

PDF

Global Spectral Filter Memory Network for Video Object Segmentation Yong Liu, Ran Yu, Jiahao Wang, Xinyuan Zhao, Yitong Wang, Yansong Tang, Yujiu Yang

PDF

Global-Local Motion Transformer for Unsupervised Skeleton-Based Action Learning Boeun Kim, Hyung Jin Chang, Jungho Kim, Jin Young Choi

PDF

GOCA: Guided Online Cluster Assignment for Self-Supervised Video Representation Learning Huseyin Coskun, Alireza Zareian, Joshua L. Moore, Federico Tombari, Chen Wang

PDF

GradAuto: Energy-Oriented Attack on Dynamic Neural Networks Jianhong Pan, Qichen Zheng, Zhipeng Fan, Hossein Rahmani, Qiuhong Ke, Jun Liu

PDF

Gradient-Based Uncertainty for Monocular Depth Estimation Julia Hornauer, Vasileios Belagiannis

PDF

Granularity-Aware Adaptation for Image Retrieval over Multiple Tasks Jon Almazán, Byungsoo Ko, Geonmo Gu, Diane Larlus, Yannis Kalantidis

PDF

Graph Neural Network for Cell Tracking in Microscopy Videos Tal Ben-Haim, Tammy Riklin Raviv

PDF

Graph R-CNN: Towards Accurate 3D Object Detection with Semantic-Decorated Local Graph Honghui Yang, Zili Liu, Xiaopei Wu, Wenxiao Wang, Wei Qian, Xiaofei He, Deng Cai

PDF

Graph-Constrained Contrastive Regularization for Semi-Weakly Volumetric Segmentation Simon Reiß, Constantin Seibold, Alexander Freytag, Erik Rodner, Rainer Stiefelhagen

PDF

GraphCSPN: Geometry-Aware Depth Completion via Dynamic GCNs Xin Liu, Xiaofei Shao, Bo Wang, Yali Li, Shengjin Wang

PDF

GraphFit: Learning Multi-Scale Graph-Convolutional Representation for Point Cloud Normal Estimation Keqiang Li, Mingyang Zhao, Huaiyu Wu, Dong-Ming Yan, Zhen Shen, Fei-Yue Wang, Gang Xiong

PDF

GraphVid: It Only Takes a Few Nodes to Understand a Video Eitan Kosman, Dotan Di Castro

PDF

Grasp’D: Differentiable Contact-Rich Grasp Synthesis for Multi-Fingered Hands Dylan Turpin, Liquan Wang, Eric Heiden, Yun-Chun Chen, Miles Macklin, Stavros Tsogkas, Sven Dickinson, Animesh Garg

PDF

GRIT-VLP: Grouped Mini-Batch Sampling for Efficient Vision and Language Pre-Training Jaeseok Byun, Taebaek Hwang, Jianlong Fu, Taesup Moon

PDF

GRIT: Faster and Better Image Captioning Transformer Using Dual Visual Features Van-Quang Nguyen, Masanori Suganuma, Takayuki Okatani

PDF

Grounding Visual Representations with Texts for Domain Generalization Seonwoo Min, Nokyung Park, Siwon Kim, Seunghyun Park, Jinkyu Kim

PDF

GTCaR: Graph Transformer for Camera Re-Localization Xinyi Li, Haibin Ling

PDF

HairNet: Hairstyle Transfer with Pose Changes Peihao Zhu, Rameen Abdal, John Femiani, Peter Wonka

PDF

Hallucinating Pose-Compatible Scenes Tim Brooks, Alexei A. Efros

PDF

Hardly Perceptible Trojan Attack Against Neural Networks with Bit Flips Jiawang Bai, Kuofeng Gao, Dihong Gong, Shu-Tao Xia, Zhifeng Li, Wei Liu

PDF

Harmonizer: Learning to Perform White-Box Image and Video Harmonization Zhanghan Ke, Chunyi Sun, Lei Zhu, Ke Xu, Rynson W.H. Lau

PDF

HDR-Plenoxels: Self-Calibrating High Dynamic Range Radiance Fields Kim Jun-Seong, Kim Yu-Ji, Moon Ye-Bin, Tae-Hyun Oh

PDF

HEAD: HEtero-Assists Distillation for Heterogeneous Object Detectors Luting Wang, Xiaojie Li, Yue Liao, Zeren Jiang, Jianlong Wu, Fei Wang, Chen Qian, Si Liu

PDF

Helpful or Harmful: Inter-Task Association in Continual Learning Hyundong Jin, Eunwoo Kim

PDF

Hierarchical Average Precision Training for Pertinent Image Retrieval Elias Ramzi, Nicolas Audebert, Nicolas Thome, Clément Rambour, Xavier Bitot

PDF

Hierarchical Contrastive Inconsistency Learning for Deepfake Video Detection Zhihao Gu, Taiping Yao, Yang Chen, Shouhong Ding, Lizhuang Ma

PDF

Hierarchical Feature Alignment Network for Unsupervised Video Object Segmentation Gensheng Pei, Fumin Shen, Yazhou Yao, Guo-Sen Xie, Zhenmin Tang, Jinhui Tang

PDF

Hierarchical Feature Embedding for Visual Tracking Zhixiong Pi, Weitao Wan, Chong Sun, Changxin Gao, Nong Sang, Chen Li

PDF

Hierarchical Latent Structure for Multi-Modal Vehicle Trajectory Forecasting Dooseop Choi, KyoungWook Min

PDF

Hierarchical Memory Learning for Fine-Grained Scene Graph Generation Youming Deng, Yansheng Li, Yongjun Zhang, Xiang Xiang, Jian Wang, Jingdong Chen, Jiayi Ma

PDF

Hierarchical Semantic Regularization of Latent Spaces in StyleGANs Tejan Karmali, Rishubh Parihar, Susmit Agrawal, Harsh Rangwani, Varun Jampani, Maneesh Singh, R. Venkatesh Babu

PDF

Hierarchical Semi-Supervised Contrastive Learning for Contamination-Resistant Anomaly Detection Gaoang Wang, Yibing Zhan, Xinchao Wang, Mingli Song, Klara Nahrstedt

PDF

Hierarchically Self-Supervised Transformer for Human Skeleton Representation Learning Yuxiao Chen, Long Zhao, Jianbo Yuan, Yu Tian, Zhaoyang Xia, Shijie Geng, Ligong Han, Dimitris N. Metaxas

PDF

High-Fidelity GAN Inversion with Padding Space Qingyan Bai, Yinghao Xu, Jiapeng Zhu, Weihao Xia, Yujiu Yang, Yujun Shen

PDF

High-Fidelity Image Inpainting with GAN Inversion Yongsheng Yu, Libo Zhang, Heng Fan, Tiejian Luo

PDF

High-Resolution Virtual Try-on with Misalignment and Occlusion-Handled Conditions Sangyun Lee, Gyojung Gu, Sunghyun Park, Seunghwan Choi, Jaegul Choo

PDF

Highly Accurate Dichotomous Image Segmentation Xuebin Qin, Hang Dai, Xiaobin Hu, Deng-Ping Fan, Ling Shao, Luc Van Gool

PDF

HIVE: Evaluating the Human Interpretability of Visual Explanations Sunnie S. Y. Kim, Nicole Meister, Vikram V. Ramaswamy, Ruth Fong, Olga Russakovsky

PDF

HM: Hybrid Masking for Few-Shot Segmentation Seonghyeon Moon, Samuel S. Sohn, Honglu Zhou, Sejong Yoon, Vladimir Pavlovic, Muhammad Haris Khan, Mubbasir Kapadia

PDF

Homogeneous Multi-Modal Feature Fusion and Interaction for 3D Object Detection Xin Li, Botian Shi, Yuenan Hou, Xingjiao Wu, Tianlong Ma, Yikang Li, Liang He

PDF

Hourglass Attention Network for Image Inpainting Ye Deng, Siqi Hui, Rongye Meng, Sanping Zhou, Jinjun Wang

PDF

Housekeep: Tidying Virtual Households Using Commonsense Reasoning Yash Kant, Arun Ramachandran, Sriram Yenamandra, Igor Gilitschenski, Dhruv Batra, Andrew Szot, Harsh Agrawal

PDF

How Severe Is Benchmark-Sensitivity in Video Self-Supervised Learning? Fida Mohammad Thoker, Hazel Doughty, Piyush Bagad, Cees G. M. Snoek

PDF

How Stable Are Transferability Metrics Evaluations? Andrea Agostinelli, Michal Pándy, Jasper Uijlings, Thomas Mensink, Vittorio Ferrari

PDF

How to Synthesize a Large-Scale and Trainable Micro-Expression Dataset? Yuchi Liu, Zhongdao Wang, Tom Gedeon, Liang Zheng

PDF

HRDA: Context-Aware High-Resolution Domain-Adaptive Semantic Segmentation Lukas Hoyer, Dengxin Dai, Luc Van Gool

PDF

HULC: 3D HUman Motion Capture with Pose Manifold SampLing and Dense Contact Guidance Soshi Shimada, Vladislav Golyanik, Zhi Li, Patrick Pérez, Weipeng Xu, Christian Theobalt

PDF

Human Trajectory Prediction via Neural Social Physics Jiangbei Yue, Dinesh Manocha, He Wang

PDF

Human-Centric Image Cropping with Partition-Aware and Content-Preserving Features Bo Zhang, Li Niu, Xing Zhao, Liqing Zhang

PDF

HuMMan: Multi-Modal 4D Human Dataset for Versatile Sensing and Modeling Zhongang Cai, Daxuan Ren, Ailing Zeng, Zhengyu Lin, Tao Yu, Wenjia Wang, Xiangyu Fan, Yang Gao, Yifan Yu, Liang Pan, Fangzhou Hong, Mingyuan Zhang, Chen Change Loy, Lei Yang, Ziwei Liu

PDF

Hunting Group Clues with Transformers for Social Group Activity Recognition Masato Tamura, Rahul Vishwakarma, Ravigopal Vennelakanti

PDF

HVC-Net: Unifying Homography, Visibility, and Confidence Learning for Planar Object Tracking Haoxian Zhang, Yonggen Ling

PDF

Hyperspherical Learning in Multi-Label Classification Bo Ke, Yunquan Zhu, Mengtian Li, Xiujun Shu, Ruizhi Qiao, Bo Ren

PDF

IDa-Det: An Information Discrepancy-Aware Distillation for 1-Bit Detectors Sheng Xu, Yanjing Li, Bohan Zeng, Teli Ma, Baochang Zhang, Xianbin Cao, Peng Gao, Jinhu Lü

PDF

Identifying Hard Noise in Long-Tailed Sample Distribution Xuanyu Yi, Kaihua Tang, Xian-Sheng Hua, Joo-Hwee Lim, Hanwang Zhang

PDF

Identity-Aware Hand Mesh Estimation and Personalization from RGB Images Deying Kong, Linguang Zhang, Liangjian Chen, Haoyu Ma, Xiangyi Yan, Shanlin Sun, Xingwei Liu, Kun Han, Xiaohui Xie

PDF

IGFormer: Interaction Graph Transformer for Skeleton-Based Human Interaction Recognition Yunsheng Pang, Qiuhong Ke, Hossein Rahmani, James Bailey, Jun Liu

PDF

Image Coding for Machines with Omnipotent Feature Learning Ruoyu Feng, Xin Jin, Zongyu Guo, Runsen Feng, Yixin Gao, Tianyu He, Zhizheng Zhang, Simeng Sun, Zhibo Chen

PDF

Image Inpainting with Cascaded Modulation GAN and Object-Aware Training Haitian Zheng, Zhe Lin, Jingwan Lu, Scott Cohen, Eli Shechtman, Connelly Barnes, Jianming Zhang, Ning Xu, Sohrab Amirghodsi, Jiebo Luo

PDF

Image Super-Resolution with Deep Dictionary Shunta Maeda

PDF

Image-Based CLIP-Guided Essence Transfer Hila Chefer, Sagie Benaim, Roni Paiss, Lior Wolf

PDF

Image2Point: 3D Point-Cloud Understanding with 2D Image Pretrained Models Chenfeng Xu, Shijia Yang, Tomer Galanti, Bichen Wu, Xiangyu Yue, Bohan Zhai, Wei Zhan, Peter Vajda, Kurt Keutzer, Masayoshi Tomizuka

PDF

Implicit Field Supervision for Robust Non-Rigid Shape Matching Ramana Sundararaman, Gautam Pai, Maks Ovsjanikov

PDF

Implicit Neural Representations for Image Compression Yannick Strümpler, Janis Postels, Ren Yang, Luc Van Gool, Federico Tombari

PDF

Implicit Neural Representations for Variable Length Human Motion Generation Pablo Cervantes, Yusuke Sekikawa, Ikuro Sato, Koichi Shinoda

PDF

Improved Masked Image Generation with Token-Critic José Lezama, Huiwen Chang, Lu Jiang, Irfan Essa

PDF

Improving Adversarial Robustness of 3D Point Cloud Classification Models Guanlin Li, Guowen Xu, Han Qiu, Ruan He, Jiwei Li, Tianwei Zhang

PDF

Improving Closed and Open-Vocabulary Attribute Prediction Using Transformers Khoi Pham, Kushal Kafle, Zhe Lin, Zhihong Ding, Scott Cohen, Quan Tran, Abhinav Shrivastava

PDF

Improving Covariance Conditioning of the SVD Meta-Layer by Orthogonality Yue Song, Nicu Sebe, Wei Wang

PDF

Improving Few-Shot Learning Through Multi-Task Representation Learning Theory Quentin Bouniot, Ievgen Redko, Romaric Audigier, Angélique Loesch, Amaury Habrard

PDF

Improving Few-Shot Part Segmentation Using Coarse Supervision Oindrila Saha, Zezhou Cheng, Subhransu Maji

PDF

Improving Fine-Grained Visual Recognition in Low Data Regimes via Self-Boosting Attention Mechanism Yangyang Shu, Baosheng Yu, Haiming Xu, Lingqiao Liu

PDF

Improving GANs for Long-Tailed Data Through Group Spectral Regularization Harsh Rangwani, Naman Jaswani, Tejan Karmali, Varun Jampani, R. Venkatesh Babu

PDF

Improving Generalization in Federated Learning by Seeking Flat Minima Debora Caldarola, Barbara Caputo, Marco Ciccone

PDF

Improving Image Restoration by Revisiting Global Information Aggregation Xiaojie Chu, Liangyu Chen, Chengpeng Chen, Xin Lu

PDF

Improving RGB-D Point Cloud Registration by Learning Multi-Scale Local Linear Transformation Ziming Wang, Xiaoliang Huo, Zhenghao Chen, Jing Zhang, Lu Sheng, Dong Xu

PDF

Improving Robustness by Enhancing Weak Subnets Yong Guo, David Stutz, Bernt Schiele

PDF

Improving Self-Supervised Lightweight Model Learning via Hard-Aware Metric Distillation Hao Liu, Mang Ye

PDF

Improving Test-Time Adaptation via Shift-Agnostic Weight Regularization and Nearest Source Prototypes Sungha Choi, Seunghan Yang, Seokeon Choi, Sungrack Yun

PDF

Improving the Intra-Class Long-Tail in 3D Detection via Rare Example Mining Chiyu Max Jiang, Mahyar Najibi, Charles R. Qi, Yin Zhou, Dragomir Anguelov

PDF

Improving the Perceptual Quality of 2D Animation Interpolation Shuhong Chen, Matthias Zwicker

PDF

Improving the Reliability for Confidence Estimation Haoxuan Qu, Yanchao Li, Lin Geng Foo, Jason Kuen, Jiuxiang Gu, Jun Liu

PDF

Improving Vision Transformers by Revisiting High-Frequency Components Jiawang Bai, Li Yuan, Shu-Tao Xia, Shuicheng Yan, Zhifeng Li, Wei Liu

PDF

In Defense of Image Pre-Training for Spatiotemporal Recognition Xianhang Li, Huiyu Wang, Chen Wei, Jieru Mei, Alan Yuille, Yuyin Zhou, Cihang Xie

PDF

In Defense of Online Models for Video Instance Segmentation Junfeng Wu, Qihao Liu, Yi Jiang, Song Bai, Alan Yuille, Xiang Bai

PDF

InAction: Interpretable Action Decision Making for Autonomous Driving Taotao Jing, Haifeng Xia, Renran Tian, Haoran Ding, Xiao Luo, Joshua Domeyer, Rini Sherony, Zhengming Ding

PDF

incDFM: Incremental Deep Feature Modeling for Continual Novelty Detection Amanda Rios, Nilesh Ahuja, Ibrahima Ndiour, Utku Genc, Laurent Itti, Omesh Tickoo

PDF

Incomplete Multi-View Domain Adaptation via Channel Enhancement and Knowledge Transfer Haifeng Xia, Pu Wang, Zhengming Ding

PDF

Incremental Task Learning with Incremental Rank Updates Rakib Hyder, Ken Shao, Boyu Hou, Panos Markopoulos, Ashley Prater-Bennette, M. Salman Asif

PDF

Inductive and Transductive Few-Shot Video Classification via Appearance and Temporal Alignments Khoi D. Nguyen, Quoc-Huy Tran, Khoi Nguyen, Binh-Son Hua, Rang Nguyen

PDF

InfiniteNature-Zero: Learning Perpetual View Generation of Natural Scenes from Single Images Zhengqi Li, Qianqian Wang, Noah Snavely, Angjoo Kanazawa

PDF

Initialization and Alignment for Adversarial Texture Optimization Xiaoming Zhao, Zhizhen Zhao, Alexander G. Schwing

PDF

Injecting 3D Perception of Controllable NeRF-GAN into StyleGAN for Editable Portrait Image Synthesis Jeong-gi Kwak, Yuanming Li, Dongsik Yoon, Donghyeon Kim, David Han, Hanseok Ko

PDF

Inpainting at Modern Camera Resolution by Guided PatchMatch with Auto-Curation Lingzhi Zhang, Connelly Barnes, Kevin Wampler, Sohrab Amirghodsi, Eli Shechtman, Zhe Lin, Jianbo Shi

PDF

Instance as Identity: A Generic Online Paradigm for Video Instance Segmentation Feng Zhu, Zongxin Yang, Xin Yu, Yi Yang, Yunchao Wei

PDF

Instance Contour Adjustment via Structure-Driven CNN Shuchen Weng, Yi Wei, Ming-Ching Chang, Boxin Shi

PDF

INT: Towards Infinite-Frames 3D Detection with an Efficient Framework Jianyun Xu, Zhenwei Miao, Da Zhang, Hongyu Pan, Kaixuan Liu, Peihan Hao, Jun Zhu, Zhengyang Sun, Hongmin Li, Xin Zhan

PDF

IntegratedPIFu: Integrated Pixel Aligned Implicit Function for Single-View Human Reconstruction Kennard Yanting Chan, Guosheng Lin, Haiyu Zhao, Weisi Lin

PDF

Intelli-Paint: Towards Developing More Human-Intelligible Painting Agents Jaskirat Singh, Cameron Smith, Jose Echevarria, Liang Zheng

PDF

Interclass Prototype Relation for Few-Shot Segmentation Atsuro Okazawa

PDF

IntereStyle: Encoding an Interest Region for Robust StyleGAN Inversion Seung-Jun Moon, Gyeong-Moon Park

PDF

Interpretable Image Classification with Differentiable Prototypes Assignment Dawid Rymarczyk, Łukasz Struski, Michał Górszczak, Koryna Lewandowska, Jacek Tabor, Bartosz Zieliński

PDF

Interpretable Open-Set Domain Adaptation via Angular Margin Separation Xinhao Li, Jingjing Li, Zhekai Du, Lei Zhu, Wen Li

PDF

Interpretations Steered Network Pruning via Amortized Inferred Saliency Maps Alireza Ganjdanesh, Shangqian Gao, Heng Huang

PDF

Intrinsic Neural Fields: Learning Functions on Manifolds Lukas Koestler, Daniel Grittner, Michael Moeller, Daniel Cremers, Zorah Lähner

PDF

Invariant Feature Learning for Generalized Long-Tailed Classification Kaihua Tang, Mingyuan Tao, Jiaxin Qi, Zhenguang Liu, Hanwang Zhang

PDF

Inverted Pyramid Multi-Task Transformer for Dense Scene Understanding Hanrong Ye, Dan Xu

PDF

Is Appearance Free Action Recognition Possible? Filip Ilic, Thomas Pock, Richard P. Wildes

PDF

Is Geometry Enough for Matching in Visual Localization? Qunjie Zhou, Sérgio Agostinho, Aljoša Ošep, Laura Leal-Taixé

PDF

Is It Necessary to Transfer Temporal Knowledge for Domain Adaptive Video Semantic Segmentation? Xinyi Wu, Zhenyao Wu, Jin Wan, Lili Ju, Song Wang

PDF

IS-MVSNet: Importance Sampling-Based MVSNet Likang Wang, Yue Gong, Xinjun Ma, Qirui Wang, Kaixuan Zhou, Lei Chen

PDF

Iwin: Human-Object Interaction Detection via Transformer with Irregular Windows Danyang Tu, Xiongkuo Min, Huiyu Duan, Guodong Guo, Guangtao Zhai, Wei Shen

PDF

Joint Feature Learning and Relation Modeling for Tracking: A One-Stream Framework Botao Ye, Hong Chang, Bingpeng Ma, Shiguang Shan, Xilin Chen

PDF

Joint Learning of Localized Representations from Medical Images and Reports Philip Müller, Georgios Kaissis, Congyu Zou, Daniel Rueckert

PDF

Joint-Modal Label Denoising for Weakly-Supervised Audio-Visual Video Parsing Haoyue Cheng, Zhaoyang Liu, Hang Zhou, Chen Qian, Wayne Wu, Limin Wang

PDF

JoJoGAN: One Shot Face Stylization Min Jin Chong, David Forsyth

PDF

JPEG Artifacts Removal via Contrastive Representation Learning Xi Wang, Xueyang Fu, Yurui Zhu, Zheng-Jun Zha

PDF

JPerceiver: Joint Perception Network for Depth, Pose and Layout Estimation in Driving Scenes Haimei Zhao, Jing Zhang, Sen Zhang, Dacheng Tao

PDF

K-Centered Patch Sampling for Efficient Video Recognition Seong Hyeon Park, Jihoon Tack, Byeongho Heo, Jung-Woo Ha, Jinwoo Shin

PDF

K-Means Mask Transformer Qihang Yu, Huiyu Wang, Siyuan Qiao, Maxwell Collins, Yukun Zhu, Hartwig Adam, Alan Yuille, Liang-Chieh Chen

PDF

K-SALSA: K-Anonymous Synthetic Averaging of Retinal Images via Local Style Alignment Minkyu Jeon, Hyeonjin Park, Hyunwoo J. Kim, Michael Morley, Hyunghoon Cho

PDF

KD-MVS: Knowledge Distillation Based Self-Supervised Learning for Multi-View Stereo Yikang Ding, Qingtian Zhu, Xiangyue Liu, Wentao Yuan, Haotian Zhang, Chi Zhang

PDF

Kernel Relative-Prototype Spectral Filtering for Few-Shot Learning Tao Zhang, Wu Huang

PDF

KeypointNeRF: Generalizing Image-Based Volumetric Avatars Using Relative Spatial Encoding of Keypoints Marko Mihajlovic, Aayush Bansal, Michael Zollhöfer, Siyu Tang, Shunsuke Saito

PDF

KING: Generating Safety-Critical Driving Scenarios for Robust Imitation via Kinematics Gradients Niklas Hanselmann, Katrin Renz, Kashyap Chitta, Apratim Bhattacharyya, Andreas Geiger

PDF

Knowledge Condensation Distillation Chenxin Li, Mingbao Lin, Zhiyuan Ding, Nie Lin, Yihong Zhuang, Yue Huang, Xinghao Ding, Liujuan Cao

PDF

KVT: k-NN Attention for Boosting Vision Transformers Pichao Wang, Xue Wang, Fan Wang, Ming Lin, Shuning Chang, Hao Li, Rong Jin

PDF

KXNet: A Model-Driven Deep Neural Network for Blind Super-Resolution Jiahong Fu, Hong Wang, Qi Xie, Qian Zhao, Deyu Meng, Zongben Xu

PDF

L-CoDer: Language-Based Colorization with Color-Object Decoupling Transformer Zheng Chang, Shuchen Weng, Yu Li, Si Li, Boxin Shi

PDF

L-Tracing: Fast Light Visibility Estimation on Neural Surfaces by Sphere Tracing Ziyu Chen, Chenjing Ding, Jianfei Guo, Dongliang Wang, Yikang Li, Xuan Xiao, Wei Wu, Li Song

PDF

L∞-Robustness and Beyond: Unleashing Efficient Adversarial Training Hadi M. Dolatabadi, Sarah Erfani, Christopher Leckie

PDF

L3: Accelerator-Friendly Lossless Image Format for High-Resolution, High-Throughput DNN Training Jonghyun Bae, Woohyeon Baek, Tae Jun Ham, Jae W. Lee

PDF

LA3: Efficient Label-Aware AutoAugment Mingjun Zhao, Shan Lu, Zixuan Wang, Xiaoli Wang, Di Niu

PDF

Label-Guided Auxiliary Training Improves 3D Object Detector Yaomin Huang, Xinmei Liu, Yichen Zhu, Zhiyuan Xu, Chaomin Shen, Zhengping Che, Guixu Zhang, Yaxin Peng, Feifei Feng, Jian Tang

PDF

Label2Label: A Language Modeling Framework for Multi-Attribute Learning Wanhua Li, Zhexuan Cao, Jianjiang Feng, Jie Zhou, Jiwen Lu

PDF

LaLaLoc++: Global Floor Plan Comprehension for Layout Localisation in Unvisited Environments Henry Howard-Jenkins, Victor Adrian Prisacariu

PDF

LaMAR: Benchmarking Localization and Mapping for Augmented Reality Paul-Edouard Sarlin, Mihai Dusmanu, Johannes L. Schönberger, Pablo Speciale, Lukas Gruber, Viktor Larsson, Ondrej Miksik, Marc Pollefeys

PDF

LANA: Latency Aware Network Acceleration Pavlo Molchanov, Jimmy Hall, Hongxu Yin, Jan Kautz, Nicolo Fusi, Arash Vahdat

PDF

Lane Detection Transformer Based on Multi-Frame Horizontal and Vertical Attention and Visual Transformer Module Han Zhang, Yunchao Gu, Xinliang Wang, Junjun Pan, Minghui Wang

PDF

Language Matters: A Weakly Supervised Vision-Language Pre-Training Approach for Scene Text Detection and Spotting Chuhui Xue, Wenqing Zhang, Yu Hao, Shijian Lu, Philip H. S. Torr, Song Bai

PDF

Language-Driven Artistic Style Transfer Tsu-Jui Fu, Xin Eric Wang, William Yang Wang

PDF

Language-Grounded Indoor 3D Semantic Segmentation in the Wild Dávid Rozenberszki, Or Litany, Angela Dai

PDF

Laplacian Mesh Transformer: Dual Attention and Topology Aware Network for 3D Mesh Classification and Segmentation Xiao-Juan Li, Jie Yang, Fang-Lue Zhang

PDF

Large Scale Real-World Multi-Person Tracking Bing Shuai, Alessandro Bergamo, Uta Büchler, Andrew Berneshawi, Alyssa Boden, Joseph Tighe

PDF

Large-Displacement 3D Object Tracking with Hybrid Non-Local Optimization Xuhui Tian, Xinran Lin, Fan Zhong, Xueying Qin

PDF

Latency-Aware Collaborative Perception Zixing Lei, Shunli Ren, Yue Hu, Wenjun Zhang, Siheng Chen

PDF

Latent Discriminant Deterministic Uncertainty Gianni Franchi, Xuanlong Yu, Andrei Bursuc, Emanuel Aldea, Severine Dubuisson, David Filliat

PDF

Latent Partition Implicit with Surface Codes for 3D Representation Chao Chen, Yu-Shen Liu, Zhizhong Han

PDF

Latent Space Smoothing for Individually Fair Representations Momchil Peychev, Anian Ruoss, Mislav Balunović, Maximilian Baader, Martin Vechev

PDF

LaTeRF: Label and Text Driven Object Radiance Fields Ashkan Mirzaei, Yash Kant, Jonathan Kelly, Igor Gilitschenski

PDF

Layered Controllable Video Generation Jiahui Huang, Yuhe Jin, Kwang Moo Yi, Leonid Sigal

PDF

Learn from All: Erasing Attention Consistency for Noisy Label Facial Expression Recognition Yuhang Zhang, Chengrui Wang, Xu Ling, Weihong Deng

PDF

Learn-to-Decompose: Cascaded Decomposition Network for Cross-Domain Few-Shot Facial Expression Recognition Xinyi Zou, Yan Yan, Jing-Hao Xue, Si Chen, Hanzi Wang

PDF

Learn2Augment: Learning to Composite Videos for Data Augmentation in Action Recognition Shreyank N Gowda, Marcus Rohrbach, Frank Keller, Laura Sevilla-Lara

PDF

Learned Monocular Depth Priors in Visual-Inertial Initialization Yunwen Zhou, Abhishek Kar, Eric Turner, Adarsh Kowdle, Chao X. Guo, Ryan C. DuToit, Konstantine Tsotsos

PDF

Learned Variational Video Color Propagation Markus Hofinger, Erich Kobler, Alexander Effland, Thomas Pock

PDF

Learned Vertex Descent: A New Direction for 3D Human Model Fitting Enric Corona, Gerard Pons-Moll, Guillem Alenyà, Francesc Moreno-Noguer

PDF

Learning Algebraic Representation for Systematic Generalization in Abstract Reasoning Chi Zhang, Sirui Xie, Baoxiong Jia, Ying Nian Wu, Song-Chun Zhu, Yixin Zhu

PDF

Learning an Isometric Surface Parameterization for Texture Unwrapping Sagnik Das, Ke Ma, Zhixin Shu, Dimitris Samaras

PDF

Learning Audio-Video Modalities from Image Captions Arsha Nagrani, Paul Hongsuck Seo, Bryan Seybold, Anja Hauth, Santiago Manen, Chen Sun, Cordelia Schmid

PDF

Learning Continuous Implicit Representation for Near-Periodic Patterns Bowei Chen, Tiancheng Zhi, Martial Hebert, Srinivasa G. Narasimhan

PDF

Learning Cross-Video Neural Representations for High-Quality Frame Interpolation Wentao Shangguan, Yu Sun, Weijie Gan, Ulugbek S. Kamilov

PDF

Learning Deep Non-Blind Image Deconvolution Without Ground Truths Yuhui Quan, Zhuojie Chen, Huan Zheng, Hui Ji

PDF

Learning Degradation Representations for Image Deblurring Dasong Li, Yi Zhang, Ka Chun Cheung, Xiaogang Wang, Hongwei Qin, Hongsheng Li

PDF

Learning Depth from Focus in the Wild Changyeon Won, Hae-Gon Jeon

PDF

Learning Discriminative Shrinkage Deep Networks for Image Deconvolution Pin-Hung Kuo, Jinshan Pan, Shao-Yi Chien, Ming-Hsuan Yang

PDF

Learning Disentanglement with Decoupled Labels for Vision-Language Navigation Wenhao Cheng, Xingping Dong, Salman Khan, Jianbing Shen

PDF

Learning Dynamic Facial Radiance Fields for Few-Shot Talking Head Synthesis Shuai Shen, Wanhua Li, Zheng Zhu, Yueqi Duan, Jie Zhou, Jiwen Lu

PDF

Learning Efficient Multi-Agent Cooperative Visual Exploration Chao Yu, Xinyi Yang, Jiaxuan Gao, Huazhong Yang, Yu Wang, Yi Wu

PDF

Learning Ego 3D Representation as Ray Tracing Jiachen Lu, Zheyuan Zhou, Xiatian Zhu, Hang Xu, Li Zhang

PDF

Learning Energy-Based Models with Adversarial Training Xuwang Yin, Shiying Li, Gustavo K. Rohde

PDF

Learning Extremely Lightweight and Robust Model with Differentiable Constraints on Sparsity and Condition Number Xian Wei, Yangyu Xu, Yanhui Huang, Hairong Lv, Hai Lan, Mingsong Chen, Xuan Tang

PDF

Learning from Multiple Annotator Noisy Labels via Sample-Wise Label Fusion Zhengqi Gao, Fan-Keng Sun, Mingran Yang, Sucheng Ren, Zikai Xiong, Marc Engeler, Antonio Burazer, Linda Wildling, Luca Daniel, Duane S. Boning

PDF

Learning from Unlabeled 3D Environments for Vision-and-Language Navigation Shizhe Chen, Pierre-Louis Guhur, Makarand Tapaswi, Cordelia Schmid, Ivan Laptev

PDF

Learning Graph Neural Networks for Image Style Transfer Yongcheng Jing, Yining Mao, Yiding Yang, Yibing Zhan, Mingli Song, Xinchao Wang, Dacheng Tao

PDF

Learning Hierarchy Aware Features for Reducing Mistake Severity Ashima Garg, Depanshu Sani, Saket Anand

PDF

Learning Implicit Feature Alignment Function for Semantic Segmentation Hanzhe Hu, Yinbo Chen, Jiarui Xu, Shubhankar Borse, Hong Cai, Fatih Porikli, Xiaolong Wang

PDF

Learning Implicit Templates for Point-Based Clothed Human Modeling Siyou Lin, Hongwen Zhang, Zerong Zheng, Ruizhi Shao, Yebin Liu

PDF

Learning Instance and Task-Aware Dynamic Kernels for Few-Shot Learning Rongkai Ma, Pengfei Fang, Gil Avraham, Yan Zuo, Tianyu Zhu, Tom Drummond, Mehrtash Harandi

PDF

Learning Instance-Specific Adaptation for Cross-Domain Segmentation Yuliang Zou, Zizhao Zhang, Chun-Liang Li, Han Zhang, Tomas Pfister, Jia-Bin Huang

PDF

Learning Invariant Visual Representations for Compositional Zero-Shot Learning Tian Zhang, Kongming Liang, Ruoyi Du, Xian Sun, Zhanyu Ma, Jun Guo

PDF

Learning Linguistic Association Towards Efficient Text-Video Retrieval Sheng Fang, Shuhui Wang, Junbao Zhuo, Xinzhe Han, Qingming Huang

PDF

Learning Local Implicit Fourier Representation for Image Warping Jaewon Lee, Kwang Pyo Choi, Kyong Hwan Jin

PDF

Learning Long-Term Spatial-Temporal Graphs for Active Speaker Detection Kyle Min, Sourya Roy, Subarna Tripathi, Tanaya Guha, Somdeb Majumdar

PDF

Learning Mutual Modulation for Self-Supervised Cross-Modal Super-Resolution Xiaoyu Dong, Naoto Yokoya, Longguang Wang, Tatsumi Uezato

PDF

Learning Object Placement via Dual-Path Graph Completion Siyuan Zhou, Liu Liu, Li Niu, Liqing Zhang

PDF

Learning Omnidirectional Flow in 360° Video via Siamese Representation Keshav Bhandari, Bin Duan, Gaowen Liu, Hugo Latapie, Ziliang Zong, Yan Yan

PDF

Learning Online Multi-Sensor Depth Fusion Erik Sandström, Martin R. Oswald, Suryansh Kumar, Silvan Weder, Fisher Yu, Cristian Sminchisescu, Luc Van Gool

PDF

Learning Pedestrian Group Representations for Multi-Modal Trajectory Prediction Inhwan Bae, Jin-Hwi Park, Hae-Gon Jeon

PDF

Learning Phase Mask for Privacy-Preserving Passive Depth Estimation Zaid Tasneem, Giovanni Milione, Yi-Hsuan Tsai, Xiang Yu, Ashok Veeraraghavan, Manmohan Chandraker, Francesco Pittaluga

PDF

Learning Prior Feature and Attention Enhanced Image Inpainting Chenjie Cao, Qiaole Dong, Yanwei Fu

PDF

Learning Quality-Aware Dynamic Memory for Video Object Segmentation Yong Liu, Ran Yu, Fei Yin, Xinyuan Zhao, Wei Zhao, Weihao Xia, Yujiu Yang

PDF

Learning Regional Purity for Instance Segmentation on 3D Point Clouds Shichao Dong, Guosheng Lin, Tzu-Yi Hung

PDF

Learning Self-Prior for Mesh Denoising Using Dual Graph Convolutional Networks Shota Hattori, Tatsuya Yatagawa, Yutaka Ohtake, Hiromasa Suzuki

PDF

Learning Semantic Correspondence with Sparse Annotations Shuaiyi Huang, Luyu Yang, Bo He, Songyang Zhang, Xuming He, Abhinav Shrivastava

PDF

Learning Semantic Segmentation from Multiple Datasets with Label Shifts Dongwan Kim, Yi-Hsuan Tsai, Yumin Suh, Masoud Faraki, Sparsh Garg, Manmohan Chandraker, Bohyung Han

PDF

Learning Series-Parallel Lookup Tables for Efficient Image Super-Resolution Cheng Ma, Jingyi Zhang, Jie Zhou, Jiwen Lu

PDF

Learning Shadow Correspondence for Video Shadow Detection Xinpeng Ding, Jingwen Yang, Xiaowei Hu, Xiaomeng Li

PDF

Learning Spatial-Preserved Skeleton Representations for Few-Shot Action Recognition Ning Ma, Hongyi Zhang, Xuhui Li, Sheng Zhou, Zhen Zhang, Jun Wen, Haifeng Li, Jingjun Gu, Jiajun Bu

PDF

Learning Spatio-Temporal Downsampling for Effective Video Upscaling Xiaoyu Xiang, Yapeng Tian, Vijay Rengarajan, Lucas D. Young, Bo Zhu, Rakesh Ranjan

PDF

Learning Spatiotemporal Frequency-Transformer for Compressed Video Super-Resolution Zhongwei Qiu, Huan Yang, Jianlong Fu, Dongmei Fu

PDF

Learning to Censor by Noisy Sampling Ayush Chopra, Abhinav Java, Abhishek Singh, Vivek Sharma, Ramesh Raskar

PDF

Learning to Detect Every Thing in an Open World Kuniaki Saito, Ping Hu, Trevor Darrell, Kate Saenko

PDF

Learning to Drive by Watching YouTube Videos: Action-Conditioned Contrastive Policy Pretraining Qihang Zhang, Zhenghao Peng, Bolei Zhou

PDF

Learning to Fit Morphable Models Vasileios Choutas, Federica Bogo, Jingjing Shen, Julien Valentin

PDF

Learning to Generate Realistic LiDAR Point Clouds Vlas Zyrianov, Xiyue Zhu, Shenlong Wang

PDF

Learning to Learn with Smooth Regularization Yuanhao Xiong, Cho-Jui Hsieh

PDF

Learning to Train a Point Cloud Reconstruction Network Without Matching Tianxin Huang, Xuemeng Yang, Jiangning Zhang, Jinhao Cui, Hao Zou, Jun Chen, Xiangrui Zhao, Yong Liu

PDF

Learning to Weight Samples for Dynamic Early-Exiting Networks Yizeng Han, Yifan Pu, Zihang Lai, Chaofei Wang, Shiji Song, Junfeng Cao, Wenhui Huang, Chao Deng, Gao Huang

PDF

Learning Topological Interactions for Multi-Class Medical Image Segmentation Saumya Gupta, Xiaoling Hu, James Kaan, Michael Jin, Mutshipay Mpoy, Katherine Chung, Gagandeep Singh, Mary Saltz, Tahsin Kurc, Joel Saltz, Apostolos Tassiopoulos, Prateek Prasanna, Chao Chen

PDF

Learning Unbiased Transferability for Domain Adaptation by Uncertainty Modeling Jian Hu, Haowen Zhong, Fei Yang, Shaogang Gong, Guile Wu, Junchi Yan

PDF

Learning Uncoupled-Modulation CVAE for 3D Action-Conditioned Human Motion Synthesis Chongyang Zhong, Lei Hu, Zihao Zhang, Shihong Xia

PDF

Learning Visibility for Robust Dense Human Body Estimation Chun-Han Yao, Jimei Yang, Duygu Ceylan, Yi Zhou, Yang Zhou, Ming-Hsuan Yang

PDF

Learning Visual Representation from Modality-Shared Contrastive Language-Image Pre-Training Haoxuan You, Luowei Zhou, Bin Xiao, Noel Codella, Yu Cheng, Ruochen Xu, Shih-Fu Chang, Lu Yuan

PDF

Learning Visual Styles from Audio-Visual Associations Tingle Li, Yichen Liu, Andrew Owens, Hang Zhao

PDF

Learning Where to Look – Generative NAS Is Surprisingly Efficient Jovita Lukasik, Steffen Jung, Margret Keuper

PDF

Learning with Free Object Segments for Long-Tailed Instance Segmentation Cheng Zhang, Tai-Yu Pan, Tianle Chen, Jike Zhong, Wenjin Fu, Wei-Lun Chao

PDF

Learning with Noisy Labels by Efficient Transition Matrix Estimation to Combat Label Miscorrection Seong Min Kye, Kwanghee Choi, Joonyoung Yi, Buru Chang

PDF

Learning with Recoverable Forgetting Jingwen Ye, Yifang Fu, Jie Song, Xingyi Yang, Songhua Liu, Xin Jin, Mingli Song, Xinchao Wang

PDF

Learning-Based Point Cloud Registration for 6d Object Pose Estimation in the Real World Zheng Dang, Lizhou Wang, Yu Guo, Mathieu Salzmann

PDF

LEDNet: Joint Low-Light Enhancement and Deblurring in the Dark Shangchen Zhou, Chongyi Li, Chen Change Loy

PDF

Less than Few: Self-Shot Video Instance Segmentation Pengwan Yang, Yuki M. Asano, Pascal Mettes, Cees G. M. Snoek

PDF

LESS: Label-Efficient Semantic Segmentation for LiDAR Point Clouds Minghua Liu, Yin Zhou, Charles R. Qi, Boqing Gong, Hao Su, Dragomir Anguelov

PDF

Levenshtein OCR Cheng Da, Peng Wang, Cong Yao

PDF

Leveraging Action Affinity and Continuity for Semi-Supervised Temporal Action Segmentation Guodong Ding, Angela Yao

PDF

LGV: Boosting Adversarial Example Transferability from Large Geometric Vicinity Martin Gubri, Maxime Cordy, Mike Papadakis, Yves Le Traon, Koushik Sen

PDF

LiDAL: Inter-Frame Uncertainty Based Active Learning for 3D LiDAR Semantic Segmentation Zeyu Hu, Xuyang Bai, Runze Zhang, Xin Wang, Guangyuan Sun, Hongbo Fu, Chiew-Lan Tai

PDF

LiDAR Distillation: Bridging the Beam-Induced Domain Gap for 3D Object Detection Yi Wei, Zibu Wei, Yongming Rao, Jiaxin Li, Jie Zhou, Jiwen Lu

PDF

LiDAR Point Cloud Guided Monocular 3D Object Detection Liang Peng, Fei Liu, Zhengxu Yu, Senbo Yan, Dan Deng, Zheng Yang, Haifeng Liu, Deng Cai

PDF

LidarNAS: Unifying and Searching Neural Architectures for 3D Point Clouds Chenxi Liu, Zhaoqi Leng, Pei Sun, Shuyang Cheng, Charles R. Qi, Yin Zhou, Mingxing Tan, Dragomir Anguelov

PDF

Lightweight Attentional Feature Fusion: A New Baseline for Text-to-Video Retrieval Fan Hu, Aozhu Chen, Ziyue Wang, Fangming Zhou, Jianfeng Dong, Xirong Li

PDF

LiP-Flow: Learning Inference-Time Priors for Codec Avatars via Normalizing Flows in Latent Space Emre Aksan, Shugao Ma, Akin Caliskan, Stanislav Pidhorskyi, Alexander Richard, Shih-En Wei, Jason Saragih, Otmar Hilliges

PDF

Lipschitz Continuity Retained Binary Neural Network Yuzhang Shang, Dan Xu, Bin Duan, Ziliang Zong, Liqiang Nie, Yan Yan

PDF

Local Color Distributions Prior for Image Enhancement Haoyuan Wang, Ke Xu, Rynson W.H. Lau

PDF

LocalBins: Improving Depth Estimation by Learning Local Distributions Shariq Farooq Bhat, Ibraheem Alhashim, Peter Wonka

PDF

Locality Guidance for Improving Vision Transformers on Tiny Datasets Kehan Li, Runyi Yu, Zhennan Wang, Li Yuan, Guoli Song, Jie Chen

PDF

Localizing Visual Sounds the Easy Way Shentong Mo, Pedro Morgado

PDF

Locally Varying Distance Transform for Unsupervised Visual Anomaly Detection Wen-Yan Lin, Zhonghang Liu, Siying Liu

PDF

LocVTP: Video-Text Pre-Training for Temporal Localization Meng Cao, Tianyu Yang, Junwu Weng, Can Zhang, Jue Wang, Yuexian Zou

PDF

Long Movie CLIP Classification with State-Space Video Models Md Mohaiminul Islam, Gedas Bertasius

PDF

Long Video Generation with Time-Agnostic VQGAN and Time-Sensitive Transformer Songwei Ge, Thomas Hayes, Harry Yang, Xi Yin, Guan Pang, David Jacobs, Jia-Bin Huang, Devi Parikh

PDF

Long-Tail Detection with Effective Class-Margins Jang Hyun Cho, Philipp Krähenbühl

PDF

Long-Tailed Class Incremental Learning Xialei Liu, Yu-Song Hu, Xu-Sheng Cao, Andrew D. Bagdanov, Ke Li, Ming-Ming Cheng

PDF

Long-Tailed Instance Segmentation Using Gumbel Optimized Loss Konstantinos Panagiotis Alexandridis, Jiankang Deng, Anh Nguyen, Shan Luo

PDF

Look Both Ways: Self-Supervising Driver Gaze Estimation and Road Scene Saliency Isaac Kasahara, Simon Stent, Hyun Soo Park

PDF

LoRD: Local 4D Implicit Representation for High-Fidelity Dynamic Human Modeling Boyan Jiang, Xinlin Ren, Mingsong Dou, Xiangyang Xue, Yanwei Fu, Yinda Zhang

PDF

LWGNet – Learned Wirtinger Gradients for Fourier Ptychographic Phase Retrieval Atreyee Saha, Salman S. Khan, Sagar Sehrawat, Sanjana S. Prabhu, Shanti Bhattacharya, Kaushik Mitra

PDF

MaCLR: Motion-Aware Contrastive Learning of Representations for Videos Fanyi Xiao, Joseph Tighe, Davide Modolo

PDF

Make-a-Scene: Scene-Based Text-to-Image Generation with Human Priors Oran Gafni, Adam Polyak, Oron Ashual, Shelly Sheynin, Devi Parikh, Yaniv Taigman

PDF

Making Heads or Tails: Towards Semantically Consistent Visual Counterfactuals Simon Vandenhende, Dhruv Mahajan, Filip Radenovic, Deepti Ghadiyaram

PDF

Making the Most of Text Semantics to Improve Biomedical Vision-Language Processing Benedikt Boecking, Naoto Usuyama, Shruthi Bannur, Daniel C. Castro, Anton Schwaighofer, Stephanie Hyland, Maria Wetscherek, Tristan Naumann, Aditya Nori, Javier Alvarez-Valle, Hoifung Poon, Ozan Oktay

PDF

ManiFest: Manifold Deformation for Few-Shot Image Translation Fabio Pizzati, Jean-François Lalonde, Raoul de Charette

PDF

Manifold Adversarial Learning for Cross-Domain 3D Shape Representation Hao Huang, Cheng Chen, Yi Fang

PDF

mAP-Free Visual Relocalization: Metric Pose Relative to a Single Image Eduardo Arnold, Jamie Wynn, Sara Vicente, Guillermo Garcia-Hernando, Aron Monszpart, Victor Prisacariu, Daniyar Turmukhambetov, Eric Brachmann

PDF

Masked Autoencoders for Point Cloud Self-Supervised Learning Yatian Pang, Wenxiao Wang, Francis E.H. Tay, Wei Liu, Yonghong Tian, Li Yuan

PDF

Masked Discrimination for Self-Supervised Learning on Point Clouds Haotian Liu, Mu Cai, Yong Jae Lee

PDF

Masked Generative Distillation Zhendong Yang, Zhe Li, Mingqi Shao, Dachuan Shi, Zehuan Yuan, Chun Yuan

PDF

Masked Siamese Networks for Label-Efficient Learning Mahmoud Assran, Mathilde Caron, Ishan Misra, Piotr Bojanowski, Florian Bordes, Pascal Vincent, Armand Joulin, Michael Rabbat, Nicolas Ballas

PDF

Master of All: Simultaneous Generalization of Urban-Scene Segmentation to All Adverse Weather Conditions Nikhil Reddy, Abhinav Singhal, Abhishek Kumar, Mahsa Baktashmotlagh, Chetan Arora

PDF

Max Pooling with Vision Transformers Reconciles Class and Shape in Weakly Supervised Semantic Segmentation Simone Rossetti, Damiano Zappia, Marta Sanzari, Marco Schaerf, Fiora Pirri

PDF

MaxViT: Multi-Axis Vision Transformer Zhengzhong Tu, Hossein Talebi, Han Zhang, Feng Yang, Peyman Milanfar, Alan Bovik, Yinxiao Li

PDF

Mc-BEiT: Multi-Choice Discretization for Image BERT Pre-Training Xiaotong Li, Yixiao Ge, Kun Yi, Zixuan Hu, Ying Shan, Ling-Yu Duan

PDF

Med-DANet: Dynamic Architecture Network for Efficient Medical Volumetric Segmentation Wenxuan Wang, Chen Chen, Jing Wang, Sen Zha, Yan Zhang, Jiangyun Li

PDF

MegBA: A GPU-Based Distributed Library for Large-Scale Bundle Adjustment Jie Ren, Wenteng Liang, Ran Yan, Luo Mai, Shiwen Liu, Xiao Liu

PDF

Memory-Augmented Model-Driven Network for Pansharpening Keyu Yan, Man Zhou, Li Zhang, Chengjun Xie

PDF

MemSAC: Memory Augmented Sample Consistency for Large Scale Domain Adaptation Tarun Kalluri, Astuti Sharma, Manmohan Chandraker

PDF

MENet: A Memory-Based Network with Dual-Branch for Efficient Event Stream Processing Linhui Sun, Yifan Zhang, Ke Cheng, Jian Cheng, Hanqing Lu

PDF

MeshLoc: Mesh-Based Visual Localization Vojtech Panek, Zuzana Kukelova, Torsten Sattler

PDF

MeshMAE: Masked Autoencoders for 3D Mesh Data Analysis Yaqian Liang, Shanshan Zhao, Baosheng Yu, Jing Zhang, Fazhi He

PDF

MeshUDF: Fast and Differentiable Meshing of Unsigned Distance Field Networks Benoît Guillard, Federico Stella, Pascal Fua

PDF

Meta Spatio-Temporal Debiasing for Video Scene Graph Generation Li Xu, Haoxuan Qu, Jason Kuen, Jiuxiang Gu, Jun Liu

PDF

Meta-GF: Training Dynamic-Depth Neural Networks Harmoniously Yi Sun, Jian Li, Xin Xu

PDF

Meta-Learning with Less Forgetting on Large-Scale Non-Stationary Task Distributions Zhenyi Wang, Li Shen, Le Fang, Qiuling Suo, Donglin Zhan, Tiehang Duan, Mingchen Gao

PDF

Meta-Sampler: Almost-Universal yet Task-Oriented Sampling for Point Clouds Ta-Ying Cheng, Qingyong Hu, Qian Xie, Niki Trigoni, Andrew Markham

PDF

MetaGait: Learning to Learn an Omni Sample Adaptive Representation for Gait Recognition Huanzhang Dou, Pengyi Zhang, Wei Su, Yunlong Yu, Xi Li

PDF

Metric Learning Based Interactive Modulation for Real-World Super-Resolution Chong Mou, Yanze Wu, Xintao Wang, Chao Dong, Jian Zhang, Ying Shan

PDF

MFIM: Megapixel Facial Identity Manipulation Sanghyeon Na

PDF

MHR-Net: Multiple-Hypothesis Reconstruction of Non-Rigid Shapes from 2D Views Haitian Zeng, Xin Yu, Jiaxu Miao, Yi Yang

PDF

MILES: Visual BERT Pre-Training with Injected Language Semantics for Video-Text Retrieval Yuying Ge, Yixiao Ge, Xihui Liu, Jinpeng Wang, Jianping Wu, Ying Shan, Xiaohu Qie, Ping Luo

PDF

MIME: Minority Inclusion for Majority Group Enhancement of AI Performance Pradyumna Chari, Yunhao Ba, Shreeram Athreya, Achuta Kadambi

PDF

Mimic Embedding via Adaptive Aggregation: Learning Generalizable Person Re-Identification Boqiang Xu, Jian Liang, Lingxiao He, Zhenan Sun

PDF

MimicME: A Large Scale Diverse 4D Database for Facial Expression Analysis Athanasios Papaioannou, Baris Gecer, Shiyang Cheng, Grigorios G. Chrysos, Jiankang Deng, Eftychia Fotiadou, Christos Kampouris, Dimitrios Kollias, Stylianos Moschoglou, Kritaphat Songsri-In, Stylianos Ploumpis, George Trigeorgis, Panagiotis Tzirakis, Evangelos Ververas, Yuxiang Zhou, Allan Ponniah, Anastasios Roussos, Stefanos Zafeiriou

PDF

Mind the Gap in Distilling StyleGANs Guodong Xu, Yuenan Hou, Ziwei Liu, Chen Change Loy

PDF

MINER: Multiscale Implicit Neural Representation Vishwanath Saragadam, Jasper Tan, Guha Balakrishnan, Richard G. Baraniuk, Ashok Veeraraghavan

PDF

Minimal Neural Atlas: Parameterizing Complex Surfaces with Minimal Charts and Distortion Weng Fei Low, Gim Hee Lee

PDF

Mining Cross-Person Cues for Body-Part Interactiveness Learning in HOI Detection Xiaoqian Wu, Yong-Lu Li, Xinpeng Liu, Junyi Zhang, Yuzhe Wu, Cewu Lu

PDF

Mining Relations Among Cross-Frame Affinities for Video Semantic Segmentation Guolei Sun, Yun Liu, Hao Tang, Ajad Chhatkuli, Le Zhang, Luc Van Gool

PDF

Mixed-Precision Neural Network Quantization via Learned Layer-Wise Importance Chen Tang, Kai Ouyang, Zhi Wang, Yifei Zhu, Wen Ji, Yaowei Wang, Wenwu Zhu

PDF

MixSKD: Self-Knowledge Distillation from Mixup for Image Recognition Chuanguang Yang, Zhulin An, Helong Zhou, Linhang Cai, Xiang Zhi, Jiwen Wu, Yongjun Xu, Qian Zhang

PDF

ML-BPM: Multi-Teacher Learning with Bidirectional Photometric Mixing for Open Compound Domain Adaptation in Semantic Segmentation Fei Pan, Sungsu Hur, Seokju Lee, Junsik Kim, In So Kweon

PDF

MoDA: mAP Style Transfer for Self-Supervised Domain Adaptation of Embodied Agents Eun Sun Lee, Junho Kim, SangWon Park, Young Min Kim

PDF

Modality Synergy Complement Learning with Cascaded Aggregation for Visible-Infrared Person Re-Identification Yiyuan Zhang, Sanyuan Zhao, Yuhao Kang, Jianbing Shen

PDF

MODE: Multi-View Omnidirectional Depth Estimation with 360° Cameras Ming Li, Xueqian Jin, Xuejiao Hu, Jingzhao Dai, Sidan Du, Yang Li

PDF

Modeling Mask Uncertainty in Hyperspectral Image Reconstruction Jiamian Wang, Yulun Zhang, Xin Yuan, Ziyi Meng, Zhiqiang Tao

PDF

MoFaNeRF: Morphable Facial Neural Radiance Field Yiyu Zhuang, Hao Zhu, Xusen Sun, Xun Cao

PDF

Monitored Distillation for Positive Congruent Depth Completion Tian Yu Liu, Parth Agrawal, Allison Chen, Byung-Woo Hong, Alex Wong

PDF

Monocular 3D Object Detection with Depth from Motion Tai Wang, Jiangmiao Pang, Dahua Lin

PDF

Monocular 3D Object Reconstruction with GAN Inversion Junzhe Zhang, Daxuan Ren, Zhongang Cai, Chai Kiat Yeo, Bo Dai, Chen Change Loy

PDF

MonoPLFlowNet: Permutohedral Lattice FlowNet for Real-Scale 3D Scene Flow Estimation with Monocular Images Runfa Li, Truong Nguyen

PDF

MonteBoxFinder: Detecting and Filtering Primitives to Fit a Noisy Point Cloud Michaël Ramamonjisoa, Sinisa Stekovic, Vincent Lepetit

PDF

MORE: Multi-Order RElation Mining for Dense Captioning in 3D Scenes Yang Jiao, Shaoxiang Chen, Zequn Jie, Jingjing Chen, Lin Ma, Yu-Gang Jiang

PDF

MorphMLP: An Efficient MLP-like Backbone for Spatial-Temporal Representation Learning David Junhao Zhang, Kunchang Li, Yali Wang, Yunpeng Chen, Shashwat Chandra, Yu Qiao, Luoqi Liu, Mike Zheng Shou

PDF

Most and Least Retrievable Images in Visual-Language Query Systems Liuwan Zhu, Rui Ning, Jiang Li, Chunsheng Xin, Hongyi Wu

PDF

MOTCOM: The Multi-Object Tracking Dataset Complexity Metric Malte Pedersen, Joakim Bruslund Haurum, Patrick Dendorfer, Thomas B. Moeslund

PDF

Motion and Appearance Adaptation for Cross-Domain Motion Transfer Borun Xu, Biao Wang, Jinhong Deng, Jiale Tao, Tiezheng Ge, Yuning Jiang, Wen Li, Lixin Duan

PDF

Motion Inspired Unsupervised Perception and Prediction in Autonomous Driving Mahyar Najibi, Jingwei Ji, Yin Zhou, Charles R. Qi, Xinchen Yan, Scott Ettinger, Dragomir Anguelov

PDF

Motion Sensitive Contrastive Learning for Self-Supervised Video Representation Jingcheng Ni, Nan Zhou, Jie Qin, Qian Wu, Junqi Liu, Boxun Li, Di Huang

PDF

Motion Transformer for Unsupervised Image Animation Jiale Tao, Biao Wang, Tiezheng Ge, Yuning Jiang, Wen Li, Lixin Duan

PDF

MotionCLIP: Exposing Human Motion Generation to CLIP Space Guy Tevet, Brian Gordon, Amir Hertz, Amit H. Bermano, Daniel Cohen-Or

PDF

MOTR: End-to-End Multiple-Object Tracking with TRansformer Fangao Zeng, Bin Dong, Yuang Zhang, Tiancai Wang, Xiangyu Zhang, Yichen Wei

PDF

MovieCuts: A New Dataset and Benchmark for Cut Type Recognition Alejandro Pardo, Fabian Caba, Juan León Alcázar, Ali Thabet, Bernard Ghanem

PDF

MPIB: An MPI-Based Bokeh Rendering Framework for Realistic Partial Occlusion Effects Juewen Peng, Jianming Zhang, Xianrui Luo, Hao Lu, Ke Xian, Zhiguo Cao

PDF

MPPNet: Multi-Frame Feature Intertwining with Proxy Points for 3D Temporal Object Detection Xuesong Chen, Shaoshuai Shi, Benjin Zhu, Ka Chun Cheung, Hang Xu, Hongsheng Li

PDF

MTFormer: Multi-Task Learning via Transformer and Cross-Task Reasoning Xiaogang Xu, Hengshuang Zhao, Vibhav Vineet, Ser-Nam Lim, Antonio Torralba

PDF

MTTrans: Cross-Domain Object Detection with Mean Teacher Transformer Jinze Yu, Jiaming Liu, Xiaobao Wei, Haoyi Zhou, Yohei Nakata, Denis Gudovskiy, Tomoyuki Okuno, Jianxin Li, Kurt Keutzer, Shanghang Zhang

PDF

MUGEN: A Playground for Video-Audio-Text Multimodal Understanding and GENeration Thomas Hayes, Songyang Zhang, Xi Yin, Guan Pang, Sasha Sheng, Harry Yang, Songwei Ge, Qiyuan Hu, Devi Parikh

PDF

Multi-Curve Translator for High-Resolution Photorealistic Image Translation Yuda Song, Hui Qian, Xin Du

PDF

Multi-Domain Learning for Updating Face Anti-Spoofing Models Xiao Guo, Yaojie Liu, Anil Jain, Xiaoming Liu

PDF

Multi-Domain Multi-Definition Landmark Localization for Small Datasets David Ferman, Gaurav Bharaj

PDF

Multi-Exit Semantic Segmentation Networks Alexandros Kouris, Stylianos I. Venieris, Stefanos Laskaridis, Nicholas Lane

PDF

Multi-Faceted Distillation of Base-Novel Commonality for Few-Shot Object Detection Shuang Wu, Wenjie Pei, Dianwen Mei, Fanglin Chen, Jiandong Tian, Guangming Lu

PDF

Multi-Granularity Distillation Scheme Towards Lightweight Semi-Supervised Semantic Segmentation Jie Qin, Jie Wu, Ming Li, Xuefeng Xiao, Min Zheng, Xingang Wang

PDF

Multi-Granularity Prediction for Scene Text Recognition Peng Wang, Cheng Da, Cong Yao

PDF

Multi-Granularity Pruning for Model Acceleration on Mobile Devices Tianli Zhao, Xi Sheryl Zhang, Wentao Zhu, Jiaxing Wang, Sen Yang, Ji Liu, Jian Cheng

PDF

Multi-Modal Masked Pre-Training for Monocular Panoramic Depth Completion Zhiqiang Yan, Xiang Li, Kun Wang, Zhenyu Zhang, Jun Li, Jian Yang

PDF

Multi-Modal Text Recognition Networks: Interactive Enhancements Between Visual and Semantic Features Byeonghu Na, Yoonsik Kim, Sungrae Park

PDF

Multi-Person 3D Pose and Shape Estimation via Inverse Kinematics and Refinement Junuk Cha, Muhammad Saqlain, GeonU Kim, Mingyu Shin, Seungryul Baek

PDF

Multi-Query Video Retrieval Zeyu Wang, Yu Wu, Karthik Narasimhan, Olga Russakovsky

PDF

Multi-Scale and Cross-Scale Contrastive Learning for Semantic Segmentation Theodoros Pissas, Claudio S. Ravasio, Lyndon Da Cruz, Christos Bergeles

PDF

MultiMAE: Multi-Modal Multi-Task Masked Autoencoders Roman Bachmann, David Mizrahi, Andrei Atanov, Amir Zamir

PDF

Multimodal Conditional Image Synthesis with Product-of-Experts GANs Xun Huang, Arun Mallya, Ting-Chun Wang, Ming-Yu Liu

PDF

Multimodal Object Detection via Probabilistic Ensembling Yi-Ting Chen, Jinghao Shi, Zelin Ye, Christoph Mertz, Deva Ramanan, Shu Kong

PDF

Multimodal Transformer for Automatic 3D Annotation and Object Detection Chang Liu, Xiaoyan Qian, Binxiao Huang, Xiaojuan Qi, Edmund Lam, Siew-Chong Tan, Ngai Wong

PDF

Multimodal Transformer with Variable-Length Memory for Vision-and-Language Navigation Chuang Lin, Yi Jiang, Jianfei Cai, Lizhen Qu, Gholamreza Haffari, Zehuan Yuan

PDF

Multiview Regenerative Morphing with Dual Flows Chih-Jung Tsai, Cheng Sun, Hwann-Tzong Chen

PDF

Multiview Stereo with Cascaded Epipolar RAFT Zeyu Ma, Zachary Teed, Jia Deng

PDF

MuLUT: Cooperating Multiple Look-up Tables for Efficient Image Super-Resolution Jiacheng Li, Chang Chen, Zhen Cheng, Zhiwei Xiong

PDF

Mutually Reinforcing Structure with Proposal Contrastive Consistency for Few-Shot Object Detection Tianxue Ma, Mingwei Bi, Jian Zhang, Wang Yuan, Zhizhong Zhang, Yuan Xie, Shouhong Ding, Lizhuang Ma

PDF

MvDeCor: Multi-View Dense Correspondence Learning for Fine-Grained 3D Segmentation Gopal Sharma, Kangxue Yin, Subhransu Maji, Evangelos Kalogerakis, Or Litany, Sanja Fidler

PDF

MVDG: A Unified Multi-View Framework for Domain Generalization Jian Zhang, Lei Qi, Yinghuan Shi, Yang Gao

PDF

MVP: Multimodality-Guided Visual Pre-Training Longhui Wei, Lingxi Xie, Wengang Zhou, Houqiang Li, Qi Tian

PDF

MVSalNet:Multi-View Augmentation for RGB-D Salient Object Detection Jiayuan Zhou, Lijun Wang, Huchuan Lu, Kaining Huang, Xinchu Shi, Bocong Liu

PDF

MVSTER: Epipolar Transformer for Efficient Multi-View Stereo Xiaofeng Wang, Zheng Zhu, Guan Huang, Fangbo Qin, Yun Ye, Yijia He, Xu Chi, Xingang Wang

PDF

My View Is the Best View: Procedure Learning from Egocentric Videos Siddhant Bansal, Chetan Arora, C.V. Jawahar

PDF

NashAE: Disentangling Representations Through Adversarial Covariance Minimization Eric Yeats, Frank Liu, David Womble, Hai Li

PDF

Natural Synthetic Anomalies for Self-Supervised Anomaly Detection and Localization Hannah M. Schlüter, Jeremy Tan, Benjamin Hou, Bernhard Kainz

PDF

NDF: Neural Deformable Fields for Dynamic Human Modelling Ruiqi Zhang, Jie Chen

PDF

NeFSAC: Neurally Filtered Minimal Samples Luca Cavalli, Marc Pollefeys, Daniel Barath

PDF

Negative Samples Are at Large: Leveraging Hard-Distance Elastic Loss for Re-Identification Hyungtae Lee, Sungmin Eum, Heesung Kwon

PDF

Neighborhood Collective Estimation for Noisy Label Identification and Correction Jichang Li, Guanbin Li, Feng Liu, Yizhou Yu

PDF

NeILF: Neural Incident Light Field for Physically-Based Material Estimation Yao Yao, Jingyang Zhang, Jingbo Liu, Yihang Qu, Tian Fang, David McKinnon, Yanghai Tsin, Long Quan

PDF

NeRF for Outdoor Scene Relighting Viktor Rudnev, Mohamed Elgharib, William Smith, Lingjie Liu, Vladislav Golyanik, Christian Theobalt

PDF

NEST: Neural Event Stack for Event-Based Image Enhancement Minggui Teng, Chu Zhou, Hanyue Lou, Boxin Shi

PDF

Network Binarization via Contrastive Learning Yuzhang Shang, Dan Xu, Ziliang Zong, Liqiang Nie, Yan Yan

PDF

NeuMan: Neural Human Radiance Field from a Single Video Wei Jiang, Kwang Moo Yi, Golnoosh Samei, Oncel Tuzel, Anurag Ranjan

PDF

NeuMesh: Learning Disentangled Neural Mesh-Based Implicit Field for Geometry and Texture Editing Bangbang Yang, Chong Bao, Junyi Zeng, Hujun Bao, Yinda Zhang, Zhaopeng Cui, Guofeng Zhang

PDF

Neural Architecture Search for Spiking Neural Networks Youngeun Kim, Yuhang Li, Hyoungseob Park, Yeshwanth Venkatesha, Priyadarshini Panda

PDF

Neural Capture of Animatable 3D Human from Monocular Video Gusi Te, Xiu Li, Xiao Li, Jinglu Wang, Wei Hu, Yan Lu

PDF

Neural Color Operators for Sequential Image Retouching Yili Wang, Xin Li, Kun Xu, Dongliang He, Qi Zhang, Fu Li, Errui Ding

PDF

Neural Correspondence Field for Object Pose Estimation Lin Huang, Tomas Hodan, Lingni Ma, Linguang Zhang, Luan Tran, Christopher D. Twigg, Po-Chen Wu, Junsong Yuan, Cem Keskin, Robert Wang

PDF

Neural Density-Distance Fields Itsuki Ueda, Yoshihiro Fukuhara, Hirokatsu Kataoka, Hiroaki Aizawa, Hidehiko Shishido, Itaru Kitahara

PDF

Neural Image Representations for Multi-Image Fusion and Layer Separation Seonghyeon Nam, Marcus A. Brubaker, Michael S. Brown

PDF

Neural Light Field Estimation for Street Scenes with Differentiable Virtual Object Insertion Zian Wang, Wenzheng Chen, David Acuna, Jan Kautz, Sanja Fidler

PDF

Neural Radiance Transfer Fields for Relightable Novel-View Synthesis with Global Illumination Linjie Lyu, Ayush Tewari, Thomas Leimkühler, Marc Habermann, Christian Theobalt

PDF

Neural Scene Decoration from a Single Photograph Hong-Wing Pang, Yingshu Chen, Phuoc-Hieu Le, Binh-Son Hua, Thanh Nguyen, Sai-Kit Yeung

PDF

Neural Space-Filling Curves Hanyu Wang, Kamal Gupta, Larry Davis, Abhinav Shrivastava

PDF

Neural Strands: Learning Hair Geometry and Appearance from Multi-View Images Radu Alexandru Rosu, Shunsuke Saito, Ziyan Wang, Chenglei Wu, Sven Behnke, Giljoo Nam

PDF

Neural Video Compression Using GANs for Detail Synthesis and Propagation Fabian Mentzer, Eirikur Agustsson, Johannes Ballé, David Minnen, Nick Johnston, George Toderici

PDF

Neural-Sim: Learning to Generate Training Data with NeRF Yunhao Ge, Harkirat Behl, Jiashu Xu, Suriya Gunasekar, Neel Joshi, Yale Song, Xin Wang, Laurent Itti, Vibhav Vineet

PDF

NeuRIS: Neural Reconstruction of Indoor Scenes Using Normal Priors Jiepeng Wang, Peng Wang, Xiaoxiao Long, Christian Theobalt, Taku Komura, Lingjie Liu, Wenping Wang

PDF

Neuromorphic Data Augmentation for Training Spiking Neural Networks Yuhang Li, Youngeun Kim, Hyoungseob Park, Tamar Geller, Priyadarshini Panda

PDF

New Datasets and Models for Contextual Reasoning in Visual Dialog Yifeng Zhang, Ming Jiang, Qi Zhao

PDF

NewsStories: Illustrating Articles with Visual Summaries Reuben Tan, Bryan A. Plummer, Kate Saenko, Jp Lewis, Avneesh Sud, Thomas Leung

PDF

NeXT: Towards High Quality Neural Radiance Fields via Multi-Skip Transformer Yunxiao Wang, Yanjie Li, Peidong Liu, Tao Dai, Shu-Tao Xia

PDF

No Token Left Behind: Explainability-Aided Image Classification and Generation Roni Paiss, Hila Chefer, Lior Wolf

PDF

Non-Uniform Step Size Quantization for Accurate Post-Training Quantization Sangyun Oh, Hyeonuk Sim, Jounghyun Kim, Jongeun Lee

PDF

Not All Models Are Equal: Predicting Model Transferability in a Self-Challenging Fisher Space Wenqi Shao, Xun Zhao, Yixiao Ge, Zhaoyang Zhang, Lei Yang, Xiaogang Wang, Ying Shan, Ping Luo

PDF

Not Just Streaks: Towards Ground Truth for Single Image Deraining Yunhao Ba, Howard Zhang, Ethan Yang, Akira Suzuki, Arnold Pfahnl, Chethan Chinder Chandrappa, Celso M. de Melo, Suya You, Stefano Soatto, Alex Wong, Achuta Kadambi

PDF

Novel Class Discovery Without Forgetting K J Joseph, Sujoy Paul, Gaurav Aggarwal, Soma Biswas, Piyush Rai, Kai Han, Vineeth N Balasubramanian

PDF

NSNet: Non-Saliency Suppression Sampler for Efficient Video Recognition Boyang Xia, Wenhao Wu, Haoran Wang, Rui Su, Dongliang He, Haosen Yang, Xiaoran Fan, Wanli Ouyang

PDF

NÜWA: Visual Synthesis Pre-Training for Neural visUal World creAtion Chenfei Wu, Jian Liang, Lei Ji, Fan Yang, Yuejian Fang, Daxin Jiang, Nan Duan

PDF

Object Detection as Probabilistic Set Prediction Georg Hess, Christoffer Petersson, Lennart Svensson

PDF

Object Discovery and Representation Networks Olivier J. Hénaff, Skanda Koppula, Evan Shelhamer, Daniel Zoran, Andrew Jaegle, Andrew Zisserman, João Carreira, Relja Arandjelović

PDF

Object Discovery via Contrastive Learning for Weakly Supervised Object Detection Jinhwan Seo, Wonho Bae, Danica J. Sutherland, Junhyug Noh, Daijin Kim

PDF

Object Level Depth Reconstruction for Category Level 6d Object Pose Estimation from Monocular RGB Image Zhaoxin Fan, Zhenbo Song, Jian Xu, Zhicheng Wang, Kejian Wu, Hongyan Liu, Jun He

PDF

Object Manipulation via Visual Target Localization Kiana Ehsani, Ali Farhadi, Aniruddha Kembhavi, Roozbeh Mottaghi

PDF

Object Wake-up: 3D Object Rigging from a Single Image Ji Yang, Xinxin Zuo, Sen Wang, Zhenbo Yu, Xingyu Li, Bingbing Ni, Minglun Gong, Li Cheng

PDF

Object-Centric Unsupervised Image Captioning Zihang Meng, David Yang, Xuefei Cao, Ashish Shah, Ser-Nam Lim

PDF

Object-Compositional Neural Implicit Surfaces Qianyi Wu, Xian Liu, Yuedong Chen, Kejie Li, Chuanxia Zheng, Jianfei Cai, Jianmin Zheng

PDF

ObjectBox: From Centers to Boxes for Anchor-Free Object Detection Mohsen Zand, Ali Etemad, Michael Greenspan

PDF

Objects Can Move: 3D Change Detection by Geometric Transformation Consistency Aikaterini Adam, Torsten Sattler, Konstantinos Karantzalos, Tomas Pajdla

PDF

OccamNets: Mitigating Dataset Bias by Favoring Simpler Hypotheses Robik Shrestha, Kushal Kafle, Christopher Kanan

PDF

OCR-Free Document Understanding Transformer Geewook Kim, Teakgyu Hong, Moonbin Yim, JeongYeon Nam, Jinyoung Park, Jinyeong Yim, Wonseok Hwang, Sangdoo Yun, Dongyoon Han, Seunghyun Park

PDF

OIMNet++: Prototypical Normalization and Localization-Aware Learning for Person Search Sanghoon Lee, Youngmin Oh, Donghyeon Baek, Junghyup Lee, Bumsub Ham

PDF

On Label Granularity and Object Localization Elijah Cole, Kimberly Wilber, Grant Van Horn, Xuan Yang, Marco Fornoni, Pietro Perona, Serge Belongie, Andrew Howard, Oisin Mac Aodha

PDF

On Mitigating Hard Clusters for Face Clustering Yingjie Chen, Huasong Zhong, Chong Chen, Chen Shen, Jianqiang Huang, Tao Wang, Yun Liang, Qianru Sun

PDF

On Multi-Domain Long-Tailed Recognition, Imbalanced Domain Generalization and Beyond Yuzhe Yang, Hao Wang, Dina Katabi

PDF

On the Angular Update and Hyperparameter Tuning of a Scale-Invariant Network Juseung Yun, Janghyeon Lee, Hyounguk Shon, Eojindl Yi, Seung Hwan Kim, Junmo Kim

PDF

On the Robustness of Quality Measures for GANs Motasem Alfarra, Juan C. Pérez, Anna Frühstück, Philip H. S. Torr, Peter Wonka, Bernard Ghanem

PDF

On the Versatile Uses of Partial Distance Correlation in Deep Learning Xingjian Zhen, Zihang Meng, Rudrasis Chakraborty, Vikas Singh

PDF

One Size Does NOT Fit All: Data-Adaptive Adversarial Training Shuo Yang, Chang Xu

PDF

One-Shot Medical Landmark Localization by Edge-Guided Transform and Noisy Landmark Refinement Zihao Yin, Ping Gong, Chunyu Wang, Yizhou Yu, Yizhou Wang

PDF

One-Trimap Video Matting Hongje Seong, Seoung Wug Oh, Brian Price, Euntai Kim, Joon-Young Lee

PDF

OneFace: One Threshold for All Jiaheng Liu, Zhipeng Yu, Haoyu Qin, Yichao Wu, Ding Liang, Gangming Zhao, Ke Xu

PDF

Online Continual Learning with Contrastive Vision Transformer Zhen Wang, Liu Liu, Yajing Kong, Jiaxian Guo, Dacheng Tao

PDF

Online Domain Adaptation for Semantic Segmentation in Ever-Changing Conditions Theodoros Panagiotakopoulos, Pier Luigi Dovesi, Linus Härenstam-Nielsen, Matteo Poggi

PDF

Online Segmentation of LiDAR Sequences: Dataset and Algorithm Romain Loiseau, Mathieu Aubry, Loïc Landrieu

PDF

Online Task-Free Continual Learning with Dynamic Sparse Distributed Memory Julien Pourcel, Ngoc-Son Vu, Robert M. French

PDF

OOD-CV: A Benchmark for Robustness to Out-of-Distribution Shifts of Individual Nuisances in Natural Images Bingchen Zhao, Shaozuo Yu, Wufei Ma, Mingxin Yu, Shenxiao Mei, Angtian Wang, Ju He, Alan Yuille, Adam Kortylewski

PDF

OPD: Single-View 3D Openable Part Detection Hanxiao Jiang, Yongsen Mao, Manolis Savva, Angel X. Chang

PDF

Open Vocabulary Object Detection with Pseudo Bounding-Box Labels Mingfei Gao, Chen Xing, Juan Carlos Niebles, Junnan Li, Ran Xu, Wenhao Liu, Caiming Xiong

PDF

Open-Set Semi-Supervised Object Detection Yen-Cheng Liu, Chih-Yao Ma, Xiaoliang Dai, Junjiao Tian, Peter Vajda, Zijian He, Zsolt Kira

PDF

Open-Vocabulary DETR with Conditional Matching Yuhang Zang, Wei Li, Kaiyang Zhou, Chen Huang, Chen Change Loy

PDF

Open-World Semantic Segmentation for LIDAR Point Clouds Jun Cen, Peng Yun, Shiwei Zhang, Junhao Cai, Di Luan, Mingqian Tang, Ming Liu, Michael Yu Wang

PDF

Open-World Semantic Segmentation via Contrasting and Clustering Vision-Language Embedding Quande Liu, Youpeng Wen, Jianhua Han, Chunjing Xu, Hang Xu, Xiaodan Liang

PDF

OpenLDN: Learning to Discover Novel Classes for Open-World Semi-Supervised Learning Mamshad Nayeem Rizve, Navid Kardan, Salman Khan, Fahad Shahbaz Khan, Mubarak Shah

PDF

Optical Flow Training Under Limited Label Budget via Active Learning Shuai Yuan, Xian Sun, Hannah Kim, Shuzhi Yu, Carlo Tomasi

PDF

Optimal Boxes: Boosting End-to-End Scene Text Recognition by Adjusting Annotated Bounding Boxes via Reinforcement Learning Jingqun Tang, Wenming Qian, Luchuan Song, Xiena Dong, Lan Li, Xiang Bai

PDF

Optimal Transport for Label-Efficient Visible-Infrared Person Re-Identification Jiangming Wang, Zhizhong Zhang, Mingang Chen, Yi Zhang, Cong Wang, Bin Sheng, Yanyun Qu, Yuan Xie

PDF

Optimization over Disentangled Encoding: Unsupervised Cross-Domain Point Cloud Completion via Occlusion Factor Manipulation Jingyu Gong, Fengqi Liu, Jiachen Xu, Min Wang, Xin Tan, Zhizhong Zhang, Ran Yi, Haichuan Song, Yuan Xie, Lizhuang Ma

PDF

Optimizing Image Compression via Joint Learning with Denoising Ka Leong Cheng, Yueqi Xie, Qifeng Chen

PDF

Order Learning Using Partially Ordered Data via Chainization Seon-Ho Lee, Chang-Su Kim

PDF

Organic Priors in Non-Rigid Structure from Motion Suryansh Kumar, Luc Van Gool

PDF

OSFormer: One-Stage Camouflaged Instance Segmentation with Transformers Jialun Pei, Tianyang Cheng, Deng-Ping Fan, He Tang, Chuanbo Chen, Luc Van Gool

PDF

Out-of-Distribution Detection with Boundary Aware Learning Sen Pei, Xin Zhang, Bin Fan, Gaofeng Meng

PDF

Out-of-Distribution Detection with Semantic Mismatch Under Masking Yijun Yang, Ruiyuan Gao, Qiang Xu

PDF

Out-of-Distribution Identification: Let Detector Tell Which I Am Not Sure Ruoqi Li, Chongyang Zhang, Hao Zhou, Chao Shi, Yan Luo

PDF

Outpainting by Queries Kai Yao, Penglei Gao, Xi Yang, Jie Sun, Rui Zhang, Kaizhu Huang

PDF

Overcoming Shortcut Learning in a Target Domain by Generalizing Basic Visual Factors from a Source Domain Piyapat Saranrittichai, Chaithanya Kumar Mummadi, Claudia Blaiotta, Mauricio Munoz, Volker Fischer

PDF

Overlooked Poses Actually Make Sense: Distilling Privileged Knowledge for Human Motion Prediction Xiaoning Sun, Qiongjie Cui, Huaijiang Sun, Bin Li, Weiqing Li, Jianfeng Lu

PDF

P-STMO: Pre-Trained Spatial Temporal Many-to-One Model for 3D Human Pose Estimation Wenkang Shan, Zhenhua Liu, Xinfeng Zhang, Shanshe Wang, Siwei Ma, Wen Gao

PDF

PAC-Net: Highlight Your Video via History Preference Modeling Hang Wang, Penghao Zhou, Chong Zhou, Zhao Zhang, Xing Sun

PDF

PACS: A Dataset for Physical Audiovisual Commonsense Reasoning Samuel Yu, Peter Wu, Paul Pu Liang, Ruslan Salakhutdinov, Louis-Philippe Morency

PDF

PACTran: PAC-Bayesian Metrics for Estimating the Transferability of Pretrained Models to Classification Tasks Nan Ding, Xi Chen, Tomer Levinboim, Soravit Changpinyo, Radu Soricut

PDF

Paint2Pix: Interactive Painting Based Progressive Image Synthesis and Editing Jaskirat Singh, Liang Zheng, Cameron Smith, Jose Echevarria

PDF

Pairwise Contrastive Learning Network for Action Quality Assessment Mingzhe Li, Hong-Bo Zhang, Qing Lei, Zongwen Fan, Jinghua Liu, Ji-Xiang Du

PDF

PalGAN: Image Colorization with Palette Generative Adversarial Networks Yi Wang, Menghan Xia, Lu Qi, Jing Shao, Yu Qiao

PDF

PalQuant: Accelerating High-Precision Networks on Low-Precision Accelerators Qinghao Hu, Gang Li, Qiman Wu, Jian Cheng

PDF

PANDORA: A Panoramic Detection Dataset for Object with Orientation Hang Xu, Qiang Zhao, Yike Ma, Xiaodong Li, Peng Yuan, Bailan Feng, Chenggang Yan, Feng Dai

PDF

PANDORA: Polarization-Aided Neural Decomposition of Radiance Akshat Dave, Yongyi Zhao, Ashok Veeraraghavan

PDF

PanoFormer: Panorama Transformer for Indoor 360° Depth Estimation Zhijie Shen, Chunyu Lin, Kang Liao, Lang Nie, Zishuo Zheng, Yao Zhao

PDF

Panoptic Scene Graph Generation Jingkang Yang, Yi Zhe Ang, Zujin Guo, Kaiyang Zhou, Wayne Zhang, Ziwei Liu

PDF

Panoptic-PartFormer: Learning a Unified Model for Panoptic Part Segmentation Xiangtai Li, Shilin Xu, Yibo Yang, Guangliang Cheng, Yunhai Tong, Dacheng Tao

PDF

Panoramic Human Activity Recognition Ruize Han, Haomin Yan, Jiacheng Li, Songmiao Wang, Wei Feng, Song Wang

PDF

Panoramic Vision Transformer for Saliency Detection in 360° Videos Heeseung Yun, Sehun Lee, Gunhee Kim

PDF

Parameterized Temperature Scaling for Boosting the Expressive Power in Post-Hoc Uncertainty Calibration Christian Tomani, Daniel Cremers, Florian Buettner

PDF

ParC-Net: Position Aware Circular Convolution with Merits from ConvNets and Transformer Haokui Zhang, Wenze Hu, Xiaoyu Wang

PDF

Particle Video Revisited: Tracking Through Occlusions Using Point Trajectories Adam W. Harley, Zhaoyuan Fang, Katerina Fragkiadaki

PDF

ParticleSfM: Exploiting Dense Point Trajectories for Localizing Moving Cameras in the Wild Wang Zhao, Shaohui Liu, Hengkai Guo, Wenping Wang, Yong-Jin Liu

PDF

PartImageNet: A Large, High-Quality Dataset of Parts Ju He, Shuo Yang, Shaokang Yang, Adam Kortylewski, Xiaoding Yuan, Jie-Neng Chen, Shuai Liu, Cheng Yang, Qihang Yu, Alan Yuille

PDF

PASS: Part-Aware Self-Supervised Pre-Training for Person Re-Identification Kuan Zhu, Haiyun Guo, Tianyi Yan, Yousong Zhu, Jinqiao Wang, Ming Tang

PDF

Patch Similarity Aware Data-Free Quantization for Vision Transformers Zhikai Li, Liping Ma, Mengjuan Chen, Junrui Xiao, Qingyi Gu

PDF

PatchRD: Detail-Preserving Shape Completion by Learning Patch Retrieval and Deformation Bo Sun, Vladimir G. Kim, Noam Aigerman, Qixing Huang, Siddhartha Chaudhuri

PDF

PCR-CG: Point Cloud Registration via Deep Explicit Color and Geometry Yu Zhang, Junle Yu, Xiaolin Huang, Wenhui Zhou, Ji Hou

PDF

PCW-Net: Pyramid Combination and Warping Cost Volume for Stereo Matching Zhelun Shen, Yuchao Dai, Xibin Song, Zhibo Rao, Dingfu Zhou, Liangjun Zhang

PDF

PD-Flow: A Point Cloud Denoising Framework with Normalizing Flows Aihua Mao, Zihui Du, Yu-Hui Wen, Jun Xuan, Yong-Jin Liu

PDF

Perceiving and Modeling Density for Image Dehazing Tian Ye, Yunchen Zhang, Mingchao Jiang, Liang Chen, Yun Liu, Sixiang Chen, Erkang Chen

PDF

Perception-Distortion Balanced ADMM Optimization for Single-Image Super-Resolution Yuehan Zhang, Bo Ji, Jia Hao, Angela Yao

PDF

Perceptual Artifacts Localization for Inpainting Lingzhi Zhang, Yuqian Zhou, Connelly Barnes, Sohrab Amirghodsi, Zhe Lin, Eli Shechtman, Jianbo Shi

PDF

PersFormer: 3D Lane Detection via Perspective Transformer and the OpenLane Benchmark Li Chen, Chonghao Sima, Yang Li, Zehan Zheng, Jiajie Xu, Xiangwei Geng, Hongyang Li, Conghui He, Jianping Shi, Yu Qiao, Junchi Yan

PDF

Personalized Education: Blind Knowledge Distillation Xiang Deng, Jian Zheng, Zhongfei Zhang

PDF

Personalizing Federated Medical Image Segmentation via Local Calibration Jiacheng Wang, Yueming Jin, Liansheng Wang

PDF

Perspective Flow Aggregation for Data-Limited 6d Object Pose Estimation Yinlin Hu, Pascal Fua, Mathieu Salzmann

PDF

Perspective Phase Angle Model for Polarimetric 3D Reconstruction Guangcheng Chen, Li He, Yisheng Guan, Hong Zhang

PDF

PETR: Position Embedding Transformation for Multi-View 3D Object Detection Yingfei Liu, Tiancai Wang, Xiangyu Zhang, Jian Sun

PDF

Photo-Realistic Neural Domain Randomization Sergey Zakharov, Rareș Ambruș, Vitor Guizilini, Wadim Kehl, Adrien Gaidon

PDF

Physical Attack on Monocular Depth Estimation with Optimal Adversarial Patches Zhiyuan Cheng, James Liang, Hongjun Choi, Guanhong Tao, Zhiwen Cao, Dongfang Liu, Xiangyu Zhang

PDF

Physically-Based Editing of Indoor Scene Lighting from a Single Image Zhengqin Li, Jia Shi, Sai Bi, Rui Zhu, Kalyan Sunkavalli, Miloš Hašan, Zexiang Xu, Ravi Ramamoorthi, Manmohan Chandraker

PDF

PillarNet: Real-Time and High-Performance Pillar-Based 3D Object Detection Guangsheng Shi, Ruifeng Li, Chao Ma

PDF

PIP: Physical Interaction Prediction via Mental Simulation with Span Selection Jiafei Duan, Samson Yu, Soujanya Poria, Bihan Wen, Cheston Tan

PDF

Pixel-Wise Energy-Biased Abstention Learning for Anomaly Segmentation on Complex Urban Driving Scenes Yu Tian, Yuyuan Liu, Guansong Pang, Fengbei Liu, Yuanhong Chen, Gustavo Carneiro

PDF

PixelFolder: An Efficient Progressive Pixel Synthesis Network for Image Generation Jing He, Yiyi Zhou, Qi Zhang, Jun Peng, Yunhang Shen, Xiaoshuai Sun, Chao Chen, Rongrong Ji

PDF

PlaneFormers: From Sparse View Planes to 3D Reconstruction Samir Agarwala, Linyi Jin, Chris Rockwell, David F. Fouhey

PDF

Planes vs. Chairs: Category-Guided 3D Shape Learning Without Any 3D Cues Zixuan Huang, Stefan Stojanov, Anh Thai, Varun Jampani, James M. Rehg

PDF

Point Cloud Compression with Range Image-Based Entropy Model for Autonomous Driving Sukai Wang, Ming Liu

PDF

Point Cloud Compression with Sibling Context and Surface Priors Zhili Chen, Zian Qian, Sukai Wang, Qifeng Chen

PDF

Point Cloud Domain Adaptation via Masked Local 3D Structure Prediction Hanxue Liang, Hehe Fan, Zhiwen Fan, Yi Wang, Tianlong Chen, Yu Cheng, Zhangyang Wang

PDF

Point MixSwap: Attentional Point Cloud Mixing via Swapping Matched Structural Divisions Ardian Umam, Cheng-Kun Yang, Yung-Yu Chuang, Jen-Hui Chuang, Yen-Yu Lin

PDF

Point Primitive Transformer for Long-Term 4D Point Cloud Video Understanding Hao Wen, Yunze Liu, Jingwei Huang, Bo Duan, Li Yi

PDF

Point Scene Understanding via Disentangled Instance Mesh Reconstruction Jiaxiang Tang, Xiaokang Chen, Jingbo Wang, Gang Zeng

PDF

Point-to-Box Network for Accurate Object Detection via Single Point Supervision Pengfei Chen, Xuehui Yu, Xumeng Han, Najmul Hassan, Kai Wang, Jiachen Li, Jian Zhao, Humphrey Shi, Zhenjun Han, Qixiang Ye

PDF

PointCLM: A Contrastive Learning-Based Framework for Multi-Instance Point Cloud Registration Mingzhi Yuan, Zhihao Li, Qiuye Jin, Xinrong Chen, Manning Wang

PDF

PointFix: Learning to Fix Domain Bias for Robust Online Stereo Adaptation Kwonyoung Kim, Jungin Park, Jiyoung Lee, Dongbo Min, Kwanghoon Sohn

PDF

PointInst3D: Segmenting 3D Instances by Points Tong He, Wei Yin, Chunhua Shen, Anton van den Hengel

PDF

Pointly-Supervised Panoptic Segmentation Junsong Fan, Zhaoxiang Zhang, Tieniu Tan

PDF

PointMixer: MLP-Mixer for Point Cloud Understanding Jaesung Choe, Chunghyun Park, Francois Rameau, Jaesik Park, In So Kweon

PDF

PointScatter: Point Set Representation for Tubular Structure Extraction Dong Wang, Zhao Zhang, Ziwei Zhao, Yuhang Liu, Yihong Chen, Liwei Wang

PDF

PointTree: Transformation-Robust Point Cloud Encoder with Relaxed K-D Trees Jun-Kun Chen, Yu-Xiong Wang

PDF

Polarimetric Pose Prediction Daoyi Gao, Yitong Li, Patrick Ruhkamp, Iuliia Skobleva, Magdalena Wysocki, HyunJun Jung, Pengyuan Wang, Arturo Guridi, Benjamin Busam

PDF

PolarMOT: How Far Can Geometric Relations Take Us in 3D Multi-Object Tracking? Aleksandr Kim, Guillem Brasó, Aljoša Ošep, Laura Leal-Taixé

PDF

PolyphonicFormer: Unified Query Learning for Depth-Aware Video Panoptic Segmentation Haobo Yuan, Xiangtai Li, Yibo Yang, Guangliang Cheng, Jing Zhang, Yunhai Tong, Lefei Zhang, Dacheng Tao

PDF

POP: Mining POtential Performance of New Fashion Products via Webly Cross-Modal Query Expansion Christian Joppi, Geri Skenderi, Marco Cristani

PDF

Pose for Everything: Towards Category-Agnostic Pose Estimation Lumin Xu, Sheng Jin, Wang Zeng, Wentao Liu, Chen Qian, Wanli Ouyang, Ping Luo, Xiaogang Wang

PDF

Pose Forecasting in Industrial Human-Robot Collaboration Alessio Sampieri, Guido Maria D’Amely di Melendugno, Andrea Avogaro, Federico Cunico, Francesco Setti, Geri Skenderi, Marco Cristani, Fabio Galasso

PDF

Pose-NDF: Modeling Human Pose Manifolds with Neural Distance Fields Garvita Tiwari, Dimitrije Antić, Jan Eric Lenssen, Nikolaos Sarafianos, Tony Tung, Gerard Pons-Moll

PDF

Pose2Room: Understanding 3D Scenes from Human Activities Yinyu Nie, Angela Dai, Xiaoguang Han, Matthias Nießner

PDF

PoseGPT: Quantization-Based 3D Human Motion Generation and Forecasting Thomas Lucas, Fabien Baradel, Philippe Weinzaepfel, Grégory Rogez

PDF

PoserNet: Refining Relative Camera Poses Exploiting Object Detections Matteo Taiana, Matteo Toso, Stuart James, Alessio Del Bue

PDF

PoseScript: 3D Human Poses from Natural Language Ginger Delmas, Philippe Weinzaepfel, Thomas Lucas, Francesc Moreno-Noguer, Grégory Rogez

PDF

PoseTrans: A Simple yet Effective Pose Transformation Augmentation for Human Pose Estimation Wentao Jiang, Sheng Jin, Wentao Liu, Chen Qian, Ping Luo, Si Liu

PDF

Poseur: Direct Human Pose Regression with Transformers Weian Mao, Yongtao Ge, Chunhua Shen, Zhi Tian, Xinlong Wang, Zhibin Wang, Anton van den Hengel

PDF

Posterior Refinement on Metric Matrix Improves Generalization Bound in Metric Learning Mingda Wang, Canqian Yang, Yi Xu

PDF

PPT: Token-Pruned Pose Transformer for Monocular and Multi-View Human Pose Estimation Haoyu Ma, Zhe Wang, Yifei Chen, Deying Kong, Liangjian Chen, Xingwei Liu, Xiangyi Yan, Hao Tang, Xiaohui Xie

PDF

Practical and Scalable Desktop-Based High-Quality Facial Capture Alexandros Lattas, Yiming Lin, Jayanth Kannan, Ekin Ozturk, Luca Filipi, Giuseppe Claudio Guarnera, Gaurav Chawla, Abhijeet Ghosh

PDF

Pre-Training Strategies and Datasets for Facial Representation Learning Adrian Bulat, Shiyang Cheng, Jing Yang, Andrew Garbett, Enrique Sanchez, Georgios Tzimiropoulos

PDF

Predicting Is Not Understanding: Recognizing and Addressing Underspecification in Machine Learning Damien Teney, Maxime Peyrard, Ehsan Abbasnejad

PDF

Prediction-Guided Distillation for Dense Object Detection Chenhongyi Yang, Mateusz Ochal, Amos Storkey, Elliot J. Crowley

PDF

PREF: Predictability Regularized Neural Motion Fields Liangchen Song, Xuan Gong, Benjamin Planche, Meng Zheng, David Doermann, Junsong Yuan, Terrence Chen, Ziyan Wu

PDF

PressureVision: Estimating Hand Pressure from a Single RGB Image Patrick Grady, Chengcheng Tang, Samarth Brahmbhatt, Christopher D. Twigg, Chengde Wan, James Hays, Charles C. Kemp

PDF

PreTraM: Self-Supervised Pre-Training via Connecting Trajectory and mAP Chenfeng Xu, Tian Li, Chen Tang, Lingfeng Sun, Kurt Keutzer, Masayoshi Tomizuka, Alireza Fathi, Wei Zhan

PDF

PRIF: Primary Ray-Based Implicit Function Brandon Y. Feng, Yinda Zhang, Danhang Tang, Ruofei Du, Amitabh Varshney

PDF

PRIME: A Few Primitives Can Boost Robustness to Common Corruptions Apostolos Modas, Rahul Rade, Guillermo Ortiz-Jiménez, Seyed-Mohsen Moosavi-Dezfooli, Pascal Frossard

PDF

Primitive-Based Shape Abstraction via Nonparametric Bayesian Inference Yuwei Wu, Weixiao Liu, Sipu Ruan, Gregory S. Chirikjian

PDF

Prior Knowledge Guided Unsupervised Domain Adaptation Tao Sun, Cheng Lu, Haibin Ling

PDF

Prior-Guided Adversarial Initialization for Fast Adversarial Training Xiaojun Jia, Yong Zhang, Xingxing Wei, Baoyuan Wu, Ke Ma, Jue Wang, Xiaochun Cao

PDF

Privacy-Preserving Action Recognition via Motion Difference Quantization Sudhakar Kumawat, Hajime Nagahara

PDF

Privacy-Preserving Face Recognition with Learnable Privacy Budgets in Frequency Domain Jiazhen Ji, Huan Wang, Yuge Huang, Jiaxiang Wu, Xingkun Xu, Shouhong Ding, ShengChuan Zhang, Liujuan Cao, Rongrong Ji

PDF

PrivHAR: Recognizing Human Actions from Privacy-Preserving Lens Carlos Hinojosa, Miguel Marquez, Henry Arguello, Ehsan Adeli, Li Fei-Fei, Juan Carlos Niebles

PDF

Projective Parallel Single-Pixel Imaging to Overcome Global Illumination in 3D Structure Light Scanning Yuxi Li, Huijie Zhao, Hongzhi Jiang, Xudong Li

PDF

PromptDet: Towards Open-Vocabulary Detection Using Uncurated Images Chengjian Feng, Yujie Zhong, Zequn Jie, Xiangxiang Chu, Haibing Ren, Xiaolin Wei, Weidi Xie, Lin Ma

PDF

Prompting Visual-Language Models for Efficient Video Understanding Chen Ju, Tengda Han, Kunhao Zheng, Ya Zhang, Weidi Xie

PDF

Proposal-Free Temporal Action Detection via Global Segmentation Mask Learning Sauradip Nag, Xiatian Zhu, Yi-Zhe Song, Tao Xiang

PDF

ProposalContrast: Unsupervised Pre-Training for LiDAR-Based 3D Object Detection Junbo Yin, Dingfu Zhou, Liangjun Zhang, Jin Fang, Cheng-Zhong Xu, Jianbing Shen, Wenguan Wang

PDF

Prototype-Guided Continual Adaptation for Class-Incremental Unsupervised Domain Adaptation Hongbin Lin, Yifan Zhang, Zhen Qiu, Shuaicheng Niu, Chuang Gan, Yanxia Liu, Mingkui Tan

PDF

Prototypical Contrast Adaptation for Domain Adaptive Semantic Segmentation Zhengkai Jiang, Yuxi Li, Ceyuan Yang, Peng Gao, Yabiao Wang, Ying Tai, Chengjie Wang

PDF

Prune Your Model Before Distill It Jinhyuk Park, Albert No

PDF

PS-NeRF: Neural Inverse Rendering for Multi-View Photometric Stereo Wenqi Yang, Guanying Chen, Chaofeng Chen, Zhenfang Chen, Kwan-Yee K. Wong

PDF

PseCo: Pseudo Labeling and Consistency Training for Semi-Supervised Object Detection Gang Li, Xiang Li, Yujie Wang, Yichao Wu, Ding Liang, Shanshan Zhang

PDF

PseudoAugment: Learning to Use Unlabeled Data for Data Augmentation in Point Clouds Zhaoqi Leng, Shuyang Cheng, Benjamin Caine, Weiyue Wang, Xiao Zhang, Jonathon Shlens, Mingxing Tan, Dragomir Anguelov

PDF

PseudoClick: Interactive Image Segmentation with Click Imitation Qin Liu, Meng Zheng, Benjamin Planche, Srikrishna Karanam, Terrence Chen, Marc Niethammer, Ziyan Wu

PDF

PSS: Progressive Sample Selection for Open-World Visual Representation Learning Tianyue Cao, Yongxin Wang, Yifan Xing, Tianjun Xiao, Tong He, Zheng Zhang, Hao Zhou, Joseph Tighe

PDF

PT4AL: Using Self-Supervised Pretext Tasks for Active Learning John Seon Keun Yi, Minseok Seo, Jongchan Park, Dong-Geol Choi

PDF

PTQ4ViT: Post-Training Quantization for Vision Transformers with Twin Uniform Quantization Zhihang Yuan, Chenhao Xue, Yiqi Chen, Qiang Wu, Guangyu Sun

PDF

PTSEFormer: Progressive Temporal-Spatial Enhanced TransFormer Towards Video Object Detection Han Wang, Jun Tang, Xiaodong Liu, Shanyan Guan, Rong Xie, Li Song

PDF

Pure Transformer with Integrated Experts for Scene Text Recognition Yew Lee Tan, Adams Wai-Kin Kong, Jung-Jae Kim

PDF

Q-FW: A Hybrid Classical-Quantum Frank-Wolfe for Quadratic Binary Optimization Alp Yurtsever, Tolga Birdal, Vladislav Golyanik

PDF

QISTA-ImageNet: A Deep Compressive Image Sensing Framework Solving Lq-Norm Optimization Problem Gang-Xuan Lin, Shih-Wei Hu, Chun-Shien Lu

PDF

Quantized GAN for Complex Music Generation from Dance Videos Ye Zhu, Kyle Olszewski, Yu Wu, Panos Achlioptas, Menglei Chai, Yan Yan, Sergey Tulyakov

PDF

Quantum Motion Segmentation Federica Arrigoni, Willi Menapace, Marcel Seelbach Benkner, Elisa Ricci, Vladislav Golyanik

PDF

Quasi-Balanced Self-Training on Noise-Aware Synthesis of Object Point Clouds for Closing Domain Gap Yongwei Chen, Zihao Wang, Longkun Zou, Ke Chen, Kui Jia

PDF

R-DFCIL: Relation-Guided Representation Learning for Data-Free Class Incremental Learning Qiankun Gao, Chen Zhao, Bernard Ghanem, Jian Zhang

PDF

R2L: Distilling Neural Radiance Field to Neural Light Field for Efficient Novel View Synthesis Huan Wang, Jian Ren, Zeng Huang, Kyle Olszewski, Menglei Chai, Yun Fu, Sergey Tulyakov

PDF

RA-Depth: Resolution Adaptive Self-Supervised Monocular Depth Estimation Mu He, Le Hui, Yikai Bian, Jian Ren, Jin Xie, Jian Yang

PDF

Radatron: Accurate Detection Using Multi-Resolution Cascaded MIMO Radar Sohrab Madani, Jayden Guan, Waleed Ahmed, Saurabh Gupta, Haitham Hassanieh

PDF

RadioTransformer: A Cascaded Global-Focal Transformer for Visual Attention-Guided Disease Classification Moinak Bhattacharya, Shubham Jain, Prateek Prasanna

PDF

RamGAN: Region Attentive Morphing GAN for Region-Level Makeup Transfer Jianfeng Xiang, Junliang Chen, Wenshuang Liu, Xianxu Hou, Linlin Shen

PDF

RankSeg: Adaptive Pixel Classification with Image Category Ranking for Segmentation Haodi He, Yuhui Yuan, Xiangyu Yue, Han Hu

PDF

RAWtoBit: A Fully End-to-End Camera ISP Network Wooseok Jeong, Seung-Won Jung

PDF

Rayleigh EigenDirections (REDs): Nonlinear GAN Latent Space Traversals for Multidimensional Features Guha Balakrishnan, Raghudeep Gadde, Aleix Martinez, Pietro Perona

PDF

RayTran: 3D Pose Estimation and Shape Reconstruction of Multiple Objects from Videos with Ray-Traced Transformers Michał J. Tyszkiewicz, Kevis-Kokitsi Maninis, Stefan Popov, Vittorio Ferrari

PDF

RBC: Rectifying the Biased Context in Continual Semantic Segmentation Hanbin Zhao, Fengyu Yang, Xinghe Fu, Xi Li

PDF

RBP-Pose: Residual Bounding Box Projection for Category-Level Pose Estimation Ruida Zhang, Yan Di, Zhiqiang Lou, Fabian Manhardt, Federico Tombari, Xiangyang Ji

PDF

RC-MVSNet: Unsupervised Multi-View Stereo with Neural Rendering Di Chang, Aljaž Božič, Tong Zhang, Qingsong Yan, Yingcong Chen, Sabine Süsstrunk, Matthias Nießner

PDF

RCLane: Relay Chain Prediction for Lane Detection Shenghua Xu, Xinyue Cai, Bin Zhao, Li Zhang, Hang Xu, Yanwei Fu, Xiangyang Xue

PDF

RDA: Reciprocal Distribution Alignment for Robust Semi-Supervised Learning Yue Duan, Lei Qi, Lei Wang, Luping Zhou, Yinghuan Shi

PDF

RDO-Q: Extremely Fine-Grained Channel-Wise Quantization via Rate-Distortion Optimization Zhe Wang, Jie Lin, Xue Geng, Mohamed M. Sabry Aly, Vijay Chandrasekhar

PDF

ReAct: Temporal Action Detection with Relational Queries Dingfeng Shi, Yujie Zhong, Qiong Cao, Jing Zhang, Lin Ma, Jia Li, Dacheng Tao

PDF

Real Spike: Learning Real-Valued Spikes for Spiking Neural Networks Yufei Guo, Liwen Zhang, Yuanpei Chen, Xinyi Tong, Xiaode Liu, YingLei Wang, Xuhui Huang, Zhe Ma

PDF

Real-RawVSR: Real-World Raw Video Super-Resolution with a Benchmark Dataset Huanjing Yue, Zhiming Zhang, Jingyu Yang

PDF

Real-Time Intermediate Flow Estimation for Video Frame Interpolation Zhewei Huang, Tianyuan Zhang, Wen Heng, Boxin Shi, Shuchang Zhou

PDF

Real-Time Neural Character Rendering with Pose-Guided Multiplane Images Hao Ouyang, Bo Zhang, Pan Zhang, Hao Yang, Jiaolong Yang, Dong Chen, Qifeng Chen, Fang Wen

PDF

Real-Time Online Video Detection with Temporal Smoothing Transformers Yue Zhao, Philipp Krähenbühl

PDF

RealFlow: EM-Based Realistic Optical Flow Dataset Generation from Videos Yunhui Han, Kunming Luo, Ao Luo, Jiangyu Liu, Haoqiang Fan, Guiming Luo, Shuaicheng Liu

PDF

Realistic Blur Synthesis for Learning Image Deblurring Jaesung Rim, Geonung Kim, Jungeon Kim, Junyong Lee, Seungyong Lee, Sunghyun Cho

PDF

Realistic One-Shot Mesh-Based Head Avatars Taras Khakhulin, Vanessa Sklyarova, Victor Lempitsky, Egor Zakharov

PDF

RealPatch: A Statistical Matching Framework for Model Patching with Real Samples Sara Romiti, Christopher Inskip, Viktoriia Sharmanska, Novi Quadrianto

PDF

REALY: Rethinking the Evaluation of 3D Face Reconstruction Zenghao Chai, Haoxian Zhang, Jing Ren, Di Kang, Zhengzhuo Xu, Xuefei Zhe, Chun Yuan, Linchao Bao

PDF

ReCoNet: Recurrent Correction Network for Fast and Efficient Multi-Modality Image Fusion Zhanbo Huang, Jinyuan Liu, Xin Fan, Risheng Liu, Wei Zhong, Zhongxuan Luo

PDF

Recover Fair Deep Classification Models via Altering Pre-Trained Structure Yanfu Zhang, Shangqian Gao, Heng Huang

PDF

Recurrent Bilinear Optimization for Binary Neural Networks Sheng Xu, Yanjing Li, Tiancheng Wang, Teli Ma, Baochang Zhang, Peng Gao, Yu Qiao, Jinhu Lü, Guodong Guo

PDF

Reducing Information Loss for Spiking Neural Networks Yufei Guo, Yuanpei Chen, Liwen Zhang, YingLei Wang, Xiaode Liu, Xinyi Tong, Yuanyuan Ou, Xuhui Huang, Zhe Ma

PDF

Reference-Based Image Super-Resolution with Deformable Attention Transformer Jiezhang Cao, Jingyun Liang, Kai Zhang, Yawei Li, Yulun Zhang, Wenguan Wang, Luc Van Gool

PDF

Referring Object Manipulation of Natural Images with Conditional Classifier-Free Guidance Myungsub Choi

PDF

RegionCL: Exploring Contrastive Region Pairs for Self-Supervised Representation Learning Yufei Xu, Qiming Zhang, Jing Zhang, Dacheng Tao

PDF

Registration Based Few-Shot Anomaly Detection Chaoqin Huang, Haoyan Guan, Aofan Jiang, Ya Zhang, Michael Spratling, Yan-Feng Wang

PDF

Regularizing Vector Embedding in Bottom-up Human Pose Estimation Haixin Wang, Lu Zhou, Yingying Chen, Ming Tang, Jinqiao Wang

PDF

Relationformer: A Unified Framework for Image-to-Graph Generation Suprosanna Shit, Rajat Koner, Bastian Wittmann, Johannes Paetzold, Ivan Ezhov, Hongwei Li, Jiazhen Pan, Sahand Sharifzadeh, Georgios Kaissis, Volker Tresp, Bjoern Menze

PDF

Relationship Spatialization for Depth Estimation Xiaoyu Xu, Jiayan Qiu, Xinchao Wang, Zhou Wang

PDF

Relative Contrastive Loss for Unsupervised Representation Learning Shixiang Tang, Feng Zhu, Lei Bai, Rui Zhao, Wanli Ouyang

PDF

Relative Pose from SIFT Features Daniel Barath, Zuzana Kukelova

PDF

Reliability-Aware Prediction via Uncertainty Learning for Person Image Retrieval Zhaopeng Dou, Zhongdao Wang, Weihua Chen, Yali Li, Shengjin Wang

PDF

Reliable Visual Question Answering: Abstain Rather than Answer Incorrectly Spencer Whitehead, Suzanne Petryk, Vedaad Shakib, Joseph Gonzalez, Trevor Darrell, Anna Rohrbach, Marcus Rohrbach

PDF

Relighting4D: Neural Relightable Human from Videos Zhaoxi Chen, Ziwei Liu

PDF

RelPose: Predicting Probabilistic Relative Rotation for Single Objects in the Wild Jason Y. Zhang, Deva Ramanan, Shubham Tulsiani

PDF

Remote Respiration Monitoring of Moving Person Using Radio Signals Jae-Ho Choi, Ki-Bong Kang, Kyung-Tae Kim

PDF

RepMix: Representation Mixing for Robust Attribution of Synthesized Images Tu Bui, Ning Yu, John Collomosse

PDF

Resolution-Free Point Cloud Sampling Network with Data Distillation Tianxin Huang, Jiangning Zhang, Jun Chen, Yuang Liu, Yong Liu

PDF

Resolving Copycat Problems in Visual Imitation Learning via Residual Action Prediction Chia-Chi Chuang, Donglin Yang, Chuan Wen, Yang Gao

PDF

Responsive Listening Head Generation: A Benchmark Dataset and Baseline Mohan Zhou, Yalong Bai, Wei Zhang, Ting Yao, Tiejun Zhao, Tao Mei

PDF

Restore Globally, Refine Locally: A Mask-Guided Scheme to Accelerate Super-Resolution Networks Xiaotao Hu, Jun Xu, Shuhang Gu, Ming-Ming Cheng, Li Liu

PDF

Rethinking Closed-Loop Training for Autonomous Driving Chris Zhang, Runsheng Guo, Wenyuan Zeng, Yuwen Xiong, Binbin Dai, Rui Hu, Mengye Ren, Raquel Urtasun

PDF

Rethinking Clustering-Based Pseudo-Labeling for Unsupervised Meta-Learning Xingping Dong, Jianbing Shen, Ling Shao

PDF

Rethinking Confidence Calibration for Failure Prediction Fei Zhu, Zhen Cheng, Xu-Yao Zhang, Cheng-Lin Liu

PDF

Rethinking Data Augmentation for Robust Visual Question Answering Long Chen, Yuhang Zheng, Jun Xiao

PDF

Rethinking Few-Shot Object Detection on a Multi-Domain Benchmark Kibok Lee, Hao Yang, Satyaki Chakraborty, Zhaowei Cai, Gurumurthy Swaminathan, Avinash Ravichandran, Onkar Dabeer

PDF

Rethinking Generic Camera Models for Deep Single Image Camera Calibration to Recover Rotation and Fisheye Distortion Nobuhiko Wakai, Satoshi Sato, Yasunori Ishii, Takayoshi Yamashita

PDF

Rethinking IoU-Based Optimization for Single-Stage 3D Object Detection Hualian Sheng, Sijia Cai, Na Zhao, Bing Deng, Jianqiang Huang, Xian-Sheng Hua, Min-Jian Zhao, Gim Hee Lee

PDF

Rethinking Keypoint Representations: Modeling Keypoints and Poses as Objects for Multi-Person Human Pose Estimation William McNally, Kanav Vats, Alexander Wong, John McPhee

PDF

Rethinking Learning Approaches for Long-Term Action Anticipation Megha Nawhal, Akash Abdu Jyothi, Greg Mori

PDF

Rethinking Robust Representation Learning Under Fine-Grained Noisy Faces Bingqi Ma, Guanglu Song, Boxiao Liu, Yu Liu

PDF

Rethinking Video Rain Streak Removal: A New Synthesis Model and a Deraining Network with Video Rain Prior Shuai Wang, Lei Zhu, Huazhu Fu, Jing Qin, Carola-Bibiane Schönlieb, Wei Feng, Song Wang

PDF

Rethinking Zero-Shot Action Recognition: Learning from Latent Atomic Actions Yijun Qian, Lijun Yu, Wenhe Liu, Alexander G. Hauptmann

PDF

Revisiting a kNN-Based Image Classification System with High-Capacity Storage Kengo Nakata, Youyang Ng, Daisuke Miyashita, Asuka Maki, Yu-Chieh Lin, Jun Deguchi

PDF

Revisiting Batch Norm Initialization Jim Davis, Logan Frank

PDF

Revisiting Outer Optimization in Adversarial Training Ali Dabouei, Fariborz Taherkhani, Sobhan Soleymani, Nasser M. Nasrabadi

PDF

Revisiting Point Cloud Simplification: A Learnable Feature Preserving Approach Rolandos Alexandros Potamias, Giorgos Bouritsas, Stefanos Zafeiriou

PDF

Revisiting the Critical Factors of Augmentation-Invariant Representation Learning Junqiang Huang, Xiangwen Kong, Xiangyu Zhang

PDF

RFLA: Gaussian Receptive Field Based Label Assignment for Tiny Object Detection Chang Xu, Jinwang Wang, Wen Yang, Huai Yu, Lei Yu, Gui-Song Xia

PDF

RFNet-4D: Joint Object Reconstruction and Flow Estimation from 4D Point Clouds Tuan-Anh Vu, Thanh Nguyen, Binh-Son Hua, Quang-Hieu Pham, Sai-Kit Yeung

PDF

RIBAC: Towards Robust and Imperceptible Backdoor Attack Against Compact DNN Huy Phan, Cong Shi, Yi Xie, Tianfang Zhang, Zhuohang Li, Tianming Zhao, Jian Liu, Yan Wang, Yingying Chen, Bo Yuan

PDF

RigNet: Repetitive Image Guided Network for Depth Completion Zhiqiang Yan, Kun Wang, Xiang Li, Zhenyu Zhang, Jun Li, Jian Yang

PDF

Robust Category-Level 6d Pose Estimation with Coarse-to-Fine Rendering of Neural Features Wufei Ma, Angtian Wang, Alan Yuille, Adam Kortylewski

PDF

Robust Landmark-Based Stent Tracking in X-Ray Fluoroscopy Luojie Huang, Yikang Liu, Li Chen, Eric Z. Chen, Xiao Chen, Shanhui Sun

PDF

Robust Multi-Object Tracking by Marginal Inference Yifu Zhang, Chunyu Wang, Xinggang Wang, Wenjun Zeng, Wenyu Liu

PDF

Robust Network Architecture Search via Feature Distortion Restraining Yaguan Qian, Shenghui Huang, Bin Wang, Xiang Ling, Xiaohui Guan, Zhaoquan Gu, Shaoning Zeng, Wujie Zhou, Haijiang Wang

PDF

Robust Object Detection with Inaccurate Bounding Boxes Chengxin Liu, Kewei Wang, Hao Lu, Zhiguo Cao, Ziming Zhang

PDF

Robust Visual Tracking by Segmentation Matthieu Paul, Martin Danelljan, Christoph Mayer, Luc Van Gool

PDF

Rotation Regularization Without Rotation Takumi Kobayashi

PDF

RRSR:Reciprocal Reference-Based Image Super-Resolution with Progressive Feature Alignment and Selection Lin Zhang, Xin Li, Dongliang He, Fu Li, Yili Wang, Zhaoxiang Zhang

PDF

RVSL: Robust Vehicle Similarity Learning in Real Hazy Scenes Based on Semi-Supervised Learning Wei-Ting Chen, I-Hsiang Chen, Chih-Yuan Yeh, Hao-Hsiang Yang, Hua-En Chang, Jian-Jiun Ding, Sy-Yen Kuo

PDF

S2-VER: Semi-Supervised Visual Emotion Recognition Guoli Jia, Jufeng Yang

PDF

S2Contact: Graph-Based Network for 3D Hand-Object Contact Estimation with Semi-Supervised Learning Tze Ho Elden Tse, Zhongqun Zhang, Kwang In Kim, Aleš Leonardis, Feng Zheng, Hyung Jin Chang

PDF

S2F2: Single-Stage Flow Forecasting for Future Multiple Trajectories Prediction Yu-Wen Chen, Hsuan-Kung Yang, Chu-Chi Chiu, Chun-Yi Lee

PDF

S2N: Suppression-Strengthen Network for Event-Based Recognition Under Variant Illuminations Zengyu Wan, Yang Wang, Ganchao Tan, Yang Cao, Zheng-Jun Zha

PDF

S2Net: Stochastic Sequential Pointcloud Forecasting Xinshuo Weng, Junyu Nan, Kuan-Hui Lee, Rowan McAllister, Adrien Gaidon, Nicholas Rhinehart, Kris M. Kitani

PDF

S3C: Self-Supervised Stochastic Classifiers for Few-Shot Class-Incremental Learning Jayateja Kalla, Soma Biswas

PDF

SAFA: Sample-Adaptive Feature Augmentation for Long-Tailed Image Classification Yan Hong, Jianfu Zhang, Zhongyi Sun, Ke Yan

PDF

SAGA: Stochastic Whole-Body Grasping with Contact Yan Wu, Jiahao Wang, Yan Zhang, Siwei Zhang, Otmar Hilliges, Fisher Yu, Siyu Tang

PDF

Saliency Hierarchy Modeling via Generative Kernels for Salient Object Detection Wenhu Zhang, Liangli Zheng, Huanyu Wang, Xintian Wu, Xi Li

PDF

Salient Object Detection for Point Clouds Songlin Fan, Wei Gao, Ge Li

PDF

SALISA: Saliency-Based Input Sampling for Efficient Video Object Detection Babak Ehteshami Bejnordi, Amirhossein Habibian, Fatih Porikli, Amir Ghodrati

PDF

SALVe: Semantic Alignment Verification for Floorplan Reconstruction from Sparse Panoramas John Lambert, Yuguang Li, Ivaylo Boyadzhiev, Lambert Wixson, Manjunath Narayana, Will Hutchcroft, James Hays, Frank Dellaert, Sing Bing Kang

PDF

SAU: Smooth Activation Function Using Convolution with Approximate Identities Koushik Biswas, Sandeep Kumar, Shilpak Banerjee, Ashish Kumar Pandey

PDF

SC-wLS: Towards Interpretable Feed-Forward Camera Re-Localization Xin Wu, Hao Zhao, Shunkai Li, Yingdian Cao, Hongbin Zha

PDF

Scalable Learning to Optimize: A Learned Optimizer Can Train Big Models Xuxi Chen, Tianlong Chen, Yu Cheng, Weizhu Chen, Ahmed Awadallah, Zhangyang Wang

PDF

ScalableViT: Rethinking the Context-Oriented Generalization of Vision Transformer Rui Yang, Hailong Ma, Jie Wu, Yansong Tang, Xuefeng Xiao, Min Zheng, Xiu Li

PDF

Scale-Aware Spatio-Temporal Relation Learning for Video Anomaly Detection Guoqiu Li, Guanxiong Cai, Xingyu Zeng, Rui Zhao

PDF

ScaleNet: Searching for the Model to Scale Jiyang Xie, Xiu Su, Shan You, Zhanyu Ma, Fei Wang, Chen Qian

PDF

Scaling Adversarial Training to Large Perturbation Bounds Sravanti Addepalli, Samyak Jain, Gaurang Sriramanan, R. Venkatesh Babu

PDF

Scaling Open-Vocabulary Image Segmentation with Image-Level Labels Golnaz Ghiasi, Xiuye Gu, Yin Cui, Tsung-Yi Lin

PDF

SCAM! Transferring Humans Between Images with Semantic Cross Attention Modulation Nicolas Dufour, David Picard, Vicky Kalogeiton

PDF

Scene Text Recognition with Permuted Autoregressive Sequence Models Darwin Bautista, Rowel Atienza

PDF

Scraping Textures from Natural Images for Synthesis and Editing Xueting Li, Xiaolong Wang, Ming-Hsuan Yang, Alexei A. Efros, Sifei Liu

PDF

SdAE: Self-Distillated Masked Autoencoder Yabo Chen, Yuchen Liu, Dongsheng Jiang, Xiaopeng Zhang, Wenrui Dai, Hongkai Xiong, Qi Tian

PDF

SecretGen: Privacy Recovery on Pre-Trained Models via Distribution Discrimination Zhuowen Yuan, Fan Wu, Yunhui Long, Chaowei Xiao, Bo Li

PDF

Secrets of Event-Based Optical Flow Shintaro Shiba, Yoshimitsu Aoki, Guillermo Gallego

PDF

SeedFormer: Patch Seeds Based Point Cloud Completion with Upsample Transformer Haoran Zhou, Yun Cao, Wenqing Chu, Junwei Zhu, Tong Lu, Ying Tai, Chengjie Wang

PDF

Seeing Far in the Dark with Patterned Flash Zhanghao Sun, Jian Wang, Yicheng Wu, Shree Nayar

PDF

Seeing Through a Black Box: Toward High-Quality Terahertz Imaging via Subspace-and-Attention Guided Restoration Weng-Tai Su, Yi-Chun Hung, Po-Jen Yu, Shang-Hua Yang, Chia-Wen Lin

PDF

SegPGD: An Effective and Efficient Adversarial Attack for Evaluating and Boosting Segmentation Robustness Jindong Gu, Hengshuang Zhao, Volker Tresp, Philip H. S. Torr

PDF

Selection and Cross Similarity for Event-Image Deep Stereo Hoonhee Cho, Kuk-Jin Yoon

PDF

SelectionConv: Convolutional Neural Networks for Non-Rectilinear Image Data David Hart, Michael Whitney, Bryan Morse

PDF

Selective Query-Guided Debiasing for Video Corpus Moment Retrieval Sunjae Yoon, Ji Woo Hong, Eunseop Yoon, Dahyun Kim, Junyeong Kim, Hee Suk Yoon, Chang D. Yoo

PDF

Selective TransHDR: Transformer-Based Selective HDR Imaging Using Ghost Region Mask Jou Won Song, Ye-In Park, Kyeongbo Kong, Jaeho Kwak, Suk-Ju Kang

PDF

Self-Calibrating Photometric Stereo by Neural Inverse Rendering Junxuan Li, Hongdong Li

PDF

Self-Constrained Inference Optimization on Structural Groups for Human Pose Estimation Zhehan Kan, Shuoshuo Chen, Zeng Li, Zhihai He

PDF

Self-Distillation for Robust LiDAR Semantic Segmentation in Autonomous Driving Jiale Li, Hang Dai, Yong Ding

PDF

Self-Distilled Feature Aggregation for Self-Supervised Monocular Depth Estimation Zhengming Zhou, Qiulei Dong

PDF

Self-Feature Distillation with Uncertainty Modeling for Degraded Image Recognition Zhou Yang, Weisheng Dong, Xin Li, Jinjian Wu, Leida Li, Guangming Shi

PDF

Self-Filtering: A Noise-Aware Sample Selection for Label Noise with Confidence Penalization Qi Wei, Haoliang Sun, Xiankai Lu, Yilong Yin

PDF

Self-Promoted Supervision for Few-Shot Transformer Bowen Dong, Pan Zhou, Shuicheng Yan, Wangmeng Zuo

PDF

Self-Regulated Feature Learning via Teacher-Free Feature Distillation Lujun Li

PDF

Self-Slimmed Vision Transformer Zhuofan Zong, Kunchang Li, Guanglu Song, Yali Wang, Yu Qiao, Biao Leng, Yu Liu

PDF

Self-Supervised Classification Network Elad Amrani, Leonid Karlinsky, Alex Bronstein

PDF

Self-Supervised Human Mesh Recovery with Cross-Representation Alignment Xuan Gong, Meng Zheng, Benjamin Planche, Srikrishna Karanam, Terrence Chen, David Doermann, Ziyan Wu

PDF

Self-Supervised Interactive Object Segmentation Through a Singulation-and-Grasping Approach Houjian Yu, Changhyun Choi

PDF

Self-Supervised Learning for Real-World Super-Resolution from Dual Zoomed Observations Zhilu Zhang, Ruohao Wang, Hongzhi Zhang, Yunjin Chen, Wangmeng Zuo

PDF

Self-Supervised Learning of Visual Graph Matching Chang Liu, Shaofeng Zhang, Xiaokang Yang, Junchi Yan

PDF

Self-Supervised Social Relation Representation for Human Group Detection Jiacheng Li, Ruize Han, Haomin Yan, Zekun Qian, Wei Feng, Song Wang

PDF

Self-Supervised Sparse Representation for Video Anomaly Detection Jhih-Ciang Wu, He-Yen Hsieh, Ding-Jie Chen, Chiou-Shann Fuh, Tyng-Luh Liu

PDF

Self-Supervision Can Be a Good Few-Shot Learner Yuning Lu, Liangjian Wen, Jianzhuang Liu, Yajing Liu, Xinmei Tian

PDF

Self-Support Few-Shot Semantic Segmentation Qi Fan, Wenjie Pei, Yu-Wing Tai, Chi-Keung Tang

PDF

Sem2NeRF: Converting Single-View Semantic Masks to Neural Radiance Fields Yuedong Chen, Qianyi Wu, Chuanxia Zheng, Tat-Jen Cham, Jianfei Cai

PDF

Semantic Novelty Detection via Relational Reasoning Francesco Cappio Borlino, Silvia Bucci, Tatiana Tommasi

PDF

Semantic-Aware Fine-Grained Correspondence Yingdong Hu, Renhao Wang, Kaifeng Zhang, Yang Gao

PDF

Semantic-Aware Implicit Neural Audio-Driven Video Portrait Generation Xian Liu, Yinghao Xu, Qianyi Wu, Hang Zhou, Wayne Wu, Bolei Zhou

PDF

Semantic-Guided Multi-Mask Image Harmonization Xuqian Ren, Yifan Liu

PDF

Semantic-Sparse Colorization Network for Deep Exemplar-Based Colorization Yunpeng Bai, Chao Dong, Zenghao Chai, Andong Wang, Zhengzhuo Xu, Chun Yuan

PDF

SemAug: Semantically Meaningful Image Augmentations for Object Detection Through Language Grounding Morgan Heisler, Amin Banitalebi-Dehkordi, Yong Zhang

PDF

Semi-Leak: Membership Inference Attacks Against Semi-Supervised Learning Xinlei He, Hongbin Liu, Neil Zhenqiang Gong, Yang Zhang

PDF

Semi-Supervised 3D Object Detection with Proficient Teachers Junbo Yin, Jin Fang, Dingfu Zhou, Liangjun Zhang, Cheng-Zhong Xu, Jianbing Shen, Wenguan Wang

PDF

Semi-Supervised Keypoint Detector and Descriptor for Retinal Image Matching Jiazhen Liu, Xirong Li, Qijie Wei, Jie Xu, Dayong Ding

PDF

Semi-Supervised Learning of Optical Flow by Flow Supervisor Woobin Im, Sebin Lee, Sung-Eui Yoon

PDF

Semi-Supervised Monocular 3D Object Detection by Multi-View Consistency Qing Lian, Yanbo Xu, Weilong Yao, Yingcong Chen, Tong Zhang

PDF

Semi-Supervised Object Detection via Virtual Category Learning Changrui Chen, Kurt Debattista, Jungong Han

PDF

Semi-Supervised Single-View 3D Reconstruction via Prototype Shape Priors Zhen Xing, Hengduo Li, Zuxuan Wu, Yu-Gang Jiang

PDF

Semi-Supervised Temporal Action Detection with Proposal-Free Masking Sauradip Nag, Xiatian Zhu, Yi-Zhe Song, Tao Xiang

PDF

Semi-Supervised Vision Transformers Zejia Weng, Xitong Yang, Ang Li, Zuxuan Wu, Yu-Gang Jiang

PDF

SEMICON: A Learning-to-Hash Solution for Large-Scale Fine-Grained Image Retrieval Yang Shen, Xuhao Sun, Xiu-Shen Wei, Qing-Yuan Jiang, Jian Yang

PDF

Semidefinite Relaxations of Truncated Least-Squares in Robust Rotation Search: Tight or Not Liangzu Peng, Mahyar Fazlyab, René Vidal

PDF

SepLUT: Separable Image-Adaptive Lookup Tables for Real-Time Image Enhancement Canqian Yang, Meiguang Jin, Yi Xu, Rui Zhang, Ying Chen, Huaida Liu

PDF

SeqFormer: Sequential Transformer for Video Instance Segmentation Junfeng Wu, Yi Jiang, Song Bai, Wenqing Zhang, Xiang Bai

PDF

SeqTR: A Simple yet Universal Network for Visual Grounding Chaoyang Zhu, Yiyi Zhou, Yunhang Shen, Gen Luo, Xingjia Pan, Mingbao Lin, Chao Chen, Liujuan Cao, Xiaoshuai Sun, Rongrong Ji

PDF

Sequential Multi-View Fusion Network for Fast LiDAR Point Motion Estimation Gang Zhang, Xiaoyan Li, Zhenhua Wang

PDF

SESS: Saliency Enhancing with Scaling and Sliding Osman Tursun, Simon Denman, Sridha Sridharan, Clinton Fookes

PDF

SGBANet: Semantic GAN and Balanced Attention Network for Arbitrarily Oriented Scene Text Recognition Dajian Zhong, Shujing Lyu, Palaiahnakote Shivakumara, Bing Yin, Jiajia Wu, Umapada Pal, Yue Lu

PDF

Shap-CAM: Visual Explanations for Convolutional Neural Networks Based on Shapley Value Quan Zheng, Ziwei Wang, Jie Zhou, Jiwen Lu

PDF

Shape Matters: Deformable Patch Attack Zhaoyu Chen, Bo Li, Shuang Wu, Jianghe Xu, Shouhong Ding, Wenqiang Zhang

PDF

Shape-Pose Disentanglement Using SE(3)-Equivariant Vector Neurons Oren Katzir, Dani Lischinski, Daniel Cohen-Or

PDF

ShAPO: Implicit Representations for Multi-Object Shape, Appearance, and Pose Optimization Muhammad Zubair Irshad, Sergey Zakharov, Rareș Ambruș, Thomas Kollar, Zsolt Kira, Adrien Gaidon

PDF

Share with Thy Neighbors: Single-View Reconstruction by Cross-Instance Consistency Tom Monnier, Matthew Fisher, Alexei A. Efros, Mathieu Aubry

PDF

Shift-Tolerant Perceptual Similarity Metric Abhijay Ghildyal, Feng Liu

PDF

Should All Proposals Be Treated Equally in Object Detection? Yunsheng Li, Yinpeng Chen, Xiyang Dai, Dongdong Chen, Mengchen Liu, Pei Yu, Ying Jin, Lu Yuan, Zicheng Liu, Nuno Vasconcelos

PDF

SiamDoGe: Domain Generalizable Semantic Segmentation Using Siamese Network Zhenyao Wu, Xinyi Wu, Xiaoping Zhang, Lili Ju, Song Wang

PDF

Sim-2-Sim Transfer for Vision-and-Language Navigation in Continuous Environments Jacob Krantz, Stefan Lee

PDF

Sim-to-Real 6d Object Pose Estimation via Iterative Self-Training for Robotic Bin Picking Kai Chen, Rui Cao, Stephen James, Yichuan Li, Yun-Hui Liu, Pieter Abbeel, Qi Dou

PDF

SimCC: A Simple Coordinate Classification Perspective for Human Pose Estimation Yanjie Li, Sen Yang, Peidong Liu, Shoukui Zhang, Yunxiao Wang, Zhicheng Wang, Wankou Yang, Shu-Tao Xia

PDF

Simple Baselines for Image Restoration Liangyu Chen, Xiaojie Chu, Xiangyu Zhang, Jian Sun

PDF

Simple Open-Vocabulary Object Detection with Vision Transformers Matthias Minderer, Alexey Gritsenko, Austin Stone, Maxim Neumann, Dirk Weissenborn, Alexey Dosovitskiy, Aravindh Mahendran, Anurag Arnab, Mostafa Dehghani, Zhuoran Shen, Xiao Wang, Xiaohua Zhai, Thomas Kipf, Neil Houlsby

PDF

SimpleRecon: 3D Reconstruction Without 3D Convolutions Mohamed Sayed, John Gibson, Jamie Watson, Victor Prisacariu, Michael Firman, Clément Godard

PDF

Single Frame Atmospheric Turbulence Mitigation: A Benchmark Study and a New Physics-Inspired Transformer Model Zhiyuan Mao, Ajay Jaiswal, Zhangyang Wang, Stanley H. Chan

PDF

Single Stage Virtual Try-on via Deformable Attention Flows Shuai Bai, Huiling Zhou, Zhikang Li, Chang Zhou, Hongxia Yang

PDF

Single-Stream Multi-Level Alignment for Vision-Language Pretraining Zaid Khan, B G Vijay Kumar, Xiang Yu, Samuel Schulter, Manmohan Chandraker, Yun Fu

PDF

SinNeRF: Training Neural Radiance Fields on Complex Scenes from a Single Image Dejia Xu, Yifan Jiang, Peihao Wang, Zhiwen Fan, Humphrey Shi, Zhangyang Wang

PDF

SiRi: A Simple Selective Retraining Mechanism for Transformer-Based Visual Grounding Mengxue Qu, Yu Wu, Wu Liu, Qiqi Gong, Xiaodan Liang, Olga Russakovsky, Yao Zhao, Yunchao Wei

PDF

Skeleton-Free Pose Transfer for Stylized 3D Characters Zhouyingcheng Liao, Jimei Yang, Jun Saito, Gerard Pons-Moll, Yang Zhou

PDF

Skeleton-Parted Graph Scattering Networks for 3D Human Motion Prediction Maosen Li, Siheng Chen, Zijing Zhang, Lingxi Xie, Qi Tian, Ya Zhang

PDF

SketchSampler: Sketch-Based 3D Reconstruction via View-Dependent Depth Sampling Chenjian Gao, Qian Yu, Lu Sheng, Yi-Zhe Song, Dong Xu

PDF

Sliced Recursive Transformer Zhiqiang Shen, Zechun Liu, Eric Xing

PDF

SLiDE: Self-Supervised LiDAR De-Snowing Through Reconstruction Difficulty Gwangtak Bae, Byungjun Kim, Seongyong Ahn, Jihong Min, Inwook Shim

PDF

Slim Scissors: Segmenting Thin Object from Synthetic Background Kunyang Han, Jun Hao Liew, Jiashi Feng, Huawei Tian, Yao Zhao, Yunchao Wei

PDF

SLIP: Self-Supervision Meets Language-Image Pre-Training Norman Mu, Alexander Kirillov, David Wagner, Saining Xie

PDF

SmoothNet: A Plug-and-Play Network for Refining Human Poses in Videos Ailing Zeng, Lei Yang, Xuan Ju, Jiefeng Li, Jianyi Wang, Qiang Xu

PDF

SNeS: Learning Probably Symmetric Neural Surfaces from Incomplete Data Eldar Insafutdinov, Dylan Campbell, João F. Henriques, Andrea Vedaldi

PDF

Sobolev Training for Implicit Neural Representations with Approximated Image Derivatives Wentao Yuan, Qingtian Zhu, Xiangyue Liu, Yikang Ding, Haotian Zhang, Chi Zhang

PDF

Social ODE: Multi-Agent Trajectory Forecasting with Neural Ordinary Differential Equations Song Wen, Hao Wang, Dimitris N. Metaxas

PDF

Social-Implicit: Rethinking Trajectory Prediction Evaluation and the Effectiveness of Implicit Maximum Likelihood Estimation Abduallah Mohamed, Deyao Zhu, Warren Vu, Mohamed Elhoseiny, Christian Claudel

PDF

Social-SSL: Self-Supervised Cross-Sequence Representation Learning Based on Transformers for Multi-Agent Trajectory Prediction Li-Wu Tsao, Yan-Kai Wang, Hao-Siang Lin, Hong-Han Shuai, Lai-Kuan Wong, Wen-Huang Cheng

PDF

SocialVAE: Human Trajectory Prediction Using Timewise Latents Pei Xu, Jean-Bernard Hayet, Ioannis Karamouzas

PDF

Soft Masking for Cost-Constrained Channel Pruning Ryan Humble, Maying Shen, Jorge Albericio Latorre, Eric Darve, Jose Alvarez

PDF

Solution Space Analysis of Essential Matrix Based on Algebraic Error Minimization Gaku Nakano

PDF

SOS! Self-Supervised Learning over Sets of Handled Objects in Egocentric Action Recognition Victor Escorcia, Ricardo Guerrero, Xiatian Zhu, Brais Martinez

PDF

Sound Localization by Self-Supervised Time Delay Estimation Ziyang Chen, David F. Fouhey, Andrew Owens

PDF

Sound-Guided Semantic Video Generation Seung Hyun Lee, Gyeongrok Oh, Wonmin Byeon, Chanyoung Kim, Won Jeong Ryoo, Sang Ho Yoon, Hyunjun Cho, Jihyun Bae, Jinkyu Kim, Sangpil Kim

PDF

Source-Free Domain Adaptation with Contrastive Domain Alignment and Self-Supervised Exploration for Face Anti-Spoofing Yuchen Liu, Yabo Chen, Wenrui Dai, Mengran Gou, Chun-Ting Huang, Hongkai Xiong

PDF

Source-Free Video Domain Adaptation by Learning Temporal Consistency for Action Recognition Yuecong Xu, Jianfei Yang, Haozhi Cao, Keyu Wu, Min Wu, Zhenghua Chen

PDF

SP-Net: Slowly Progressing Dynamic Inference Networks Huanyu Wang, Wenhu Zhang, Shihao Su, Hui Wang, Zhenwei Miao, Xin Zhan, Xi Li

PDF

Space-Partitioning RANSAC Daniel Barath, Gábor Valasek

PDF

SparseNeuS: Fast Generalizable Neural Surface Reconstruction from Sparse Views Xiaoxiao Long, Cheng Lin, Peng Wang, Taku Komura, Wenping Wang

PDF

Spatial and Visual Perspective-Taking via View Rotation and Relation Reasoning for Embodied Reference Understanding Cheng Shi, Sibei Yang

PDF

Spatial-Frequency Domain Information Integration for Pan-Sharpening Man Zhou, Jie Huang, Keyu Yan, Hu Yu, Xueyang Fu, Aiping Liu, Xian Wei, Feng Zhao

PDF

Spatial-Separated Curve Rendering Network for Efficient and High-Resolution Image Harmonization Jingtang Liang, Xiaodong Cun, Chi-Man Pun, Jue Wang

PDF

SpatialDETR: Robust Scalable Transformer-Based 3D Object Detection from Multi-View Camera Images with Global Cross-Sensor Attention Simon Doll, Richard Schulz, Lukas Schneider, Viviane Benzin, Markus Enzweiler, Hendrik P.A. Lensch

PDF

Spatially Invariant Unsupervised 3D Object-Centric Learning and Scene Decomposition Tianyu Wang, Miaomiao Liu, Kee Siong Ng

PDF

Spatio-Temporal Deformable Attention Network for Video Deblurring Huicong Zhang, Haozhe Xie, Hongxun Yao

PDF

Spatiotemporal Self-Attention Modeling with Temporal Patch Shift for Action Recognition Wangmeng Xiang, Chao Li, Biao Wang, Xihan Wei, Xian-Sheng Hua, Lei Zhang

PDF

SPE-Net: Boosting Point Cloud Analysis via Rotation Robustness Enhancement Zhaofan Qiu, Yehao Li, Yu Wang, Yingwei Pan, Ting Yao, Tao Mei

PDF

Speaker-Adaptive Lip Reading with User-Dependent Padding Minsu Kim, Hyunjun Kim, Yong Man Ro

PDF

Spectrum-Aware and Transferable Architecture Search for Hyperspectral Image Restoration Wei He, Quanming Yao, Naoto Yokoya, Tatsumi Uezato, Hongyan Zhang, Liangpei Zhang

PDF

SphereFed: Hyperspherical Federated Learning Xin Dong, Sai Qian Zhang, Ang Li, H.T. Kung

PDF

Spike Transformer: Monocular Depth Estimation for Spiking Camera Jiyuan Zhang, Lulu Tang, Zhaofei Yu, Jiwen Lu, Tiejun Huang

PDF

SPIN: An Empirical Evaluation on Sharing Parameters of Isotropic Networks Chien-Yu Lin, Anish Prabhu, Thomas Merth, Sachin Mehta, Anurag Ranjan, Maxwell Horton, Mohammad Rastegari

PDF

Sports Video Analysis on Large-Scale Data Dekun Wu, He Zhao, Xingce Bao, Richard P. Wildes

PDF

SPot-the-Difference Self-Supervised Pre-Training for Anomaly Detection and Segmentation Yang Zou, Jongheon Jeong, Latha Pemula, Dongqing Zhang, Onkar Dabeer

PDF

SpOT: Spatiotemporal Modeling for 3D Object Tracking Colton Stearns, Davis Rempe, Jie Li, Rareș Ambruș, Sergey Zakharov, Vitor Guizilini, Yanchao Yang, Leonidas J. Guibas

PDF

Spotting Temporally Precise, Fine-Grained Events in Video James Hong, Haotian Zhang, Michaël Gharbi, Matthew Fisher, Kayvon Fatahalian

PDF

SPSN: Superpixel Prototype Sampling Network for RGB-D Salient Object Detection Minhyeok Lee, Chaewon Park, Suhwan Cho, Sangyoun Lee

PDF

SPViT: Enabling Faster Vision Transformers via Latency-Aware Soft Token Pruning Zhenglun Kong, Peiyan Dong, Xiaolong Ma, Xin Meng, Wei Niu, Mengshu Sun, Xuan Shen, Geng Yuan, Bin Ren, Hao Tang, Minghai Qin, Yanzhi Wang

PDF

SQN: Weakly-Supervised Semantic Segmentation of Large-Scale 3D Point Clouds Qingyong Hu, Bo Yang, Guangchi Fang, Yulan Guo, Aleš Leonardis, Niki Trigoni, Andrew Markham

PDF

SSBNet: Improving Visual Recognition Efficiency by Adaptive Sampling Ho Man Kwan, Shenghui Song

PDF

ST-P3: End-to-End Vision-Based Autonomous Driving via Spatial-Temporal Feature Learning Shengchao Hu, Li Chen, Penghao Wu, Hongyang Li, Junchi Yan, Dacheng Tao

PDF

StARformer: Transformer with State-Action-Reward Representations for Visual Reinforcement Learning Jinghuan Shang, Kumara Kahatapitiya, Xiang Li, Michael S. Ryoo

PDF

Static and Dynamic Concepts for Self-Supervised Video Representation Learning Rui Qian, Shuangrui Ding, Xian Liu, Dahua Lin

PDF

STEEX: Steering Counterfactual Explanations with Semantics Paul Jacob, Éloi Zablocki, Hédi Ben-Younes, Mickaël Chen, Patrick Pérez, Matthieu Cord

PDF

Stereo Depth Estimation with Echoes Chenghao Zhang, Kun Tian, Bolin Ni, Gaofeng Meng, Bin Fan, Zhaoxiang Zhang, Chunhong Pan

PDF

Stochastic Consensus: Enhancing Semi-Supervised Learning with Consistency of Stochastic Classifiers Hui Tang, Lin Sun, Kui Jia

PDF

StoryDALL-E: Adapting Pretrained Text-to-Image Transformers for Story Continuation Adyasha Maharana, Darryl Hannan, Mohit Bansal

PDF

Streamable Neural Fields Junwoo Cho, Seungtae Nam, Daniel Rho, Jong Hwan Ko, Eunbyung Park

PDF

Streaming Multiscale Deep Equilibrium Models Can Ufuk Ertenli, Emre Akbas, Ramazan Gokberk Cinbis

PDF

StretchBEV: Stretching Future Instance Prediction Spatially and Temporally Adil Kaan Akan, Fatma Güney

PDF

Stripformer: Strip Transformer for Fast Image Deblurring Fu-Jen Tsai, Yan-Tsung Peng, Yen-Yu Lin, Chung-Chi Tsai, Chia-Wen Lin

PDF

Structural Causal 3D Reconstruction Weiyang Liu, Zhen Liu, Liam Paull, Adrian Weller, Bernhard Schölkopf

PDF

Structural Triangulation: A Closed-Form Solution to Constrained 3D Human Pose Estimation Zhuo Chen, Xu Zhao, Xiaoyue Wan

PDF

Structure and Motion from Casual Videos Zhoutong Zhang, Forrester Cole, Zhengqi Li, Noah Snavely, Michael Rubinstein, William T. Freeman

PDF

Structure-Aware Editable Morphable Model for 3D Facial Detail Animation and Manipulation Jingwang Ling, Zhibo Wang, Ming Lu, Quan Wang, Chen Qian, Feng Xu

PDF

Studying Bias in GANs Through the Lens of Race Vongani H. Maluleke, Neerja Thakkar, Tim Brooks, Ethan Weber, Trevor Darrell, Alexei A. Efros, Angjoo Kanazawa, Devin Guillory

PDF

Style Your Hair: Latent Optimization for Pose-Invariant Hairstyle Transfer via Local-Style-Aware Hair Alignment Taewoo Kim, Chaeyeon Chung, Yoonseo Kim, Sunghyun Park, Kangyeol Kim, Jaegul Choo

PDF

Style-Agnostic Reinforcement Learning Juyong Lee, Seokjun Ahn, Jaesik Park

PDF

Style-Guided Shadow Removal Jin Wan, Hui Yin, Zhenyao Wu, Xinyi Wu, Yanting Liu, Song Wang

PDF

Style-Hallucinated Dual Consistency Learning for Domain Generalized Semantic Segmentation Yuyang Zhao, Zhun Zhong, Na Zhao, Nicu Sebe, Gim Hee Lee

PDF

StyleBabel: Artistic Style Tagging and Captioning Dan Ruta, Andrew Gilbert, Pranav Aggarwal, Naveen Marri, Ajinkya Kale, Jo Briggs, Chris Speed, Hailin Jin, Baldo Faieta, Alex Filipkowski, Zhe Lin, John Collomosse

PDF

StyleFace: Towards Identity-Disentangled Face Generation on Megapixels Yuchen Luo, Junwei Zhu, Keke He, Wenqing Chu, Ying Tai, Chengjie Wang, Junchi Yan

PDF

StyleGAN-Human: A Data-Centric Odyssey of Human Generation Jianglin Fu, Shikai Li, Yuming Jiang, Kwan-Yee Lin, Chen Qian, Chen Change Loy, Wayne Wu, Ziwei Liu

PDF

StyleHEAT: One-Shot High-Resolution Editable Talking Face Generation via Pre-Trained StyleGAN Fei Yin, Yong Zhang, Xiaodong Cun, Mingdeng Cao, Yanbo Fan, Xuan Wang, Qingyan Bai, Baoyuan Wu, Jue Wang, Yujiu Yang

PDF

StyleLight: HDR Panorama Generation for Lighting Estimation and Editing Guangcong Wang, Yinuo Yang, Chen Change Loy, Ziwei Liu

PDF

StyleSwap: Style-Based Generator Empowers Robust Face Swapping Zhiliang Xu, Hang Zhou, Zhibin Hong, Ziwei Liu, Jiaming Liu, Zhizhi Guo, Junyu Han, Jingtuo Liu, Errui Ding, Jingdong Wang

PDF

Subspace Diffusion Generative Models Bowen Jing, Gabriele Corso, Renato Berlinghieri, Tommi Jaakkola

PDF

Super-Resolution 3D Human Shape from a Single Low-Resolution Image Marco Pesavento, Marco Volino, Adrian Hilton

PDF

Super-Resolution by Predicting Offsets: An Ultra-Efficient Super-Resolution Network for Rasterized Images Jinjin Gu, Haoming Cai, Chenyu Dong, Ruofan Zhang, Yulun Zhang, Wenming Yang, Chun Yuan

PDF

SuperLine3D: Self-Supervised Line Segmentation and Description for LiDAR Point Cloud Xiangrui Zhao, Sheng Yang, Tianxin Huang, Jun Chen, Teng Ma, Mingyang Li, Yong Liu

PDF

SuperTickets: Drawing Task-Agnostic Lottery Tickets from Supernets via Jointly Architecture Searching and Parameter Pruning Haoran You, Baopu Li, Zhanyi Sun, Xu Ouyang, Yingyan Lin

PDF

Supervised Attribute Information Removal and Reconstruction for Image Manipulation Nannan Li, Bryan A. Plummer

PDF

SUPR: A Sparse Unified Part-Based Human Representation Ahmed A. A. Osman, Timo Bolkart, Dimitrios Tzionas, Michael J. Black

PDF

SWFormer: Sparse Window Transformer for 3D Object Detection in Point Clouds Pei Sun, Mingxing Tan, Weiyue Wang, Chenxi Liu, Fei Xia, Zhaoqi Leng, Dragomir Anguelov

PDF

Switch-BERT: Learning to Model Multimodal Interactions by Switching Attention and Input Qingpei Guo, Kaisheng Yao, Wei Chu

PDF

Switchable Online Knowledge Distillation Biao Qian, Yang Wang, Hongzhi Yin, Richang Hong, Meng Wang

PDF

Symmetry Regularization and Saturating Nonlinearity for Robust Quantization Sein Park, Yeongsang Jang, Eunhyeok Park

PDF

Synergistic Self-Supervised and Quantization Learning Yun-Hao Cao, Peiqin Sun, Yechang Huang, Jianxin Wu, Shuchang Zhou

PDF

Synthesizing Light Field Video from Monocular Video Shrisudhan Govindarajan, Prasan Shedligeri, Sarah, Kaushik Mitra

PDF

Tackling Background Distraction in Video Object Segmentation Suhwan Cho, Heansung Lee, Minhyeok Lee, Chaewon Park, Sungjun Jang, Minjung Kim, Sangyoun Lee

PDF

Tackling Long-Tailed Category Distribution Under Domain Shifts Xiao Gu, Yao Guo, Zeju Li, Jianing Qiu, Qi Dou, Yuxuan Liu, Benny Lo, Guang-Zhong Yang

PDF

TACS: Taxonomy Adaptive Cross-Domain Semantic Segmentation Rui Gong, Martin Danelljan, Dengxin Dai, Danda Pani Paudel, Ajad Chhatkuli, Fisher Yu, Luc Van Gool

PDF

TAFIM: Targeted Adversarial Attacks Against Facial Image Manipulations Shivangi Aneja, Lev Markhasin, Matthias Nießner

PDF

Tailoring Self-Supervision for Supervised Learning WonJun Moon, Ji-Hwan Kim, Jae-Pil Heo

PDF

TALISMAN: Targeted Active Learning for Object Detection with Rare Classes and Slices Using Submodular Mutual Information Suraj Kothawade, Saikat Ghosh, Sumit Shekhar, Yu Xiang, Rishabh Iyer

PDF

TALLFormer: Temporal Action Localization with a Long-Memory Transformer Feng Cheng, Gedas Bertasius

PDF

TAPE: Task-Agnostic Prior Embedding for Image Restoration Lin Liu, Lingxi Xie, Xiaopeng Zhang, Shanxin Yuan, Xiangyu Chen, Wengang Zhou, Houqiang Li, Qi Tian

PDF

Target-Absent Human Attention Zhibo Yang, Sounak Mondal, Seoyoung Ahn, Gregory Zelinsky, Minh Hoai, Dimitris Samaras

PDF

TAVA: Template-Free Animatable Volumetric Actors Ruilong Li, Julian Tanke, Minh Vo, Michael Zollhöfer, Jürgen Gall, Angjoo Kanazawa, Christoph Lassner

PDF

TD-Road: Top-Down Road Network Extraction with Holistic Graph Construction Yang He, Ravi Garg, Amber Roy Chowdhury

PDF

TDAM: Top-Down Attention Module for Contextually Guided Feature Selection in CNNs Shantanu Jaiswal, Basura Fernando, Cheston Tan

PDF

TDViT: Temporal Dilated Video Transformer for Dense Video Tasks Guanxiong Sun, Yang Hua, Guosheng Hu, Neil Robertson

PDF

Teaching Where to Look: Attention Similarity Knowledge Distillation for Low Resolution Face Recognition Sungho Shin, Joosoon Lee, Junseok Lee, Yeonguk Yu, Kyoobin Lee

PDF

Teaching with Soft Label Smoothing for Mitigating Noisy Labels in Facial Expressions Tohar Lukov, Na Zhao, Gim Hee Lee, Ser-Nam Lim

PDF

Telepresence Video Quality Assessment Zhenqiang Ying, Deepti Ghadiyaram, Alan Bovik

PDF

TEMOS: Generating Diverse Human Motions from Textual Descriptions Mathis Petrovich, Michael J. Black, Gül Varol

PDF

TempFormer: Temporally Consistent Transformer for Video Denoising Mingyang Song, Yang Zhang, Tunç O. Aydın

PDF

Temporal and Cross-Modal Attention for Audio-Visual Zero-Shot Learning Otniel-Bogdan Mercea, Thomas Hummel, A. Sophia Koepke, Zeynep Akata

PDF

Temporal Lift Pooling for Continuous Sign Language Recognition Lianyu Hu, Liqing Gao, Zekang Liu, Wei Feng

PDF

Temporal Saliency Query Network for Efficient Video Recognition Boyang Xia, Zhihao Wang, Wenhao Wu, Haoran Wang, Jungong Han

PDF

Temporal-MPI: Enabling Multi-Plane Images for Dynamic Scene Modelling via Temporal Basis Learning Wenpeng Xing, Jie Chen

PDF

Temporally Consistent Semantic Video Editing Yiran Xu, Badour AlBahar, Jia-Bin Huang

PDF

TensoRF: Tensorial Radiance Fields Anpei Chen, Zexiang Xu, Andreas Geiger, Jingyi Yu, Hao Su

PDF

Text-Based Temporal Localization of Novel Events Sudipta Paul, Niluthpol Chowdhury Mithun, Amit K. Roy-Chowdhury

PDF

Text2LIVE: Text-Driven Layered Image and Video Editing Omer Bar-Tal, Dolev Ofri-Amar, Rafail Fridman, Yoni Kasten, Tali Dekel

PDF

TextAdaIN: Paying Attention to Shortcut Learning in Text Recognizers Oren Nuriel, Sharon Fogel, Ron Litman

PDF

Texturify: Generating Textures on 3D Shape Surfaces Yawar Siddiqui, Justus Thies, Fangchang Ma, Qi Shan, Matthias Nießner, Angela Dai

PDF

The Abduction of Sherlock Holmes: A Dataset for Visual Abductive Reasoning Jack Hessel, Jena D. Hwang, Jae Sung Park, Rowan Zellers, Chandra Bhagavatula, Anna Rohrbach, Kate Saenko, Yejin Choi

PDF

The Anatomy of Video Editing: A Dataset and Benchmark Suite for AI-Assisted Video Editing Dawit Mureja Argaw, Fabian Caba, Joon-Young Lee, Markus Woodson, In So Kweon

PDF

The Caltech Fish Counting Dataset: A Benchmark for Multiple-Object Tracking and Counting Justin Kay, Peter Kulits, Suzanne Stathatos, Siqi Deng, Erik Young, Sara Beery, Grant Van Horn, Pietro Perona

PDF

The Challenges of Continuous Self-Supervised Learning Senthil Purushwalkam, Pedro Morgado, Abhinav Gupta

PDF

The Missing Link: Finding Label Relations Across Datasets Jasper Uijlings, Thomas Mensink, Vittorio Ferrari

PDF

The One Where They Reconstructed 3D Humans and Environments in TV Shows Georgios Pavlakos, Ethan Weber, Matthew Tancik, Angjoo Kanazawa

PDF

The Shape Part Slot Machine: Contact-Based Reasoning for Generating 3D Shapes from Parts Kai Wang, Paul Guerrero, Vladimir G. Kim, Siddhartha Chaudhuri, Minhyuk Sung, Daniel Ritchie

PDF

The Surprisingly Straightforward Scene Text Removal Method with Gated Attention and Region of Interest Generation: A Comprehensive Prominent Model Analysis Hyeonsu Lee, Chankyu Choi

PDF

Theoretical Understanding of the Information Flow on Continual Learning Performance Joshua Andle, Salimeh Yasaei Sekeh

PDF

Three Things Everyone Should Know About Vision Transformers Hugo Touvron, Matthieu Cord, Alaaeldin El-Nouby, Jakob Verbeek, Hervé Jégou

PDF

TIDEE: Tidying up Novel Rooms Using Visuo-Semantic Commonsense Priors Gabriel Sarch, Zhaoyuan Fang, Adam W. Harley, Paul Schydlo, Michael J. Tarr, Saurabh Gupta, Katerina Fragkiadaki

PDF

Time-rEversed diffusioN tEnsor Transformer: A New TENET of Few-Shot Object Detection Shan Zhang, Naila Murray, Lei Wang, Piotr Koniusz

PDF

TinyViT: Fast Pretraining Distillation for Small Vision Transformers Kan Wu, Jinnian Zhang, Houwen Peng, Mengchen Liu, Bin Xiao, Jianlong Fu, Lu Yuan

PDF

Tip-Adapter: Training-Free Adaption of CLIP for Few-Shot Classification Renrui Zhang, Wei Zhang, Rongyao Fang, Peng Gao, Kunchang Li, Jifeng Dai, Yu Qiao, Hongsheng Li

PDF

TIPS: Text-Induced Pose Synthesis Prasun Roy, Subhankar Ghosh, Saumik Bhattacharya, Umapada Pal, Michael Blumenstein

PDF

TISE: Bag of Metrics for Text-to-Image Synthesis Evaluation Tan M. Dinh, Rang Nguyen, Binh-Son Hua

PDF

TL;DW? Summarizing Instructional Videos with Task Relevance & Cross-Modal Saliency Medhini Narasimhan, Arsha Nagrani, Chen Sun, Michael Rubinstein, Trevor Darrell, Anna Rohrbach, Cordelia Schmid

PDF

TM2T: Stochastic and Tokenized Modeling for the Reciprocal Generation of 3D Human Motions and Texts Chuan Guo, Xinxin Zuo, Sen Wang, Li Cheng

PDF

TO-Scene: A Large-Scale Dataset for Understanding 3D Tabletop Scenes Mutian Xu, Pei Chen, Haolin Liu, Xiaoguang Han

PDF

TOCH: Spatio-Temporal Object-to-Hand Correspondence for Motion Refinement Keyang Zhou, Bharat Lal Bhatnagar, Jan Eric Lenssen, Gerard Pons-Moll

PDF

TokenMix: Rethinking Image Mixing for Data Augmentation in Vision Transformers Jihao Liu, Boxiao Liu, Hang Zhou, Hongsheng Li, Yu Liu

PDF

Tomography of Turbulence Strength Based on Scintillation Imaging Nir Shaul, Yoav Y. Schechner

PDF

Totems: Physical Objects for Verifying Visual Integrity Jingwei Ma, Lucy Chai, Minyoung Huh, Tongzhou Wang, Ser-Nam Lim, Phillip Isola, Antonio Torralba

PDF

Toward Understanding WordArt: Corner-Guided Transformer for Scene Text Recognition Xudong Xie, Ling Fu, Zhifei Zhang, Zhaowen Wang, Xiang Bai

PDF

Towards Accurate Active Camera Localization Qihang Fang, Yingda Yin, Qingnan Fan, Fei Xia, Siyan Dong, Sheng Wang, Jue Wang, Leonidas J. Guibas, Baoquan Chen

PDF

Towards Accurate Binary Neural Networks via Modeling Contextual Dependencies Xingrun Xing, Yangguang Li, Wei Li, Wenrui Ding, Yalong Jiang, Yufeng Wang, Jing Shao, Chunlei Liu, Xianglong Liu

PDF

Towards Accurate Network Quantization with Equivalent Smooth Regularizer Kirill Solodskikh, Vladimir Chikin, Ruslan Aydarkhanov, Dehua Song, Irina Zhelavskaya, Jiansheng Wei

PDF

Towards Accurate Open-Set Recognition via Background-Class Regularization Wonwoo Cho, Jaegul Choo

PDF

Towards Calibrated Hyper-Sphere Representation via Distribution Overlap Coefficient for Long-Tailed Learning Hualiang Wang, Siming Fu, Xiaoxuan He, Hangxiang Fang, Zuozhu Liu, Haoji Hu

PDF

Towards Comprehensive Representation Enhancement in Semantics-Guided Self-Supervised Monocular Depth Estimation Jingyuan Ma, Xiangyu Lei, Nan Liu, Xian Zhao, Shiliang Pu

PDF

Towards Data-Efficient Detection Transformers Wen Wang, Jing Zhang, Yang Cao, Yongliang Shen, Dacheng Tao

PDF

Towards Effective and Robust Neural Trojan Defenses via Input Filtering Kien Do, Haripriya Harikumar, Hung Le, Dung Nguyen, Truyen Tran, Santu Rana, Dang Nguyen, Willy Susilo, Svetha Venkatesh

PDF

Towards Efficient Adversarial Training on Vision Transformers Boxi Wu, Jindong Gu, Zhifeng Li, Deng Cai, Xiaofei He, Wei Liu

PDF

Towards Efficient and Effective Self-Supervised Learning of Visual Representations Sravanti Addepalli, Kaushal Bhogale, Priyam Dey, R. Venkatesh Babu

PDF

Towards Efficient and Scale-Robust Ultra-High-Definition Image Demoiréing Xin Yu, Peng Dai, Wenbo Li, Lan Ma, Jiajun Shen, Jia Li, Xiaojuan Qi

PDF

Towards Generic 3D Tracking in RGBD Videos: Benchmark and Baseline Jinyu Yang, Zhongqun Zhang, Zhe Li, Hyung Jin Chang, Aleš Leonardis, Feng Zheng

PDF

Towards Grand Unification of Object Tracking Bin Yan, Yi Jiang, Peize Sun, Dong Wang, Zehuan Yuan, Ping Luo, Huchuan Lu

PDF

Towards Hard-Positive Query Mining for DETR-Based Human-Object Interaction Detection Xubin Zhong, Changxing Ding, Zijian Li, Shaoli Huang

PDF

Towards High-Fidelity Single-View Holistic Reconstruction of Indoor Scenes Haolin Liu, Yujian Zheng, Guanying Chen, Shuguang Cui, Xiaoguang Han

PDF

Towards Interpretable Video Super-Resolution via Alternating Optimization Jiezhang Cao, Jingyun Liang, Kai Zhang, Wenguan Wang, Qin Wang, Yulun Zhang, Hao Tang, Luc Van Gool

PDF

Towards Learning Neural Representations from Shadows Kushagra Tiwary, Tzofi Klinghoffer, Ramesh Raskar

PDF

Towards Metrical Reconstruction of Human Faces Wojciech Zielonka, Timo Bolkart, Justus Thies

PDF

Towards Open Set Video Anomaly Detection Yuansheng Zhu, Wentao Bao, Qi Yu

PDF

Towards Open-Vocabulary Scene Graph Generation with Prompt-Based Finetuning Tao He, Lianli Gao, Jingkuan Song, Yuan-Fang Li

PDF

Towards Racially Unbiased Skin Tone Estimation via Scene Disambiguation Haiwen Feng, Timo Bolkart, Joachim Tesch, Michael J. Black, Victoria Abrevaya

PDF

Towards Real-World HDRTV Reconstruction: A Data Synthesis-Based Approach Zhen Cheng, Tao Wang, Yong Li, Fenglong Song, Chang Chen, Zhiwei Xiong

PDF

Towards Realistic Semi-Supervised Learning Mamshad Nayeem Rizve, Navid Kardan, Mubarak Shah

PDF

Towards Regression-Free Neural Networks for Diverse Compute Platforms Rahul Duggal, Hao Zhou, Shuo Yang, Jun Fang, Yuanjun Xiong, Wei Xia

PDF

Towards Robust Face Recognition with Comprehensive Search Manyuan Zhang, Guanglu Song, Yu Liu, Hongsheng Li

PDF

Towards Scale-Aware, Robust, and Generalizable Unsupervised Monocular Depth Estimation by Integrating IMU Motion Dynamics Sen Zhang, Jing Zhang, Dacheng Tao

PDF

Towards Sequence-Level Training for Visual Tracking Minji Kim, Seungkwan Lee, Jungseul Ok, Bohyung Han, Minsu Cho

PDF

Towards Ultra Low Latency Spiking Neural Networks for Vision and Sequential Tasks Using Temporal Pruning Sayeed Shafayet Chowdhury, Nitin Rathi, Kaushik Roy

PDF

Towards Unbiased Label Distribution Learning for Facial Pose Estimation Using Anisotropic Spherical Gaussian Zhiwen Cao, Dongfang Liu, Qifan Wang, Yingjie Chen

PDF

Trace Controlled Text to Image Generation Kun Yan, Lei Ji, Chenfei Wu, Jianmin Bao, Ming Zhou, Nan Duan, Shuai Ma

PDF

Tracking by Associating Clips Sanghyun Woo, Kwanyong Park, Seoung Wug Oh, In So Kweon, Joon-Young Lee

PDF

Tracking Every Thing in the Wild Siyuan Li, Martin Danelljan, Henghui Ding, Thomas E. Huang, Fisher Yu

PDF

Tracking Objects as Pixel-Wise Distributions Zelin Zhao, Ze Wu, Yueqing Zhuang, Boxun Li, Jiaya Jia

PDF

Trading Positional Complexity vs Deepness in Coordinate Networks Jianqiao Zheng, Sameera Ramasinghe, Xueqian Li, Simon Lucey

PDF

Training Vision Transformers with Only 2040 Images Yun-Hao Cao, Hao Yu, Jianxin Wu

PDF

Transfer Without Forgetting Matteo Boschini, Lorenzo Bonicelli, Angelo Porrello, Giovanni Bellitto, Matteo Pennisi, Simone Palazzo, Concetto Spampinato, Simone Calderara

PDF

TransFGU: A Top-Down Approach to Fine-Grained Unsupervised Semantic Segmentation Zhaoyuan Yin, Pichao Wang, Fan Wang, Xianzhe Xu, Hanling Zhang, Hao Li, Rong Jin

PDF

Transform Your Smartphone into a DSLR Camera: Learning the ISP in the Wild Ardhendu Shekhar Tripathi, Martin Danelljan, Samarth Shukla, Radu Timofte, Luc Van Gool

PDF

Transformer with Implicit Edges for Particle-Based Physics Simulation Yidi Shao, Chen Change Loy, Bo Dai

PDF

Transformers as Meta-Learners for Implicit Neural Representations Yinbo Chen, Xiaolong Wang

PDF

TransGrasp: Grasp Pose Estimation of a Category of Objects by Transferring Grasps from Only One Labeled Instance Hongtao Wen, Jianhang Yan, Wanli Peng, Yi Sun

PDF

Translating a Visual LEGO Manual to a Machine-Executable Plan Ruocheng Wang, Yunzhi Zhang, Jiayuan Mao, Chin-Yi Cheng, Jiajun Wu

PDF

Translation, Scale and Rotation: Cross-Modal Alignment Meets RGB-Infrared Vehicle Detection Maoxun Yuan, Yinyan Wang, Xingxing Wei

PDF

TransMatting: Enhancing Transparent Objects Matting with Transformers Huanqia Cai, Fanglei Xue, Lele Xu, Lili Guo

PDF

TransVLAD: Focusing on Locally Aggregated Descriptors for Few-Shot Learning Haoquan Li, Laoming Zhang, Daoan Zhang, Lang Fu, Peng Yang, Jianguo Zhang

PDF

Trapped in Texture Bias? a Large Scale Comparison of Deep Instance Segmentation Johannes Theodoridis, Jessica Hofmann, Johannes Maucher, Andreas Schilling

PDF

Tree Structure-Aware Few-Shot Image Classification via Hierarchical Aggregation Min Zhang, Siteng Huang, Wenbin Li, Donglin Wang

PDF

TREND: Truncated Generalized Normal Density Estimation of Inception Embeddings for GAN Evaluation Junghyuk Lee, Jong-Seok Lee

PDF

Triangle Attack: A Query-Efficient Decision-Based Adversarial Attack Xiaosen Wang, Zeliang Zhang, Kangheng Tong, Dihong Gong, Kun He, Zhifeng Li, Wei Liu

PDF

TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual Environments Shubham Dokania, Anbumani Subramanian, Manmohan Chandraker, C.V. Jawahar

PDF

Trust, but Verify: Using Self-Supervised Probing to Improve Trustworthiness Ailin Deng, Shen Li, Miao Xiong, Zhirui Chen, Bryan Hooi

PDF

TS2-Net: Token Shift and Selection Transformer for Text-Video Retrieval Yuqi Liu, Pengfei Xiong, Luhui Xu, Shengming Cao, Qin Jin

PDF

tSF: Transformer-Based Semantic Filter for Few-Shot Learning Jinxiang Lai, Siqian Yang, Wenlong Liu, Yi Zeng, Zhongyi Huang, Wenlong Wu, Jun Liu, Bin-Bin Gao, Chengjie Wang

PDF

U-Boost NAS: Utilization-Boosted Differentiable Neural Architecture Search Ahmet Caner Yüzügüler, Nikolaos Dimitriadis, Pascal Frossard

PDF

UC-OWOD: Unknown-Classified Open World Object Detection Zhiheng Wu, Yue Lu, Xingyu Chen, Zhengxing Wu, Liwen Kang, Junzhi Yu

PDF

UCTNet: Uncertainty-Aware Cross-Modal Transformer Network for Indoor RGB-D Semantic Segmentation Xiaowen Ying, Mooi Choo Chuah

PDF

UFO: Unified Feature Optimization Teng Xi, Yifan Sun, Deli Yu, Bi Li, Nan Peng, Gang Zhang, Xinyu Zhang, Zhigang Wang, Jinwen Chen, Jian Wang, Lufei Liu, Haocheng Feng, Junyu Han, Jingtuo Liu, Errui Ding, Jingdong Wang

PDF

UIA-ViT: Unsupervised Inconsistency-Aware Method Based on Vision Transformer for Face Forgery Detection Wanyi Zhuang, Qi Chu, Zhentao Tan, Qiankun Liu, Haojie Yuan, Changtao Miao, Zixiang Luo, Nenghai Yu

PDF

Ultra-High-Resolution Unpaired Stain Transformation via Kernelized Instance Normalization Ming-Yang Ho, Min-Sheng Wu, Che-Ming Wu

PDF

Unbiased Gradient Estimation for Differentiable Surface Splatting via Poisson Sampling Jan U. Müller, Michael Weinmann, Reinhard Klein

PDF

Unbiased Manifold Augmentation for Coarse Class Subdivision Baoming Yan, Ke Gao, Bo Gao, Lin Wang, Jiang Yang, Xiaobo Li

PDF

Unbiased Multi-Modality Guidance for Image Inpainting Yongsheng Yu, Dawei Du, Libo Zhang, Tiejian Luo

PDF

Uncertainty Inspired Underwater Image Enhancement Zhenqi Fu, Wu Wang, Yue Huang, Xinghao Ding, Kai-Kuang Ma

PDF

Uncertainty Learning in Kernel Estimation for Multi-Stage Blind Image Super-Resolution Zhenxuan Fang, Weisheng Dong, Xin Li, Jinjian Wu, Leida Li, Guangming Shi

PDF

Uncertainty Quantification in Depth Estimation via Constrained Ordinal Regression Dongting Hu, Liuhua Peng, Tingjin Chu, Xiaoxing Zhang, Yinian Mao, Howard Bondell, Mingming Gong

PDF

Uncertainty-Aware Multi-Modal Learning via Cross-Modal Random Network Prediction Hu Wang, Jianpeng Zhang, Yuanhong Chen, Congbo Ma, Jodie Avery, Louise Hull, Gustavo Carneiro

PDF

Uncertainty-Based Spatial-Temporal Attention for Online Action Detection Hongji Guo, Zhou Ren, Yi Wu, Gang Hua, Qiang Ji

PDF

Uncertainty-DTW for Time Series and Sequences Lei Wang, Piotr Koniusz

PDF

Uncertainty-Guided Source-Free Domain Adaptation Subhankar Roy, Martin Trapp, Andrea Pilzer, Juho Kannala, Nicu Sebe, Elisa Ricci, Arno Solin

PDF

Understanding Collapse in Non-Contrastive Siamese Representation Learning Alexander C. Li, Alexei A. Efros, Deepak Pathak

PDF

Understanding the Dynamics of DNNs Using Graph Modularity Yao Lu, Wen Yang, Yunzhe Zhang, Zuohui Chen, Jinyin Chen, Qi Xuan, Zhen Wang, Xiaoniu Yang

PDF

Unfolded Deep Kernel Estimation for Blind Image Super-Resolution Hongyi Zheng, Hongwei Yong, Lei Zhang

PDF

UniCR: Universally Approximated Certified Robustness via Randomized Smoothing Hanbin Hong, Binghui Wang, Yuan Hong

PDF

Unidirectional Video Denoising by Mimicking Backward Recurrent Modules with Look-Ahead Forward Ones Junyi Li, Xiaohe Wu, Zhenxing Niu, Wangmeng Zuo

PDF

UNIF: United Neural Implicit Functions for Clothed Human Reconstruction and Animation Shenhan Qian, Jiale Xu, Ziwei Liu, Liqian Ma, Shenghua Gao

PDF

Unified Fully and Timestamp Supervised Temporal Action Segmentation via Sequence to Sequence Translation Nadine Behrmann, S. Alireza Golestaneh, Zico Kolter, Jürgen Gall, Mehdi Noroozi

PDF

Unified Implicit Neural Stylization Zhiwen Fan, Yifan Jiang, Peihao Wang, Xinyu Gong, Dejia Xu, Zhangyang Wang

PDF

Unifying Event Detection and Captioning as Sequence Generation via Pre-Training Qi Zhang, Yuqing Song, Qin Jin

PDF

Unifying Visual Contrastive Learning for Object Recognition from a Graph Perspective Shixiang Tang, Feng Zhu, Lei Bai, Rui Zhao, Chenyu Wang, Wanli Ouyang

PDF

Unifying Visual Perception by Dispersible Points Learning Jianming Liang, Guanglu Song, Biao Leng, Yu Liu

PDF

UniMiSS: Universal Medical Self-Supervised Learning via Breaking Dimensionality Barrier Yutong Xie, Jianpeng Zhang, Yong Xia, Qi Wu

PDF

UniNet: Unified Architecture Search with Convolution, Transformer, and MLP Jihao Liu, Xin Huang, Guanglu Song, Hongsheng Li, Yu Liu

PDF

Union-Set Multi-Source Model Adaptation for Semantic Segmentation Zongyao Li, Ren Togo, Takahiro Ogawa, Miki Haseyama

PDF

UniTAB: Unifying Text and Box Outputs for Grounded Vision-Language Modeling Zhengyuan Yang, Zhe Gan, Jianfeng Wang, Xiaowei Hu, Faisal Ahmed, Zicheng Liu, Yumao Lu, Lijuan Wang

PDF

Unitail: Detecting, Reading, and Matching in Retail Scene Fangyi Chen, Han Zhang, Zaiwang Li, Jiachen Dou, Shentong Mo, Hao Chen, Yongxin Zhang, Uzair Ahmed, Chenchen Zhu, Marios Savvides

PDF

United Defocus Blur Detection and Deblurring via Adversarial Promoting Learning Wenda Zhao, Fei Wei, You He, Huchuan Lu

PDF

Unknown-Oriented Learning for Open Set Domain Adaptation Jie Liu, Xiaoqing Guo, Yixuan Yuan

PDF

Unleashing Transformers: Parallel Token Prediction with Discrete Absorbing Diffusion for Fast High-Resolution Image Generation from Vector-Quantized Codes Sam Bond-Taylor, Peter Hessey, Hiroshi Sasaki, Toby P. Breckon, Chris G. Willcocks

PDF

Unpaired Deep Image Dehazing Using Contrastive Disentanglement Learning Xiang Chen, Zhentao Fan, Pengpeng Li, Longgang Dai, Caihua Kong, Zhuoran Zheng, Yufeng Huang, Yufeng Li

PDF

Unpaired Image Translation via Vector Symbolic Architectures Justin Theiss, Jay Leverett, Daeil Kim, Aayush Prakash

PDF

UnrealEgo: A New Dataset for Robust Egocentric 3D Human Motion Capture Hiroyasu Akada, Jian Wang, Soshi Shimada, Masaki Takahashi, Christian Theobalt, Vladislav Golyanik

PDF

Unstructured Feature Decoupling for Vehicle Re-Identification Wen Qian, Hao Luo, Silong Peng, Fan Wang, Chen Chen, Hao Li

PDF

Unsupervised and Semi-Supervised Bias Benchmarking in Face Recognition Alexandra Chouldechova, Siqi Deng, Yongxin Wang, Wei Xia, Pietro Perona

PDF

Unsupervised Deep Multi-Shape Matching Dongliang Cao, Florian Bernard

PDF

Unsupervised Domain Adaptation for Monocular 3D Object Detection via Self-Training Zhenyu Li, Zehui Chen, Ang Li, Liangji Fang, Qinhong Jiang, Xianming Liu, Junjun Jiang

PDF

Unsupervised Domain Adaptation for One-Stage Object Detector Using Offsets to Bounding Box Jayeon Yoo, Inseop Chung, Nojun Kwak

PDF

Unsupervised Few-Shot Image Classification by Learning Features into Clustering Space Shuo Li, Fang Liu, Zehua Hao, Kaibo Zhao, Licheng Jiao

PDF

Unsupervised High-Fidelity Facial Texture Generation and Reconstruction Ron Slossberg, Ibrahim Jubran, Ron Kimmel

PDF

Unsupervised Learning of 3D Semantic Keypoints with Mutual Reconstruction Haocheng Yuan, Chen Zhao, Shichao Fan, Jiaxi Jiang, Jiaqi Yang

PDF

Unsupervised Learning of Efficient Geometry-Aware Neural Articulated Representations Atsuhiro Noguchi, Xiao Sun, Stephen Lin, Tatsuya Harada

PDF

Unsupervised Night Image Enhancement: When Layer Decomposition Meets Light-Effects Suppression Yeying Jin, Wenhan Yang, Robby T. Tan

PDF

Unsupervised Pose-Aware Part Decomposition for Man-Made Articulated Objects Yuki Kawana, Yusuke Mukuta, Tatsuya Harada

PDF

Unsupervised Segmentation in Real-World Images via Spelke Object Inference Honglin Chen, Rahul Venkatesh, Yoni Friedman, Jiajun Wu, Joshua B. Tenenbaum, Daniel L. K. Yamins, Daniel M. Bear

PDF

Unsupervised Selective Labeling for More Effective Semi-Supervised Learning Xudong Wang, Long Lian, Stella X. Yu

PDF

Unsupervised Visual Representation Learning by Synchronous Momentum Grouping Bo Pang, Yifan Zhang, Yaoyi Li, Jia Cai, Cewu Lu

PDF

V2X-ViT: Vehicle-to-Everything Cooperative Perception with Vision Transformer Runsheng Xu, Hao Xiang, Zhengzhong Tu, Xin Xia, Ming-Hsuan Yang, Jiaqi Ma

PDF

Variance-Aware Weight Initialization for Point Convolutional Neural Networks Pedro Hermosilla, Michael Schelling, Tobias Ritschel, Timo Ropinski

PDF

VecGAN: Image-to-Image Translation with Interpretable Latent Directions Yusuf Dalva, Said Fahri Altındiş, Aysegul Dundar

PDF

Vector Quantized Image-to-Image Translation Yu-Jie Chen, Shin-I Cheng, Wei-Chen Chiu, Hung-Yu Tseng, Hsin-Ying Lee

PDF

Vibration-Based Uncertainty Estimation for Learning from Limited Supervision Hengtong Hu, Lingxi Xie, Xinyue Huo, Richang Hong, Qi Tian

PDF

Video Activity Localisation with Uncertainties in Temporal Boundary Jiabo Huang, Hailin Jin, Shaogang Gong, Yang Liu

PDF

Video Anomaly Detection by Solving Decoupled Spatio-Temporal Jigsaw Puzzles Guodong Wang, Yunhong Wang, Jie Qin, Dongming Zhang, Xiuguo Bao, Di Huang

PDF

Video Dialog as Conversation About Objects Living in Space-Time Hoang-Anh Pham, Thao Minh Le, Vuong Le, Tu Minh Phuong, Truyen Tran

PDF

Video Extrapolation in Space and Time Yunzhi Zhang, Jiajun Wu

PDF

Video Graph Transformer for Video Question Answering Junbin Xiao, Pan Zhou, Tat-Seng Chua, Shuicheng Yan

PDF

Video Instance Segmentation via Multi-Scale Spatio-Temporal Split Attention Transformer Omkar Thawakar, Sanath Narayan, Jiale Cao, Hisham Cholakkal, Rao Muhammad Anwer, Muhammad Haris Khan, Salman Khan, Michael Felsberg, Fahad Shahbaz Khan

PDF

Video Interpolation by Event-Driven Anisotropic Adjustment of Optical Flow Song Wu, Kaichao You, Weihua He, Chen Yang, Yang Tian, Yaoyuan Wang, Ziyang Zhang, Jianxing Liao

PDF

Video Mask Transfiner for High-Quality Video Instance Segmentation Lei Ke, Henghui Ding, Martin Danelljan, Yu-Wing Tai, Chi-Keung Tang, Fisher Yu

PDF

Video Question Answering with Iterative Video-Text Co-Tokenization Aj Piergiovanni, Kairo Morton, Weicheng Kuo, Michael S. Ryoo, Anelia Angelova

PDF

Video Restoration Framework and Its Meta-Adaptations to Data-Poor Conditions Prashant W Patil, Sunil Gupta, Santu Rana, Svetha Venkatesh

PDF

View Vertically: A Hierarchical Network for Trajectory Prediction via Fourier Spectrums Conghao Wong, Beihao Xia, Ziming Hong, Qinmu Peng, Wei Yuan, Qiong Cao, Yibo Yang, Xinge You

PDF

ViewFormer: NeRF-Free Neural Rendering from Few Images Using Transformers Jonáš Kulhánek, Erik Derner, Torsten Sattler, Robert Babuška

PDF

VIP: Unified Certified Detection and Recovery for Patch Attack with Vision Transformers Junbo Li, Huan Zhang, Cihang Xie

PDF

VirtualPose: Learning Generalizable 3D Human Pose Models from Virtual Data Jiajun Su, Chunyu Wang, Xiaoxuan Ma, Wenjun Zeng, Yizhou Wang

PDF

VisageSynTalk: Unseen Speaker Video-to-Speech Synthesis via Speech-Visage Feature Selection Joanna Hong, Minsu Kim, Yong Man Ro

PDF

Visual Cross-View Metric Localization with Dense Uncertainty Estimates Zimin Xia, Olaf Booij, Marco Manfredi, Julian F. P. Kooij

PDF

Visual Knowledge Tracing Neehar Kondapaneni, Pietro Perona, Oisin Mac Aodha

PDF

Visual Prompt Tuning Menglin Jia, Luming Tang, Bor-Chun Chen, Claire Cardie, Serge Belongie, Bharath Hariharan, Ser-Nam Lim

PDF

ViTAS: Vision Transformer Architecture Search Xiu Su, Shan You, Jiyang Xie, Mingkai Zheng, Fei Wang, Chen Qian, Changshui Zhang, Xiaogang Wang, Chang Xu

PDF

VizWiz-FewShot: Locating Objects in Images Taken by People with Visual Impairments Yu-Yun Tseng, Alexander Bell, Danna Gurari

PDF

VL-LTR: Learning Class-Wise Visual-Linguistic Representation for Long-Tailed Visual Recognition Changyao Tian, Wenhai Wang, Xizhou Zhu, Jifeng Dai, Yu Qiao

PDF

Vote from the Center: 6 DoF Pose Estimation in RGB-D Images by Radial Keypoint Voting Yangzheng Wu, Mohsen Zand, Ali Etemad, Michael Greenspan

PDF

VoViT: Low Latency Graph-Based Audio-Visual Voice Separation Transformer Juan F. Montesinos, Venkatesh S. Kadandale, Gloria Haro

PDF

VQFR: Blind Face Restoration with Vector-Quantized Dictionary and Parallel Decoder Yuchao Gu, Xintao Wang, Liangbin Xie, Chao Dong, Gen Li, Ying Shan, Ming-Ming Cheng

PDF

VQGAN-CLIP: Open Domain Image Generation and Editing with Natural Language Guidance Katherine Crowson, Stella Biderman, Daniel Kornis, Dashiell Stander, Eric Hallahan, Louis Castricato, Edward Raff

PDF

VSA: Learning Varied-Size Window Attention in Vision Transformers Qiming Zhang, Yufei Xu, Jing Zhang, Dacheng Tao

PDF

VTC: Improving Video-Text Retrieval with User Comments Laura Hanu, James Thewlis, Yuki M. Asano, Christian Rupprecht

PDF

W2N: Switching from Weak Supervision to Noisy Supervision for Object Detection Zitong Huang, Yiping Bao, Bowen Dong, Erjin Zhou, Wangmeng Zuo

PDF

Watermark Vaccine: Adversarial Attacks to Prevent Watermark Removal Xinwei Liu, Jian Liu, Yang Bai, Jindong Gu, Tao Chen, Xiaojun Jia, Xiaochun Cao

PDF

Wave-ViT: Unifying Wavelet and Transformers for Visual Representation Learning Ting Yao, Yingwei Pan, Yehao Li, Chong-Wah Ngo, Tao Mei

PDF

WaveGAN: Frequency-Aware GAN for High-Fidelity Few-Shot Image Generation Mengping Yang, Zhe Wang, Ziqiu Chi, Wenyi Feng

PDF

Waymo Open Dataset: Panoramic Video Panoptic Segmentation Jieru Mei, Alex Zihao Zhu, Xinchen Yan, Hang Yan, Siyuan Qiao, Yukun Zhu, Liang-Chieh Chen, Henrik Kretzschmar

PDF

Weakly Supervised 3D Scene Segmentation with Region-Level Boundary Awareness and Instance Discrimination Kangcheng Liu, Yuzhi Zhao, Qiang Nie, Zhi Gao, Ben M. Chen

PDF

Weakly Supervised Grounding for VQA in Vision-Language Transformers Aisha Urooj, Hilde Kuehne, Chuang Gan, Niels Da Vitoria Lobo, Mubarak Shah

PDF

Weakly Supervised Object Localization Through Inter-Class Feature Similarity and Intra-Class Appearance Consistency Jun Wei, Sheng Wang, S. Kevin Zhou, Shuguang Cui, Zhen Li

PDF

Weakly Supervised Object Localization via Transformer with Implicit Spatial Calibration Haotian Bai, Ruimao Zhang, Jiong Wang, Xiang Wan

PDF

Weakly-Supervised Stitching Network for Real-World Panoramic Image Generation Dae-Young Song, Geonsoo Lee, HeeKyung Lee, Gi-Mun Um, Donghyeon Cho

PDF

Weakly-Supervised Temporal Action Detection for Fine-Grained Videos with Hierarchical Atomic Actions Zhi Li, Lu He, Huijuan Xu

PDF

Webly Supervised Concept Expansion for General Purpose Vision Models Amita Kamath, Christopher Clark, Tanmay Gupta, Eric Kolve, Derek Hoiem, Aniruddha Kembhavi

PDF

Weight Fixing Networks Christopher Subia-Waud, Srinandan Dasmahapatra

PDF

WeLSA: Learning to Predict 6d Pose from Weakly Labeled Data Using Shape Alignment Shishir Reddy Vutukur, Ivan Shugurov, Benjamin Busam, Andreas Hutter, Slobodan Ilic

PDF

What Matters for 3D Scene Flow Network Guangming Wang, Yunzhe Hu, Zhe Liu, Yiyang Zhou, Masayoshi Tomizuka, Wei Zhan, Hesheng Wang

PDF

What to Hide from Your Students: Attention-Guided Masked Image Modeling Ioannis Kakogeorgiou, Spyros Gidaris, Bill Psomas, Yannis Avrithis, Andrei Bursuc, Konstantinos Karantzalos, Nikos Komodakis

PDF

When Active Learning Meets Implicit Semantic Data Augmentation Zhuangzhuang Chen, Jin Zhang, Pan Wang, Jie Chen, Jianqiang Li

PDF

When Counting Meets HMER: Counting-Aware Network for Handwritten Mathematical Expression Recognition Bohan Li, Ye Yuan, Dingkang Liang, Xiao Liu, Zhilong Ji, Jinfeng Bai, Wenyu Liu, Xiang Bai

PDF

When Deep Classifiers Agree: Analyzing Correlations Between Learning Order and Image Statistics Iuliia Pliushch, Martin Mundt, Nicolas Lupp, Visvanathan Ramesh

PDF

Where in the World Is This Image? Transformer-Based Geo-Localization in the Wild Shraman Pramanick, Ewa M. Nowara, Joshua Gleason, Carlos D. Castillo, Rama Chellappa

PDF

Where to Focus: Investigating Hierarchical Attention Relationship for Fine-Grained Visual Classification Yang Liu, Lei Zhou, Pengcheng Zhang, Xiao Bai, Lin Gu, Xiaohan Yu, Jun Zhou, Edwin R. Hancock

PDF

WISE: Whitebox Image Stylization by Example-Based Learning Winfried Lötzsch, Max Reimann, Martin Büssemeyer, Amir Semmo, Jürgen Döllner, Matthias Trapp

PDF

Word-Level Fine-Grained Story Visualization Bowen Li

PDF

Worst Case Matters for Few-Shot Recognition Minghao Fu, Yun-Hao Cao, Jianxin Wu

PDF

X-DETR: A Versatile Architecture for Instance-Wise Vision-Language Tasks Zhaowei Cai, Gukyeong Kwon, Avinash Ravichandran, Erhan Bas, Zhuowen Tu, Rahul Bhotika, Stefano Soatto

PDF

X-Learner: Learning Cross Sources and Tasks for Universal Visual Representation Yinan He, Gengshi Huang, Siyu Chen, Jianing Teng, Kun Wang, Zhenfei Yin, Lu Sheng, Ziwei Liu, Yu Qiao, Jing Shao

PDF

XMem: Long-Term Video Object Segmentation with an Atkinson-Shiffrin Memory Model Ho Kei Cheng, Alexander G. Schwing

PDF

You Already Have It: A Generator-Free Low-Precision DNN Training Framework Using Stochastic Rounding Geng Yuan, Sung-En Chang, Qing Jin, Alec Lu, Yanyu Li, Yushu Wu, Zhenglun Kong, Yanyue Xie, Peiyan Dong, Minghai Qin, Xiaolong Ma, Xulong Tang, Zhenman Fang, Yanzhi Wang

PDF

You Should Look at All Objects Zhenchao Jin, Dongdong Yu, Luchuan Song, Zehuan Yuan, Lequan Yu

PDF

Zero-Shot Attribute Attacks on Fine-Grained Recognition Models Nasim Shafiee, Ehsan Elhamifar

PDF

Zero-Shot Category-Level Object Pose Estimation Walter Goodwin, Sagar Vaze, Ioannis Havoutis, Ingmar Posner

PDF

Zero-Shot Learning for Reflection Removal of Single 360-Degree Image Byeong-Ju Han, Jae-Young Sim

PDF

Zero-Shot Temporal Action Detection via Vision-Language Prompting Sauradip Nag, Xiatian Zhu, Yi-Zhe Song, Tao Xiang

PDF