ICCV 2023

2156 papers

2D-3D Interlaced Transformer for Point Cloud Segmentation with Scene-Level Supervision Cheng-Kun Yang, Min-Hung Chen, Yung-Yu Chuang, Yen-Yu Lin

PDF

2D3D-MATR: 2D-3D Matching Transformer for Detection-Free Registration Between Images and Point Clouds Minhao Li, Zheng Qin, Zhirui Gao, Renjiao Yi, Chenyang Zhu, Yulan Guo, Kai Xu

PDF

360VOT: A New Benchmark Dataset for Omnidirectional Visual Object Tracking Huajian Huang, Yinzhe Xu, Yingshu Chen, Sai-Kit Yeung

PDF

3D Distillation: Improving Self-Supervised Monocular Depth Estimation on Reflective Surfaces Xuepeng Shi, Georgi Dikov, Gerhard Reitmayr, Tae-Kyun Kim, Mohsen Ghafoorian

PDF

3D Human Mesh Recovery with Sequentially Global Rotation Estimation Dongkai Wang, Shiliang Zhang

PDF

3D Implicit Transporter for Temporally Consistent Keypoint Discovery Chengliang Zhong, Yuhang Zheng, Yupeng Zheng, Hao Zhao, Li Yi, Xiaodong Mu, Ling Wang, Pengfei Li, Guyue Zhou, Chao Yang, Xinliang Zhang, Jian Zhao

PDF

3D Instance Segmentation via Enhanced Spatial and Semantic Supervision Salwa Al Khatib, Mohamed El Amine Boudjoghra, Jean Lahoud, Fahad Shahbaz Khan

PDF

3D Motion Magnification: Visualizing Subtle Motions from Time-Varying Radiance Fields Brandon Y. Feng, Hadi Alzayer, Michael Rubinstein, William T. Freeman, Jia-bin Huang

PDF

3D Neural Embedding Likelihood: Probabilistic Inverse Graphics for Robust 6d Pose Estimation Guangyao Zhou, Nishad Gothoskar, Lirui Wang, Joshua B. Tenenbaum, Dan Gutfreund, Miguel Lázaro-Gredilla, Dileep George, Vikash K. Mansinghka

PDF

3D Segmentation of Humans in Point Clouds with Synthetic Data Ayça Takmaz, Jonas Schult, Irem Kaftan, Mertcan Akçay, Bastian Leibe, Robert Sumner, Francis Engelmann, Siyu Tang

PDF

3D Semantic Subspace Traverser: Empowering 3D Generative Model with Shape Editing Capability Ruowei Wang, Yu Liu, Pei Su, Jianwei Zhang, Qijun Zhao

PDF

3D VR Sketch Guided 3D Shape Prototyping and Exploration Ling Luo, Pinaki Nath Chowdhury, Tao Xiang, Yi-Zhe Song, Yulia Gryaditskaya

PDF

3D-Aware Blending with Generative NeRFs Hyunsu Kim, Gayoung Lee, Yunjey Choi, Jin-Hwa Kim, Jun-Yan Zhu

PDF

3D-Aware Generative Model for Improved Side-View Image Synthesis Kyungmin Jo, Wonjoon Jin, Jaegul Choo, Hyunjoon Lee, Sunghyun Cho

PDF

3D-Aware Image Generation Using 2D Diffusion Models Jianfeng Xiang, Jiaolong Yang, Binbin Huang, Xin Tong

PDF

3D-Aware Neural Body Fitting for Occlusion Robust 3D Human Pose Estimation Yi Zhang, Pengliang Ji, Angtian Wang, Jieru Mei, Adam Kortylewski, Alan Yuille

PDF

3D-VisTA: Pre-Trained Transformer for 3D Vision and Text Alignment Ziyu Zhu, Xiaojian Ma, Yixin Chen, Zhidong Deng, Siyuan Huang, Qing Li

PDF

3DHacker: Spectrum-Based Decision Boundary Generation for Hard-Label 3D Point Cloud Attack Yunbo Tao, Daizong Liu, Pan Zhou, Yulai Xie, Wei Du, Wei Hu

PDF

3DHumanGAN: 3D-Aware Human Image Generation with 3D Pose Mapping Zhuoqian Yang, Shikai Li, Wayne Wu, Bo Dai

PDF

3DMiner: Discovering Shapes from Large-Scale Unannotated Image Datasets Ta-Ying Cheng, Matheus Gadelha, Sören Pirk, Thibault Groueix, Radomír Měch, Andrew Markham, Niki Trigoni

PDF

3DMOTFormer: Graph Transformer for Online 3D Multi-Object Tracking Shuxiao Ding, Eike Rehder, Lukas Schneider, Marius Cordts, Juergen Gall

PDF

3DPPE: 3D Point Positional Encoding for Transformer-Based Multi-Camera 3D Object Detection Changyong Shu, Jiajun Deng, Fisher Yu, Yifan Liu

PDF

4D Myocardium Reconstruction with Decoupled Motion and Shape Model Xiaohan Yuan, Cong Liu, Yangang Wang

PDF

4D Panoptic Segmentation as Invariant and Equivariant Field Prediction Minghan Zhu, Shizhong Han, Hong Cai, Shubhankar Borse, Maani Ghaffari, Fatih Porikli

PDF

A 5-Point Minimal Solver for Event Camera Relative Motion Estimation Ling Gao, Hang Su, Daniel Gehrig, Marco Cannici, Davide Scaramuzza, Laurent Kneip

PDF

A Benchmark for Chinese-English Scene Text Image Super-Resolution Jianqi Ma, Zhetong Liang, Wangmeng Xiang, Xi Yang, Lei Zhang

PDF

A Complete Recipe for Diffusion Generative Models Kushagra Pandey, Stephan Mandt

PDF

A Dynamic Dual-Processing Object Detection Framework Inspired by the Brain's Recognition Mechanism Minying Zhang, Tianpeng Bu, Lulu Hu

PDF

A Fast Unified System for 3D Object Detection and Tracking Thomas Heitzinger, Martin Kampel

PDF

A Game of Bundle Adjustment - Learning Efficient Convergence Amir Belder, Refael Vivanti, Ayellet Tal

PDF

A Generalist Framework for Panoptic Segmentation of Images and Videos Ting Chen, Lala Li, Saurabh Saxena, Geoffrey Hinton, David J. Fleet

PDF

A Good Student Is Cooperative and Reliable: CNN-Transformer Collaborative Learning for Semantic Segmentation Jinjing Zhu, Yunhao Luo, Xu Zheng, Hao Wang, Lin Wang

PDF

A Large-Scale Outdoor Multi-Modal Dataset and Benchmark for Novel View Synthesis and Implicit Scene Reconstruction Chongshan Lu, Fukun Yin, Xin Chen, Wen Liu, Tao Chen, Gang Yu, Jiayuan Fan

PDF

A Large-Scale Study of Spatiotemporal Representation Learning with a New Benchmark on Action Recognition Andong Deng, Taojiannan Yang, Chen Chen

PDF

A Latent Space of Stochastic Diffusion Models for Zero-Shot Image Editing and Guidance Chen Henry Wu, Fernando De la Torre

PDF

A Low-Shot Object Counting Network with Iterative Prototype Adaptation Nikola Đukić, Alan Lukežič, Vitjan Zavrtanik, Matej Kristan

PDF

A Multidimensional Analysis of Social Biases in Vision Transformers Jannik Brinkmann, Paul Swoboda, Christian Bartelt

PDF

A Parse-Then-Place Approach for Generating Graphic Layouts from Textual Descriptions Jiawei Lin, Jiaqi Guo, Shizhao Sun, Weijiang Xu, Ting Liu, Jian-Guang Lou, Dongmei Zhang

PDF

A Retrospect to Multi-Prompt Learning Across Vision and Language Ziliang Chen, Xin Huang, Quanlong Guan, Liang Lin, Weiqi Luo

PDF

A Sentence Speaks a Thousand Images: Domain Generalization Through Distilling CLIP with Language Guidance Zeyi Huang, Andy Zhou, Zijian Ling, Mu Cai, Haohan Wang, Yong Jae Lee

PDF

A Simple Framework for Open-Vocabulary Segmentation and Detection Hao Zhang, Feng Li, Xueyan Zou, Shilong Liu, Chunyuan Li, Jianwei Yang, Lei Zhang

PDF

A Simple Recipe to Meta-Learn Forward and Backward Transfer Edoardo Cetin, Antonio Carta, Oya Celiktutan

PDF

A Simple Vision Transformer for Weakly Semi-Supervised 3D Object Detection Dingyuan Zhang, Dingkang Liang, Zhikang Zou, Jingyu Li, Xiaoqing Ye, Zhe Liu, Xiao Tan, Xiang Bai

PDF

A Skeletonization Algorithm for Gradient-Based Optimization Martin J. Menten, Johannes C. Paetzold, Veronika A. Zimmer, Suprosanna Shit, Ivan Ezhov, Robbie Holland, Monika Probst, Julia A. Schnabel, Daniel Rueckert

PDF

A Soft Nearest-Neighbor Framework for Continual Semi-Supervised Learning Zhiqi Kang, Enrico Fini, Moin Nabi, Elisa Ricci, Karteek Alahari

PDF

A Step Towards Understanding Why Classification Helps Regression Silvia L. Pintea, Yancong Lin, Jouke Dijkstra, Jan C. van Gemert

PDF

A Theory of Topological Derivatives for Inverse Rendering of Geometry Ishit Mehta, Manmohan Chandraker, Ravi Ramamoorthi

PDF

A Unified Continual Learning Framework with General Parameter-Efficient Tuning Qiankun Gao, Chen Zhao, Yifan Sun, Teng Xi, Gang Zhang, Bernard Ghanem, Jian Zhang

PDF

A Unified Framework for Robustness on Diverse Sampling Errors Myeongho Jeon, Myungjoo Kang, Joonseok Lee

PDF

A-STAR: Test-Time Attention Segregation and Retention for Text-to-Image Synthesis Aishwarya Agarwal, Srikrishna Karanam, K J Joseph, Apoorv Saxena, Koustava Goswami, Balaji Vasan Srinivasan

PDF

A2Q: Accumulator-Aware Quantization with Guaranteed Overflow Avoidance Ian Colbert, Alessandro Pappalardo, Jakoba Petri-Koenig

PDF

Ablating Concepts in Text-to-Image Diffusion Models Nupur Kumari, Bingliang Zhang, Sheng-Yu Wang, Eli Shechtman, Richard Zhang, Jun-Yan Zhu

PDF

AccFlow: Backward Accumulation for Long-Range Optical Flow Guangyang Wu, Xiaohong Liu, Kunming Luo, Xi Liu, Qingqing Zheng, Shuaicheng Liu, Xinyang Jiang, Guangtao Zhai, Wenyi Wang

PDF

Accurate 3D Face Reconstruction with Facial Component Tokens Tianke Zhang, Xuangeng Chu, Yunfei Liu, Lijian Lin, Zhendong Yang, Zhengzhuo Xu, Chengkun Cao, Fei Yu, Changyin Zhou, Chun Yuan, Yu Li

PDF

Accurate and Fast Compressed Video Captioning Yaojie Shen, Xin Gu, Kai Xu, Heng Fan, Longyin Wen, Libo Zhang

PDF

Achievement-Based Training Progress Balancing for Multi-Task Learning Hayoung Yun, Hanjoo Cho

PDF

ACLS: Adaptive and Conditional Label Smoothing for Network Calibration Hyekang Park, Jongyoun Noh, Youngmin Oh, Donghyeon Baek, Bumsub Ham

PDF

ActFormer: A GAN-Based Transformer Towards General Action-Conditioned 3D Human Motion Generation Liang Xu, Ziyang Song, Dongliang Wang, Jing Su, Zhicheng Fang, Chenjing Ding, Weihao Gan, Yichao Yan, Xin Jin, Xiaokang Yang, Wenjun Zeng, Wei Wu

PDF

Action Sensitivity Learning for Temporal Action Localization Jiayi Shao, Xiaohan Wang, Ruijie Quan, Junjun Zheng, Jiang Yang, Yi Yang

PDF

Activate and Reject: Towards Safe Domain Generalization Under Category Shift Chaoqi Chen, Luyao Tang, Leitian Tao, Hong-Yu Zhou, Yue Huang, Xiaoguang Han, Yizhou Yu

PDF

Active Neural Mapping Zike Yan, Haoxiang Yang, Hongbin Zha

PDF

Active Self-Supervised Learning: A Few Low-Cost Relationships Are All You Need Vivien Cabannes, Leon Bottou, Yann Lecun, Randall Balestriero

PDF

Active Stereo Without Pattern Projector Luca Bartolomei, Matteo Poggi, Fabio Tosi, Andrea Conti, Stefano Mattoccia

PDF

ACTIVE: Towards Highly Transferable 3D Physical Camouflage for Universal and Robust Vehicle Evasion Naufal Suryanto, Yongsu Kim, Harashta Tatimma Larasati, Hyoeun Kang, Thi-Thu-Huong Le, Yoonyoung Hong, Hunmin Yang, Se-Yoon Oh, Howon Kim

PDF

ActorsNeRF: Animatable Few-Shot Human Rendering with Generalizable NeRFs Jiteng Mu, Shen Sang, Nuno Vasconcelos, Xiaolong Wang

PDF

Ada3D : Exploiting the Spatial Redundancy with Adaptive Inference for Efficient 3D Object Detection Tianchen Zhao, Xuefei Ning, Ke Hong, Zhongyuan Qiu, Pu Lu, Yali Zhao, Linfeng Zhang, Lipu Zhou, Guohao Dai, Huazhong Yang, Yu Wang

PDF

AdaMV-MoE: Adaptive Multi-Task Vision Mixture-of-Experts Tianlong Chen, Xuxi Chen, Xianzhi Du, Abdullah Rashwan, Fan Yang, Huizhong Chen, Zhangyang Wang, Yeqing Li

PDF

AdaNIC: Towards Practical Neural Image Compression via Dynamic Transform Routing Lvfang Tao, Wei Gao, Ge Li, Chenhao Zhang

PDF

ADAPT: Efficient Multi-Agent Trajectory Prediction with Adaptation Görkay Aydemir, Adil Kaan Akan, Fatma Güney

PDF

Adaptive and Background-Aware Vision Transformer for Real-Time UAV Tracking Shuiwang Li, Yangxiang Yang, Dan Zeng, Xucheng Wang

PDF

Adaptive Calibrator Ensemble: Navigating Test Set Difficulty in Out-of-Distribution Scenarios Yuli Zou, Weijian Deng, Liang Zheng

PDF

Adaptive Frequency Filters as Efficient Global Token Mixers Zhipeng Huang, Zhizheng Zhang, Cuiling Lan, Zheng-Jun Zha, Yan Lu, Baining Guo

PDF

Adaptive Illumination Mapping for Shadow Detection in Raw Images Jiayu Sun, Ke Xu, Youwei Pang, Lihe Zhang, Huchuan Lu, Gerhard Hancke, Rynson Lau

PDF

Adaptive Image Anonymization in the Context of Image Classification with Neural Networks Nadiya Shvai, Arcadi Llanza Carmona, Amir Nakib

PDF

Adaptive Nonlinear Latent Transformation for Conditional Face Editing Zhizhong Huang, Siteng Ma, Junping Zhang, Hongming Shan

PDF

Adaptive Positional Encoding for Bundle-Adjusting Neural Radiance Fields Zelin Gao, Weichen Dai, Yu Zhang

PDF

Adaptive Reordering Sampler with Neurally Guided MAGSAC Tong Wei, Jiri Matas, Daniel Barath

PDF

Adaptive Rotated Convolution for Rotated Object Detection Yifan Pu, Yiru Wang, Zhuofan Xia, Yizeng Han, Yulin Wang, Weihao Gan, Zidong Wang, Shiji Song, Gao Huang

PDF

Adaptive Similarity Bootstrapping for Self-Distillation Based Representation Learning Tim Lebailly, Thomas Stegmüller, Behzad Bozorgtabar, Jean-Philippe Thiran, Tinne Tuytelaars

PDF

Adaptive Spiral Layers for Efficient 3D Representation Learning on Meshes Francesca Babiloni, Matteo Maggioni, Thomas Tanay, Jiankang Deng, Ales Leonardis, Stefanos Zafeiriou

PDF

Adaptive Superpixel for Active Learning in Semantic Segmentation Hoyoung Kim, Minhyeon Oh, Sehyun Hwang, Suha Kwak, Jungseul Ok

PDF

Adaptive Template Transformer for Mitochondria Segmentation in Electron Microscopy Images Yuwen Pan, Naisong Luo, Rui Sun, Meng Meng, Tianzhu Zhang, Zhiwei Xiong, Yongdong Zhang

PDF

Adaptive Testing of Computer Vision Models Irena Gao, Gabriel Ilharco, Scott Lundberg, Marco Tulio Ribeiro

PDF

Adding Conditional Control to Text-to-Image Diffusion Models Lvmin Zhang, Anyi Rao, Maneesh Agrawala

PDF

ADNet: Lane Shape Prediction via Anchor Decomposition Lingyu Xiao, Xiang Li, Sen Yang, Wankou Yang

PDF

Advancing Example Exploitation Can Alleviate Critical Challenges in Adversarial Training Yao Ge, Yun Li, Keji Han, Junyi Zhu, Xianzhong Long

PDF

Advancing Referring Expression Segmentation Beyond Single Image Yixuan Wu, Zhao Zhang, Chi Xie, Feng Zhu, Rui Zhao

PDF

AdvDiffuser: Natural Adversarial Example Synthesis with Diffusion Models Xinquan Chen, Xitong Gao, Juanjuan Zhao, Kejiang Ye, Cheng-Zhong Xu

PDF

AdVerb: Visually Guided Audio Dereverberation Sanjoy Chowdhury, Sreyan Ghosh, Subhrajyoti Dasgupta, Anton Ratnarajah, Utkarsh Tyagi, Dinesh Manocha

PDF

Adversarial Bayesian Augmentation for Single-Source Domain Generalization Sheng Cheng, Tejas Gokhale, Yezhou Yang

PDF

Adversarial Finetuning with Latent Representation Constraint to Mitigate Accuracy-Robustness Tradeoff Satoshi Suzuki, Shin'ya Yamaguchi, Shoichiro Takeda, Sekitoshi Kanai, Naoki Makishima, Atsushi Ando, Ryo Masumura

PDF

Adverse Weather Removal with Codebook Priors Tian Ye, Sixiang Chen, Jinbin Bai, Jun Shi, Chenghao Xue, Jingxia Jiang, Junjie Yin, Erkang Chen, Yun Liu

PDF

AerialVLN: Vision-and-Language Navigation for UAVs Shubo Liu, Hongsheng Zhang, Yuankai Qi, Peng Wang, Yanning Zhang, Qi Wu

PDF

AesPA-Net: Aesthetic Pattern-Aware Style Transfer Networks Kibeom Hong, Seogkyu Jeon, Junsoo Lee, Namhyuk Ahn, Kunhee Kim, Pilhyeon Lee, Daesik Kim, Youngjung Uh, Hyeran Byun

PDF

Affective Image Filter: Reflecting Emotions from Text to Images Shuchen Weng, Peixuan Zhang, Zheng Chang, Xinlong Wang, Si Li, Boxin Shi

PDF

Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection Junjia Huang, Haofeng Li, Xiang Wan, Guanbin Li

PDF

AffordPose: A Large-Scale Dataset of Hand-Object Interactions with Affordance-Driven Hand Pose Juntao Jian, Xiuping Liu, Manyi Li, Ruizhen Hu, Jian Liu

PDF

AG3D: Learning to Generate 3D Avatars from 2D Image Collections Zijian Dong, Xu Chen, Jinlong Yang, Michael J. Black, Otmar Hilliges, Andreas Geiger

PDF

AGG-Net: Attention Guided Gated-Convolutional Network for Depth Image Completion Dongyue Chen, Tingxuan Huang, Zhimin Song, Shizhuo Deng, Tong Jia

PDF

Agglomerative Transformer for Human-Object Interaction Detection Danyang Tu, Wei Sun, Guangtao Zhai, Wei Shen

PDF

Aggregating Feature Point Cloud for Depth Completion Zhu Yu, Zehua Sheng, Zili Zhou, Lun Luo, Si-Yuan Cao, Hong Gu, Huaqi Zhang, Hui-Liang Shen

PDF

Agile Modeling: From Concept to Classifier in Minutes Otilia Stretcu, Edward Vendrow, Kenji Hata, Krishnamurthy Viswanathan, Vittorio Ferrari, Sasan Tavakkol, Wenlei Zhou, Aditya Avinash, Emming Luo, Neil Gordon Alldrin, MohammadHossein Bateni, Gabriel Berger, Andrew Bunner, Chun-Ta Lu, Javier Rey, Giulia DeSalvo, Ranjay Krishna, Ariel Fuxman‎

PDF

AIDE: A Vision-Driven Multi-View, Multi-Modal, Multi-Tasking Dataset for Assistive Driving Perception Dingkang Yang, Shuai Huang, Zhi Xu, Zhenpeng Li, Shunli Wang, Mingcheng Li, Yuzheng Wang, Yang Liu, Kun Yang, Zhaoyu Chen, Yan Wang, Jing Liu, Peixuan Zhang, Peng Zhai, Lihua Zhang

PDF

Algebraically Rigorous Quaternion Framework for the Neural Network Pose Estimation Problem Chen Lin, Andrew J. Hanson, Sonya M. Hanson

PDF

AlignDet: Aligning Pre-Training and Fine-Tuning in Object Detection Ming Li, Jie Wu, Xionghui Wang, Chen Chen, Jie Qin, Xuefeng Xiao, Rui Wang, Min Zheng, Xin Pan

PDF

Alignment Before Aggregation: Trajectory Memory Retrieval Network for Video Object Segmentation Rui Sun, Yuan Wang, Huayu Mai, Tianzhu Zhang, Feng Wu

PDF

Alignment-Free HDR Deghosting with Semantics Consistent Transformer Steven Tel, Zongwei Wu, Yulun Zhang, Barthélémy Heyrman, Cédric Demonceaux, Radu Timofte, Dominique Ginhac

PDF

ALIP: Adaptive Language-Image Pre-Training with Synthetic Caption Kaicheng Yang, Jiankang Deng, Xiang An, Jiawei Li, Ziyong Feng, Jia Guo, Jing Yang, Tongliang Liu

PDF

All in Tokens: Unifying Output Space of Visual Tasks via Soft Token Jia Ning, Chen Li, Zheng Zhang, Chunyu Wang, Zigang Geng, Qi Dai, Kun He, Han Hu

PDF

All-to-Key Attention for Arbitrary Style Transfer Mingrui Zhu, Xiao He, Nannan Wang, Xiaoyu Wang, Xinbo Gao

PDF

All4One: Symbiotic Neighbour Contrastive Learning via Self-Attention and Redundancy Reduction Imanol G. Estepa, Ignacio Sarasua, Bhalaji Nagarajan, Petia Radeva

PDF

Alleviating Catastrophic Forgetting of Incremental Object Detection via Within-Class and Between-Class Knowledge Distillation Mengxue Kang, Jinpeng Zhang, Jinming Zhang, Xiashuang Wang, Yang Chen, Zhe Ma, Xuhui Huang

PDF

ALWOD: Active Learning for Weakly-Supervised Object Detection Yuting Wang, Velibor Ilic, Jiatong Li, Branislav Kisačanin, Vladimir Pavlovic

PDF

Among Us: Adversarially Robust Collaborative Perception by Consensus Yiming Li, Qi Fang, Jiamu Bai, Siheng Chen, Felix Juefei-Xu, Chen Feng

PDF

An Adaptive Model Ensemble Adversarial Attack for Boosting Adversarial Transferability Bin Chen, Jiali Yin, Shukai Chen, Bohao Chen, Ximeng Liu

PDF

An Embarrassingly Simple Backdoor Attack on Self-Supervised Learning Changjiang Li, Ren Pang, Zhaohan Xi, Tianyu Du, Shouling Ji, Yuan Yao, Ting Wang

PDF

Anatomical Invariance Modeling and Semantic Alignment for Self-Supervised Learning in 3D Medical Image Analysis Yankai Jiang, Mingze Sun, Heng Guo, Xiaoyu Bai, Ke Yan, Le Lu, Minfeng Xu

PDF

Anchor Structure Regularization Induced Multi-View Subspace Clustering via Enhanced Tensor Rank Minimization Jintian Ji, Songhe Feng

PDF

Anchor-Intermediate Detector: Decoupling and Coupling Bounding Boxes for Accurate Object Detection Yilong Lv, Min Li, Yujie He, Shaopeng Li, Zhuzhen He, Aitao Yang

PDF

Animal3D: A Comprehensive Dataset of 3D Animal Pose and Shape Jiacong Xu, Yi Zhang, Jiawei Peng, Wufei Ma, Artur Jesslen, Pengliang Ji, Qixin Hu, Jiehua Zhang, Qihao Liu, Jiahao Wang, Wei Ji, Chen Wang, Xiaoding Yuan, Prakhar Kaushik, Guofeng Zhang, Jie Liu, Yushan Xie, Yawen Cui, Alan Yuille, Adam Kortylewski

PDF

Anomaly Detection Under Distribution Shift Tri Cao, Jiawen Zhu, Guansong Pang

PDF

Anomaly Detection Using Score-Based Perturbation Resilience Woosang Shin, Jonghyeon Lee, Taehan Lee, Sangmoon Lee, Jong Pil Yun

PDF

Anti-DreamBooth: Protecting Users from Personalized Text-to-Image Synthesis Thanh Van Le, Hao Phung, Thuan Hoang Nguyen, Quan Dao, Ngoc N. Tran, Anh Tran

PDF

Aperture Diffraction for Compact Snapshot Spectral Imaging Tao Lv, Hao Ye, Quan Yuan, Zhan Shi, Yibo Wang, Shuming Wang, Xun Cao

PDF

AREA: Adaptive Reweighting via Effective Area for Long-Tailed Classification Xiaohua Chen, Yucan Zhou, Dayan Wu, Chule Yang, Bo Li, Qinghua Hu, Weiping Wang

PDF

Aria Digital Twin: A New Benchmark Dataset for Egocentric 3D Machine Perception Xiaqing Pan, Nicholas Charron, Yongqian Yang, Scott Peters, Thomas Whelan, Chen Kong, Omkar Parkhi, Richard Newcombe, Yuheng Ren

PDF

ARNOLD: A Benchmark for Language-Grounded Task Learning with Continuous States in Realistic 3D Scenes Ran Gong, Jiangyong Huang, Yizhou Zhao, Haoran Geng, Xiaofeng Gao, Qingyang Wu, Wensi Ai, Ziheng Zhou, Demetri Terzopoulos, Song-Chun Zhu, Baoxiong Jia, Siyuan Huang

PDF

ASAG: Building Strong One-Decoder-Layer Sparse Detectors via Adaptive Sparse Anchor Generation Shenghao Fu, Junkai Yan, Yipeng Gao, Xiaohua Xie, Wei-Shi Zheng

PDF

ASIC: Aligning Sparse In-the-Wild Image Collections Kamal Gupta, Varun Jampani, Carlos Esteves, Abhinav Shrivastava, Ameesh Makadia, Noah Snavely, Abhishek Kar

PDF

ASM: Adaptive Skinning Model for High-Quality 3D Face Modeling Kai Yang, Hong Shang, Tianyang Shi, Xinghan Chen, Jingkai Zhou, Zhongqian Sun, Wei Yang

PDF

AssetField: Assets Mining and Reconfiguration in Ground Feature Plane Representation Yuanbo Xiangli, Linning Xu, Xingang Pan, Nanxuan Zhao, Bo Dai, Dahua Lin

PDF

Atmospheric Transmission and Thermal Inertia Induced Blind Road Segmentation with a Large-Scale Dataset TBRSD Junzhang Chen, Xiangzhi Bai

PDF

ATT3D: Amortized Text-to-3D Object Synthesis Jonathan Lorraine, Kevin Xie, Xiaohui Zeng, Chen-Hsuan Lin, Towaki Takikawa, Nicholas Sharp, Tsung-Yi Lin, Ming-Yu Liu, Sanja Fidler, James Lucas

PDF

Attention Discriminant Sampling for Point Clouds Cheng-Yao Hong, Yu-Ying Chou, Tyng-Luh Liu

PDF

Attention Where It Matters: Rethinking Visual Document Understanding with Selective Region Concentration Haoyu Cao, Changcun Bao, Chaohu Liu, Huang Chen, Kun Yin, Hao Liu, Yinsong Liu, Deqiang Jiang, Xing Sun

PDF

Attentive Mask CLIP Yifan Yang, Weiquan Huang, Yixuan Wei, Houwen Peng, Xinyang Jiang, Huiqiang Jiang, Fangyun Wei, Yin Wang, Han Hu, Lili Qiu, Yuqing Yang

PDF

AttT2M: Text-Driven Human Motion Generation with Multi-Perspective Attention Mechanism Chongyang Zhong, Lei Hu, Zihao Zhang, Shihong Xia

PDF

Audio-Enhanced Text-to-Video Retrieval Using Text-Conditioned Feature Alignment Sarah Ibrahimi, Xiaohang Sun, Pichao Wang, Amanmeet Garg, Ashutosh Sanan, Mohamed Omar

PDF

Audio-Visual Class-Incremental Learning Weiguo Pian, Shentong Mo, Yunhui Guo, Yapeng Tian

PDF

Audio-Visual Deception Detection: DOLOS Dataset and Parameter-Efficient Crossmodal Learning Xiaobao Guo, Nithish Muthuchamy Selvaraj, Zitong Yu, Adams Wai-Kin Kong, Bingquan Shen, Alex Kot

PDF

Audio-Visual Glance Network for Efficient Video Recognition Muhammad Adi Nugroho, Sangmin Woo, Sumin Lee, Changick Kim

PDF

Audiovisual Masked Autoencoders Mariana-Iuliana Georgescu, Eduardo Fonseca, Radu Tudor Ionescu, Mario Lucic, Cordelia Schmid, Anurag Arnab

PDF

Augmented Box Replay: Overcoming Foreground Shift for Incremental Object Detection Yuyang Liu, Yang Cong, Dipam Goswami, Xialei Liu, Joost van de Weijer

PDF

Augmenting and Aligning Snippets for Few-Shot Video Domain Adaptation Yuecong Xu, Jianfei Yang, Yunjiao Zhou, Zhenghua Chen, Min Wu, Xiaoli Li

PDF

AutoAD II: The Sequel - Who, When, and What in Movie Audio Description Tengda Han, Max Bain, Arsha Nagrani, Gul Varol, Weidi Xie, Andrew Zisserman

PDF

AutoDiffusion: Training-Free Optimization of Time Steps and Architectures for Automated Diffusion Model Acceleration Lijiang Li, Huixia Li, Xiawu Zheng, Jie Wu, Xuefeng Xiao, Rui Wang, Min Zheng, Xin Pan, Fei Chao, Rongrong Ji

PDF

Automated Knowledge Distillation via Monte Carlo Tree Search Lujun Li, Peijie Dong, Zimian Wei, Ya Yang

PDF

Automatic Animation of Hair Blowing in Still Portrait Photos Wenpeng Xiao, Wentao Liu, Yitong Wang, Bernard Ghanem, Bing Li

PDF

Automatic Network Pruning via Hilbert-Schmidt Independence Criterion Lasso Under Information Bottleneck Principle Song Guo, Lei Zhang, Xiawu Zheng, Yan Wang, Yuchao Li, Fei Chao, Chenglin Wu, Shengchuan Zhang, Rongrong Ji

PDF

AutoReP: Automatic ReLU Replacement for Fast Private Network Inference Hongwu Peng, Shaoyi Huang, Tong Zhou, Yukui Luo, Chenghong Wang, Zigeng Wang, Jiahui Zhao, Xi Xie, Ang Li, Tony Geng, Kaleel Mahmood, Wujie Wen, Xiaolin Xu, Caiwen Ding

PDF

AutoSynth: Learning to Generate 3D Training Data for Object Point Cloud Registration Zheng Dang, Mathieu Salzmann

PDF

Auxiliary Tasks Benefit 3D Skeleton-Based Human Motion Prediction Chenxin Xu, Robby T. Tan, Yuhong Tan, Siheng Chen, Xinchao Wang, Yanfeng Wang

PDF

AvatarCraft: Transforming Text into Neural Human Avatars with Parameterized Shape and Pose Control Ruixiang Jiang, Can Wang, Jingbo Zhang, Menglei Chai, Mingming He, Dongdong Chen, Jing Liao

PDF

Backpropagation Path Search on Adversarial Transferability Zhuoer Xu, Zhangxuan Gu, Jianping Zhang, Shiwen Cui, Changhua Meng, Weiqiang Wang

PDF

BallGAN: 3D-Aware Image Synthesis with a Spherical Background Minjung Shin, Yunji Seo, Jeongmin Bae, Young Sun Choi, Hyunsu Kim, Hyeran Byun, Youngjung Uh

PDF

BANSAC: A Dynamic BAyesian Network for Adaptive SAmple Consensus Valter Piedade, Pedro Miraldo

PDF

BaRe-ESA: A Riemannian Framework for Unregistered Human Body Shapes Emmanuel Hartman, Emery Pierson, Martin Bauer, Nicolas Charon, Mohamed Daoudi

PDF

Batch-Based Model Registration for Fast 3D Sherd Reconstruction Jiepeng Wang, Congyi Zhang, Peng Wang, Xin Li, Peter J. Cobb, Christian Theobalt, Wenping Wang

PDF

Bayesian Optimization Meets Self-Distillation HyunJae Lee, Heon Song, Hyeonsoo Lee, Gi-hyeon Lee, Suyeong Park, Donggeun Yoo

PDF

Bayesian Prompt Learning for Image-Language Model Generalization Mohammad Mahdi Derakhshani, Enrique Sanchez, Adrian Bulat, Victor G. Turrisi da Costa, Cees G.M. Snoek, Georgios Tzimiropoulos, Brais Martinez

PDF

Be Everywhere - Hear Everything (BEE): Audio Scene Reconstruction by Sparse Audio-Visual Samples Mingfei Chen, Kun Su, Eli Shlizerman

PDF

Beating Backdoor Attack at Its Own Game Min Liu, Alberto Sangiovanni-Vincentelli, Xiangyu Yue

PDF

BeLFusion: Latent Diffusion for Behavior-Driven Human Motion Prediction German Barquero, Sergio Escalera, Cristina Palmero

PDF

Benchmarking Algorithmic Bias in Face Recognition: An Experimental Approach Using Synthetic Faces and Human Evaluation Hao Liang, Pietro Perona, Guha Balakrishnan

PDF

Benchmarking and Analyzing Robust Point Cloud Recognition: Bag of Tricks for Defending Adversarial Examples Qiufan Ji, Lin Wang, Cong Shi, Shengshan Hu, Yingying Chen, Lichao Sun

PDF

Benchmarking Low-Shot Robustness to Natural Distribution Shifts Aaditya Singh, Kartik Sarangmath, Prithvijit Chattopadhyay, Judy Hoffman

PDF

Betrayed by Captions: Joint Caption Grounding and Generation for Open Vocabulary Instance Segmentation Jianzong Wu, Xiangtai Li, Henghui Ding, Xia Li, Guangliang Cheng, Yunhai Tong, Chen Change Loy

PDF

Better May Not Be Fairer: A Study on Subgroup Discrepancy in Image Classification Ming-Chang Chiu, Pin-Yu Chen, Xuezhe Ma

PDF

BEV-DG: Cross-Modal Learning Under Bird's-Eye View for Domain Generalization of 3D Semantic Segmentation Miaoyu Li, Yachao Zhang, Xu Ma, Yanyun Qu, Yun Fu

PDF

BEVPlace: Learning LiDAR-Based Place Recognition Using Bird's Eye View Images Lun Luo, Shuhang Zheng, Yixuan Li, Yongzhi Fan, Beinan Yu, Si-Yuan Cao, Junwei Li, Hui-Liang Shen

PDF

Beyond Image Borders: Learning Feature Extrapolation for Unbounded Image Composition Xiaoyu Liu, Ming Liu, Junyi Li, Shuai Liu, Xiaotao Wang, Lei Lei, Wangmeng Zuo

PDF

Beyond Object Recognition: A New Benchmark Towards Object Concept Learning Yong-Lu Li, Yue Xu, Xinyu Xu, Xiaohan Mao, Yuan Yao, Siqi Liu, Cewu Lu

PDF

Beyond One-to-One: Rethinking the Referring Image Segmentation Yutao Hu, Qixiong Wang, Wenqi Shao, Enze Xie, Zhenguo Li, Jungong Han, Ping Luo

PDF

Beyond Single Path Integrated Gradients for Reliable Input Attribution via Randomized Path Sampling Giyoung Jeon, Haedong Jeong, Jaesik Choi

PDF

Beyond Skin Tone: A Multidimensional Measure of Apparent Skin Color William Thong, Przemyslaw Joniak, Alice Xiang

PDF

Beyond the Limitation of Monocular 3D Detector via Knowledge Distillation Yiran Yang, Dongshuo Yin, Xuee Rong, Xian Sun, Wenhui Diao, Xinming Li

PDF

Beyond the Pixel: A Photometrically Calibrated HDR Dataset for Luminance and Color Prediction Christophe Bolduc, Justine Giroux, Marc Hébert, Claude Demers, Jean-François Lalonde

PDF

Bidirectional Alignment for Domain Adaptive Detection with Transformers Liqiang He, Wei Wang, Albert Chen, Min Sun, Cheng-Hao Kuo, Sinisa Todorovic

PDF

Bidirectionally Deformable Motion Modulation for Video-Based Human Pose Transfer Wing-Yin Yu, Lai-Man Po, Ray C.C. Cheung, Yuzhi Zhao, Yu Xue, Kun Li

PDF

BiFF: Bi-Level Future Fusion with Polyline-Based Coordinate for Interactive Trajectory Prediction Yiyao Zhu, Di Luan, Shaojie Shen

PDF

Bird's-Eye-View Scene Graph for Vision-Language Navigation Rui Liu, Xiaohan Wang, Wenguan Wang, Yi Yang

PDF

BiViT: Extremely Compressed Binary Vision Transformers Yefei He, Zhenyu Lou, Luoming Zhang, Jing Liu, Weijia Wu, Hong Zhou, Bohan Zhuang

PDF

Black Box Few-Shot Adaptation for Vision-Language Models Yassine Ouali, Adrian Bulat, Brais Matinez, Georgios Tzimiropoulos

PDF

Black-Box Unsupervised Domain Adaptation with Bi-Directional Atkinson-Shiffrin Memory Jingyi Zhang, Jiaxing Huang, Xueying Jiang, Shijian Lu

PDF

BlendFace: Re-Designing Identity Encoders for Face-Swapping Kaede Shiohara, Xingchao Yang, Takafumi Taketomi

PDF

Blending-NeRF: Text-Driven Localized Editing in Neural Radiance Fields Hyeonseop Song, Seokhun Choi, Hoseok Do, Chul Lee, Taehyeong Kim

PDF

BlindHarmony: "Blind" Harmonization for MR Images via Flow Model Hwihun Jeong, Heejoon Byun, Dong Un Kang, Jongho Lee

PDF

Body Knowledge and Uncertainty Modeling for Monocular 3D Human Body Reconstruction Yufei Zhang, Hanjing Wang, Jeffrey O. Kephart, Qiang Ji

PDF

Bold but Cautious: Unlocking the Potential of Personalized Federated Learning Through Cautiously Aggressive Collaboration Xinghao Wu, Xuefeng Liu, Jianwei Niu, Guogang Zhu, Shaojie Tang

PDF

BoMD: Bag of Multi-Label Descriptors for Noisy Chest X-Ray Classification Yuanhong Chen, Fengbei Liu, Hu Wang, Chong Wang, Yuyuan Liu, Yu Tian, Gustavo Carneiro

PDF

Boosting 3-DoF Ground-to-Satellite Camera Localization Accuracy via Geometry-Guided Cross-View Transformer Yujiao Shi, Fei Wu, Akhil Perincherry, Ankit Vora, Hongdong Li

PDF

Boosting Adversarial Transferability via Gradient Relevance Attack Hegui Zhu, Yuchen Ren, Xiaoyan Sui, Lianping Yang, Wuming Jiang

PDF

Boosting Few-Shot Action Recognition with Graph-Guided Hybrid Matching Jiazheng Xing, Mengmeng Wang, Yudi Ruan, Bofan Chen, Yaowei Guo, Boyu Mu, Guang Dai, Jingdong Wang, Yong Liu

PDF

Boosting Long-Tailed Object Detection via Step-Wise Learning on Smooth-Tail Data Na Dong, Yongqiang Zhang, Mingli Ding, Gim Hee Lee

PDF

Boosting Multi-Modal Model Performance with Adaptive Gradient Modulation Hong Li, Xingyu Li, Pengbo Hu, Yinuo Lei, Chunxiao Li, Yi Zhou

PDF

Boosting Novel Category Discovery over Domains with Soft Contrastive Learning and All in One Classifier Zelin Zang, Lei Shang, Senqiao Yang, Fei Wang, Baigui Sun, Xuansong Xie, Stan Z. Li

PDF

Boosting Positive Segments for Weakly-Supervised Audio-Visual Video Parsing Kranthi Kumar Rachavarapu, A. N. Rajagopalan

PDF

Boosting Semantic Segmentation from the Perspective of Explicit Class Embeddings Yuhe Liu, Chuanjian Liu, Kai Han, Quan Tang, Zengchang Qin

PDF

Boosting Single Image Super-Resolution via Partial Channel Shifting Xiaoming Zhang, Tianrui Li, Xiaole Zhao

PDF

Boosting Whole Slide Image Classification from the Perspectives of Distribution, Correlation and Magnification Linhao Qu, Zhiwei Yang, Minghong Duan, Yingfan Ma, Shuo Wang, Manning Wang, Zhijian Song

PDF

Bootstrap Motion Forecasting with Self-Consistent Constraints Maosheng Ye, Jiamiao Xu, Xunnong Xu, Tengfei Wang, Tongyi Cao, Qifeng Chen

PDF

Borrowing Knowledge from Pre-Trained Language Model: A New Data-Efficient Visual Learning Paradigm Wenxuan Ma, Shuang Li, JinMing Zhang, Chi Harold Liu, Jingxuan Kang, Yulin Wang, Gao Huang

PDF

Both Diverse and Realism Matter: Physical Attribute and Style Alignment for Rainy Image Generation Changfeng Yu, Shiming Chen, Yi Chang, Yibing Song, Luxin Yan

PDF

Boundary-Aware Divide and Conquer: A Diffusion-Based Solution for Unsupervised Shadow Removal Lanqing Guo, Chong Wang, Wenhan Yang, Yufei Wang, Bihan Wen

PDF

Box-Based Refinement for Weakly Supervised and Unsupervised Localization Tasks Eyal Gomel, Tal Shaharbany, Lior Wolf

PDF

BoxDiff: Text-to-Image Synthesis with Training-Free Box-Constrained Diffusion Jinheng Xie, Yuexiang Li, Yawen Huang, Haozhe Liu, Wentian Zhang, Yefeng Zheng, Mike Zheng Shou

PDF

BoxSnake: Polygonal Instance Segmentation with Box Supervision Rui Yang, Lin Song, Yixiao Ge, Xiu Li

PDF

Breaking Common Sense: WHOOPS! a Vision-and-Language Benchmark of Synthetic and Compositional Images Nitzan Bitton-Guetta, Yonatan Bitton, Jack Hessel, Ludwig Schmidt, Yuval Elovici, Gabriel Stanovsky, Roy Schwartz

PDF

Breaking Temporal Consistency: Generating Video Universal Adversarial Perturbations Using Image Models Hee-Seon Kim, Minji Son, Minbeom Kim, Myung-Joon Kwon, Changick Kim

PDF

Breaking the Limits of Text-Conditioned 3D Motion Synthesis with Elaborative Descriptions Yijun Qian, Jack Urbanek, Alexander G. Hauptmann, Jungdam Won

PDF

Bridging Cross-Task Protocol Inconsistency for Distillation in Dense Object Detection Longrong Yang, Xianpan Zhou, Xuewei Li, Liang Qiao, Zheyang Li, Ziwei Yang, Gaoang Wang, Xi Li

PDF

Bridging Vision and Language Encoders: Parameter-Efficient Tuning for Referring Image Segmentation Zunnan Xu, Zhihong Chen, Yong Zhang, Yibing Song, Xiang Wan, Guanbin Li

PDF

Bring Clipart to Life Nanxuan Zhao, Shengqi Dang, Hexun Lin, Yang Shi, Nan Cao

PDF

BT^2: Backward-Compatible Training with Basis Transformation Yifei Zhou, Zilu Li, Abhinav Shrivastava, Hengshuang Zhao, Antonio Torralba, Taipeng Tian, Ser-Nam Lim

PDF

Building a Winning Team: Selecting Source Model Ensembles Using a Submodular Transferability Estimation Approach K B Vimal, Saketh Bachu, Tanmay Garg, Niveditha Lakshmi Narasimhan, Raghavan Konuru, Vineeth N Balasubramanian

PDF

Building Bridge Across the Time: Disruption and Restoration of Murals in the Wild Huiyang Shao, Qianqian Xu, Peisong Wen, Peifeng Gao, Zhiyong Yang, Qingming Huang

PDF

Building Vision Transformers with Hierarchy Aware Feature Aggregation Yongjie Chen, Hongmin Liu, Haoran Yin, Bin Fan

PDF

Building3D: A Urban-Scale Dataset and Benchmarks for Learning Roof Structures from Point Clouds Ruisheng Wang, Shangfeng Huang, Hongxin Yang

PDF

BUS: Efficient and Effective Vision-Language Pre-Training with Bottom-up Patch Summarization. Chaoya Jiang, Haiyang Xu, Wei Ye, Qinghao Ye, Chenliang Li, Ming Yan, Bin Bi, Shikun Zhang, Fei Huang, Songfang Huang

PDF

C2F2NeUS: Cascade Cost Frustum Fusion for High Fidelity and Generalizable Neural Surface Reconstruction Luoyuan Xu, Tao Guan, Yuesong Wang, Wenkai Liu, Zhaojie Zeng, Junle Wang, Wei Yang

PDF

C2ST: Cross-Modal Contextualized Sequence Transduction for Continuous Sign Language Recognition Huaiwen Zhang, Zihang Guo, Yang Yang, Xin Liu, De Hu

PDF

CAD-Estate: Large-Scale CAD Model Annotation in RGB Videos Kevis-Kokitsi Maninis, Stefan Popov, Matthias Nießner, Vittorio Ferrari

PDF

CAFA: Class-Aware Feature Alignment for Test-Time Adaptation Sanghun Jung, Jungsoo Lee, Nanhee Kim, Amirreza Shaban, Byron Boots, Jaegul Choo

PDF

Calibrating Panoramic Depth Estimation for Practical Localization and Mapping Junho Kim, Eun Sun Lee, Young Min Kim

PDF

Calibrating Uncertainty for Semi-Supervised Crowd Counting Chen Li, Xiaoling Hu, Shahira Abousamra, Chao Chen

PDF

CAME: Contrastive Automated Model Evaluation Ru Peng, Qiuyang Duan, Haobo Wang, Jiachen Ma, Yanbo Jiang, Yongjun Tu, Xiu Jiang, Junbo Zhao

PDF

Camera-Driven Representation Learning for Unsupervised Domain Adaptive Person Re-Identification Geon Lee, Sanghoon Lee, Dohyung Kim, Younghoon Shin, Yongsang Yoon, Bumsub Ham

PDF

Can Language Models Learn to Listen? Evonne Ng, Sanjay Subramanian, Dan Klein, Angjoo Kanazawa, Trevor Darrell, Shiry Ginosar

PDF

CancerUniT: Towards a Single Unified Model for Effective Detection, Segmentation, and Diagnosis of Eight Major Cancers Using a Large Collection of CT Scans Jieneng Chen, Yingda Xia, Jiawen Yao, Ke Yan, Jianpeng Zhang, Le Lu, Fakai Wang, Bo Zhou, Mingyan Qiu, Qihang Yu, Mingze Yuan, Wei Fang, Yuxing Tang, Minfeng Xu, Jian Zhou, Yuqian Zhao, Qifeng Wang, Xianghua Ye, Xiaoli Yin, Yu Shi, Xin Chen, Jingren Zhou, Alan Yuille, Zaiyi Liu, Ling Zhang

PDF

Candidate-Aware Selective Disambiguation Based on Normalized Entropy for Instance-Dependent Partial-Label Learning Shuo He, Guowu Yang, Lei Feng

PDF

Canonical Factors for Hybrid Neural Fields Brent Yi, Weijia Zeng, Sam Buchanan, Yi Ma

PDF

CaPhy: Capturing Physical Properties for Animatable Human Avatars Zhaoqi Su, Liangxiao Hu, Siyou Lin, Hongwen Zhang, Shengping Zhang, Justus Thies, Yebin Liu

PDF

Cascade-DETR: Delving into High-Quality Universal Object Detection Mingqiao Ye, Lei Ke, Siyuan Li, Yu-Wing Tai, Chi-Keung Tang, Martin Danelljan, Fisher Yu

PDF

CASSPR: Cross Attention Single Scan Place Recognition Yan Xia, Mariia Gladkova, Rui Wang, Qianyun Li, Uwe Stilla, João F Henriques, Daniel Cremers

PDF

Category-Aware Allocation Transformer for Weakly Supervised Object Localization Zhiwei Chen, Jinren Ding, Liujuan Cao, Yunhang Shen, Shengchuan Zhang, Guannan Jiang, Rongrong Ji

PDF

Causal-DFQ: Causality Guided Data-Free Network Quantization Yuzhang Shang, Bingxin Xu, Gaowen Liu, Ramana Rao Kompella, Yan Yan

PDF

CauSSL: Causality-Inspired Semi-Supervised Learning for Medical Image Segmentation Juzheng Miao, Cheng Chen, Furui Liu, Hao Wei, Pheng-Ann Heng

PDF

CBA: Improving Online Continual Learning via Continual Bias Adaptor Quanziang Wang, Renzhen Wang, Yichen Wu, Xixi Jia, Deyu Meng

PDF

CC3D: Layout-Conditioned Generation of Compositional 3D Scenes Sherwin Bahmani, Jeong Joon Park, Despoina Paschalidou, Xingguang Yan, Gordon Wetzstein, Leonidas Guibas, Andrea Tagliasacchi

PDF

CDAC: Cross-Domain Attention Consistency in Transformer for Domain Adaptive Semantic Segmentation Kaihong Wang, Donghyun Kim, Rogerio Feris, Margrit Betke

PDF

CDFSL-V: Cross-Domain Few-Shot Learning for Videos Sarinda Samarasinghe, Mamshad Nayeem Rizve, Navid Kardan, Mubarak Shah

PDF

CDUL: CLIP-Driven Unsupervised Learning for Multi-Label Image Classification Rabab Abdelfattah, Qing Guo, Xiaoguang Li, Xiaofeng Wang, Song Wang

PDF

Center-Based Decoupled Point-Cloud Registration for 6d Object Pose Estimation Haobo Jiang, Zheng Dang, Shuo Gu, Jin Xie, Mathieu Salzmann, Jian Yang

PDF

CFCG: Semi-Supervised Semantic Segmentation via Cross-Fusion and Contour Guidance Supervision Shuo Li, Yue He, Weiming Zhang, Wei Zhang, Xiao Tan, Junyu Han, Errui Ding, Jingdong Wang

PDF

CGBA: Curvature-Aware Geometric Black-Box Attack Md Farhamdur Reza, Ali Rahmati, Tianfu Wu, Huaiyu Dai

PDF

CHAMPAGNE: Learning Real-World Conversation from Large-Scale Web Videos Seungju Han, Jack Hessel, Nouha Dziri, Yejin Choi, Youngjae Yu

PDF

Chaotic World: A Large and Challenging Benchmark for Human Behavior Understanding in Chaotic Events Kian Eng Ong, Xun Long Ng, Yanchao Li, Wenjie Ai, Kuangyi Zhao, Si Yong Yeo, Jun Liu

PDF

ChartReader: A Unified Framework for Chart Derendering and Comprehension Without Heuristic Rules Zhi-Qi Cheng, Qi Dai, Alexander G. Hauptmann

PDF

Chasing Clouds: Differentiable Volumetric Rasterisation of Point Clouds as a Highly Efficient and Accurate Loss for Large-Scale Deformable 3D Registration Mattias P. Heinrich, Alexander Bigalke, Christoph Großbröhmer, Lasse Hansen

PDF

CheckerPose: Progressive Dense Keypoint Localization for Object Pose Estimation with Graph Neural Network Ruyi Lian, Haibin Ling

PDF

ChildPlay: A New Benchmark for Understanding Children's Gaze Behaviour Samy Tafasca, Anshul Gupta, Jean-Marc Odobez

PDF

Chinese Text Recognition with a Pre-Trained CLIP-like Model Through Image-IDS Aligning Haiyang Yu, Xiaocong Wang, Bin Li, Xiangyang Xue

PDF

Chop & Learn: Recognizing and Generating Object-State Compositions Nirat Saini, Hanyu Wang, Archana Swaminathan, Vinoj Jayasundara, Bo He, Kamal Gupta, Abhinav Shrivastava

PDF

CHORD: Category-Level Hand-Held Object Reconstruction via Shape Deformation Kailin Li, Lixin Yang, Haoyu Zhen, Zenan Lin, Xinyu Zhan, Licheng Zhong, Jian Xu, Kejian Wu, Cewu Lu

PDF

Chordal Averaging on Flag Manifolds and Its Applications Nathan Mankovich, Tolga Birdal

PDF

CHORUS : Learning Canonicalized 3D Human-Object Spatial Relations from Unbounded Synthesized Images Sookwan Han, Hanbyul Joo

PDF

Chupa: Carving 3D Clothed Humans from Skinned Shape Priors Using 2D Diffusion Probabilistic Models Byungjun Kim, Patrick Kwon, Kwangho Lee, Myunggi Lee, Sookwan Han, Daesik Kim, Hanbyul Joo

PDF

CIRI: Curricular Inactivation for Residue-Aware One-Shot Video Inpainting Weiying Zheng, Cheng Xu, Xuemiao Xu, Wenxi Liu, Shengfeng He

PDF

CiT: Curation in Training for Effective Vision-Language Data Hu Xu, Saining Xie, Po-Yao Huang, Licheng Yu, Russell Howes, Gargi Ghosh, Luke Zettlemoyer, Christoph Feichtenhofer

PDF

CiteTracker: Correlating Image and Text for Visual Tracking Xin Li, Yuqing Huang, Zhenyu He, Yaowei Wang, Huchuan Lu, Ming-Hsuan Yang

PDF

CL-MVSNet: Unsupervised Multi-View Stereo with Dual-Level Contrastive Learning Kaiqiang Xiong, Rui Peng, Zhe Zhang, Tianxing Feng, Jianbo Jiao, Feng Gao, Ronggang Wang

PDF

Class Prior-Free Positive-Unlabeled Learning with Taylor Variational Loss for Hyperspectral Remote Sensing Imagery Hengwei Zhao, Xinyu Wang, Jingtao Li, Yanfei Zhong

PDF

Class-Aware Patch Embedding Adaptation for Few-Shot Image Classification Fusheng Hao, Fengxiang He, Liu Liu, Fuxiang Wu, Dacheng Tao, Jun Cheng

PDF

Class-Incremental Continual Learning for Instance Segmentation with Image-Level Weak Supervision Yu-Hsing Hsieh, Guan-Sheng Chen, Shun-Xian Cai, Ting-Yun Wei, Huei-Fang Yang, Chu-Song Chen

PDF

Class-Incremental Grouping Network for Continual Audio-Visual Learning Shentong Mo, Weiguo Pian, Yapeng Tian

PDF

Class-Relation Knowledge Distillation for Novel Class Discovery Peiyan Gu, Chuyu Zhang, Ruijie Xu, Xuming He

PDF

CleanCLIP: Mitigating Data Poisoning Attacks in Multimodal Contrastive Learning Hritik Bansal, Nishad Singhi, Yu Yang, Fan Yin, Aditya Grover, Kai-Wei Chang

PDF

ClimateNeRF: Extreme Weather Synthesis in Neural Radiance Field Yuan Li, Zhi-Hao Lin, David Forsyth, Jia-Bin Huang, Shenlong Wang

PDF

CLIP-Cluster: CLIP-Guided Attribute Hallucination for Face Clustering Shuai Shen, Wanhua Li, Xiaobing Wang, Dafeng Zhang, Zhezhu Jin, Jie Zhou, Jiwen Lu

PDF

CLIP-Driven Universal Model for Organ Segmentation and Tumor Detection Jie Liu, Yixiao Zhang, Jie-Neng Chen, Junfei Xiao, Yongyi Lu, Bennett A Landman, Yixuan Yuan, Alan Yuille, Yucheng Tang, Zongwei Zhou

PDF

CLIP2Point: Transfer CLIP to Point Cloud Classification with Image-Depth Pre-Training Tianyu Huang, Bowen Dong, Yunhan Yang, Xiaoshui Huang, Rynson W.H. Lau, Wanli Ouyang, Wangmeng Zuo

PDF

CLIPascene: Scene Sketching with Different Types and Levels of Abstraction Yael Vinker, Yuval Alaluf, Daniel Cohen-Or, Ariel Shamir

PDF

CLIPN for Zero-Shot OOD Detection: Teaching CLIP to Say No Hualiang Wang, Yi Li, Huifeng Yao, Xiaomeng Li

PDF

CLIPTER: Looking at the Bigger Picture in Scene Text Recognition Aviad Aberdam, David Bensaid, Alona Golts, Roy Ganz, Oren Nuriel, Royee Tichauer, Shai Mazor, Ron Litman

PDF

CLIPTrans: Transferring Visual Knowledge with Pre-Trained Models for Multimodal Machine Translation Devaansh Gupta, Siddhant Kharbanda, Jiawei Zhou, Wanhua Li, Hanspeter Pfister, Donglai Wei

PDF

CLNeRF: Continual Learning Meets NeRF Zhipeng Cai, Matthias Müller

PDF

Cloth2Body: Generating 3D Human Body Mesh from 2D Clothing Lu Dai, Liqian Ma, Shenhan Qian, Hao Liu, Ziwei Liu, Hui Xiong

PDF

ClothesNet: An Information-Rich 3D Garment Model Repository with Simulated Clothes Environment Bingyang Zhou, Haoyu Zhou, Tianhai Liang, Qiaojun Yu, Siheng Zhao, Yuwei Zeng, Jun Lv, Siyuan Luo, Qiancai Wang, Xinyuan Yu, Haonan Chen, Cewu Lu, Lin Shao

PDF

ClothPose: A Real-World Benchmark for Visual Analysis of Garment Pose via an Indirect Recording Solution Wenqiang Xu, Wenxin Du, Han Xue, Yutong Li, Ruolin Ye, Yan-Feng Wang, Cewu Lu

PDF

CLR: Channel-Wise Lightweight Reprogramming for Continual Learning Yunhao Ge, Yuecheng Li, Shuo Ni, Jiaping Zhao, Ming-Hsuan Yang, Laurent Itti

PDF

ClusT3: Information Invariant Test-Time Training Gustavo A. Vargas Hakim, David Osowiechi, Mehrdad Noori, Milad Cheraghalikhani, Ali Bahri, Ismail Ben Ayed, Christian Desrosiers

PDF

Clusterformer: Cluster-Based Transformer for 3D Object Detection in Point Clouds Yu Pei, Xian Zhao, Hao Li, Jingyuan Ma, Jingwei Zhang, Shiliang Pu

PDF

Clustering Based Point Cloud Representation Learning for 3D Analysis Tuo Feng, Wenguan Wang, Xiaohan Wang, Yi Yang, Qinghua Zheng

PDF

Clutter Detection and Removal in 3D Scenes with View-Consistent Inpainting Fangyin Wei, Thomas Funkhouser, Szymon Rusinkiewicz

PDF

CMDA: Cross-Modality Domain Adaptation for Nighttime Semantic Segmentation Ruihao Xia, Chaoqiang Zhao, Meng Zheng, Ziyan Wu, Qiyu Sun, Yang Tang

PDF

Co-Evolution of Pose and Mesh for 3D Human Body Estimation from Video Yingxuan You, Hong Liu, Ti Wang, Wenhao Li, Runwei Ding, Xia Li

PDF

CO-Net: Learning Multiple Point Cloud Tasks at Once with a Cohesive Network Tao Xie, Ke Wang, Siyi Lu, Yukun Zhang, Kun Dai, Xiaoyu Li, Jie Xu, Li Wang, Lijun Zhao, Xinyu Zhang, Ruifeng Li

PDF

CO-PILOT: Dynamic Top-Down Point Cloud with Conditional Neighborhood Aggregation for Multi-Gigapixel Histopathology Image Representation Ramin Nakhli, Allen Zhang, Ali Mirabadi, Katherine Rich, Maryam Asadi, Blake Gilks, Hossein Farahani, Ali Bashashati

PDF

Coarse-to-Fine Amodal Segmentation with Shape Prior Jianxiong Gao, Xuelin Qian, Yikai Wang, Tianjun Xiao, Tong He, Zheng Zhang, Yanwei Fu

PDF

Coarse-to-Fine: Learning Compact Discriminative Representation for Single-Stage Image Retrieval Yunquan Zhu, Xinkai Gao, Bo Ke, Ruizhi Qiao, Xing Sun

PDF

COCO-O: A Benchmark for Object Detectors Under Natural Distribution Shifts Xiaofeng Mao, Yuefeng Chen, Yao Zhu, Da Chen, Hang Su, Rong Zhang, Hui Xue

PDF

Coherent Event Guided Low-Light Video Enhancement Jinxiu Liang, Yixin Yang, Boyu Li, Peiqi Duan, Yong Xu, Boxin Shi

PDF

CoIn: Contrastive Instance Feature Mining for Outdoor 3D Object Detection with Very Limited Annotations Qiming Xia, Jinhao Deng, Chenglu Wen, Hai Wu, Shaoshuai Shi, Xin Li, Cheng Wang

PDF

CoinSeg: Contrast Inter- and Intra- Class Representations for Incremental Segmentation Zekang Zhang, Guangyu Gao, Jianbo Jiao, Chi Harold Liu, Yunchao Wei

PDF

Collaborative Propagation on Multiple Instance Graphs for 3D Instance Segmentation with Single-Point Supervision Shichao Dong, Ruibo Li, Jiacheng Wei, Fayao Liu, Guosheng Lin

PDF

Collaborative Tracking Learning for Frame-Rate-Insensitive Multi-Object Tracking Yiheng Liu, Junta Wu, Yi Fu

PDF

Collecting the Puzzle Pieces: Disentangled Self-Driven Human Pose Transfer by Permuting Textures Nannan Li, Kevin J Shih, Bryan A. Plummer

PDF

Combating Noisy Labels with Sample Selection by Mining High-Discrepancy Examples Xiaobo Xia, Bo Han, Yibing Zhan, Jun Yu, Mingming Gong, Chen Gong, Tongliang Liu

PDF

Communication-Efficient Federated Learning with Single-Step Synthetic Features Compressor for Faster Convergence Yuhao Zhou, Mingjia Shi, Yuanxi Li, Yanan Sun, Qing Ye, Jiancheng Lv

PDF

Communication-Efficient Vertical Federated Learning with Limited Overlapping Samples Jingwei Sun, Ziyue Xu, Dong Yang, Vishwesh Nath, Wenqi Li, Can Zhao, Daguang Xu, Yiran Chen, Holger R. Roth

PDF

COMPASS: High-Efficiency Deep Image Compression with Arbitrary-Scale Spatial Scalability Jongmin Park, Jooyoung Lee, Munchurl Kim

PDF

Compatibility of Fundamental Matrices for Complete Viewing Graphs Martin Bråtelund, Felix Rydell

PDF

Complementary Domain Adaptation and Generalization for Unsupervised Continual Domain Shift Learning Wonguk Cho, Jinha Park, Taesup Kim

PDF

Compositional Feature Augmentation for Unbiased Scene Graph Generation Lin Li, Guikun Chen, Jun Xiao, Yi Yang, Chunping Wang, Long Chen

PDF

Computation and Data Efficient Backdoor Attacks Yutong Wu, Xingshuo Han, Han Qiu, Tianwei Zhang

PDF

Computational 3D Imaging with Position Sensors Jeremy Klotz, Mohit Gupta, Aswin C. Sankaranarayanan

PDF

Computationally-Efficient Neural Image Compression with Shallow Decoders Yibo Yang, Stephan Mandt

PDF

Concept-Wise Fine-Tuning Matters in Preventing Negative Transfer Yunqiao Yang, Long-Kai Huang, Ying Wei

PDF

Conceptual and Hierarchical Latent Space Decomposition for Face Editing Savas Ozkan, Mete Ozay, Tom Robinson

PDF

Conditional 360-Degree Image Synthesis for Immersive Indoor Scene Decoration Ka Chun Shum, Hong-Wing Pang, Binh-Son Hua, Duc Thanh Nguyen, Sai-Kit Yeung

PDF

Conditional Cross Attention Network for Multi-Space Embedding Without Entanglement in Only a SINGLE Network Chull Hwan Song, Taebaek Hwang, Jooyoung Yoon, Shunghyun Choi, Yeong Hyeon Gu

PDF

Confidence-Aware Pseudo-Label Learning for Weakly Supervised Visual Grounding Yang Liu, Jiahua Zhang, Qingchao Chen, Yuxin Peng

PDF

Confidence-Based Visual Dispersal for Few-Shot Unsupervised Domain Adaptation Yizhe Xiong, Hui Chen, Zijia Lin, Sicheng Zhao, Guiguang Ding

PDF

Consistent Depth Prediction for Transparent Object Reconstruction from RGB-D Camera Yuxiang Cai, Yifan Zhu, Haiwei Zhang, Bo Ren

PDF

ConSlide: Asynchronous Hierarchical Interaction Transformer with Breakup-Reorganize Rehearsal for Continual Whole Slide Image Analysis Yanyan Huang, Weiqin Zhao, Shujun Wang, Yu Fu, Yuming Jiang, Lequan Yu

PDF

Constraining Depth mAP Geometry for Multi-View Stereo: A Dual-Depth Approach with Saddle-Shaped Depth Cells Xinyi Ye, Weiyue Zhao, Tianqi Liu, Zihao Huang, Zhiguo Cao, Xin Li

PDF

ContactGen: Generative Contact Modeling for Grasp Generation Shaowei Liu, Yang Zhou, Jimei Yang, Saurabh Gupta, Shenlong Wang

PDF

Contactless Pulse Estimation Leveraging Pseudo Labels and Self-Supervision Zhihua Li, Lijun Yin

PDF

Content-Aware Local GAN for Photo-Realistic Super-Resolution JoonKyu Park, Sanghyun Son, Kyoung Mu Lee

PDF

Context-Aware Planning and Environment-Aware Memory for Instruction Following Embodied Agents Byeonghwi Kim, Jinyeon Kim, Yuyeong Kim, Cheolhong Min, Jonghyun Choi

PDF

Continual Learning for Personalized Co-Speech Gesture Generation Chaitanya Ahuja, Pratik Joshi, Ryo Ishii, Louis-Philippe Morency

PDF

Continual Segment: Towards a Single, Unified and Non-Forgetting Continual Segmentation Model of 143 Whole-Body Organs in CT Scans Zhanghexuan Ji, Dazhou Guo, Puyang Wang, Ke Yan, Le Lu, Minfeng Xu, Qifeng Wang, Jia Ge, Mingchen Gao, Xianghua Ye, Dakai Jin

PDF

Continual Zero-Shot Learning Through Semantically Guided Generative Random Walks Wenxuan Zhang, Paul Janson, Kai Yi, Ivan Skorokhodov, Mohamed Elhoseiny

PDF

Continuously Masked Transformer for Image Inpainting Keunsoo Ko, Chang-Su Kim

PDF

Contrastive Continuity on Augmentation Stability Rehearsal for Continual Self-Supervised Learning Haoyang Cheng, Haitao Wen, Xiaoliang Zhang, Heqian Qiu, Lanxiao Wang, Hongliang Li

PDF

Contrastive Feature Masking Open-Vocabulary Vision Transformer Dahun Kim, Anelia Angelova, Weicheng Kuo

PDF

Contrastive Learning Relies More on Spatial Inductive Bias than Supervised Learning: An Empirical Study Yuanyi Zhong, Haoran Tang, Jun-Kun Chen, Yu-Xiong Wang

PDF

Contrastive Model Adaptation for Cross-Condition Robustness in Semantic Segmentation David Brüggemann, Christos Sakaridis, Tim Broedermann, Luc Van Gool

PDF

Contrastive Pseudo Learning for Open-World DeepFake Attribution Zhimin Sun, Shen Chen, Taiping Yao, Bangjie Yin, Ran Yi, Shouhong Ding, Lizhuang Ma

PDF

Controllable Guide-Space for Generalizable Face Forgery Detection Ying Guo, Cheng Zhen, Pengfei Yan

PDF

Controllable Person Image Synthesis with Pose-Constrained Latent Diffusion Xiao Han, Xiatian Zhu, Jiankang Deng, Yi-Zhe Song, Tao Xiang

PDF

Controllable Visual-Tactile Synthesis Ruihan Gao, Wenzhen Yuan, Jun-Yan Zhu

PDF

Convex Decomposition of Indoor Scenes Vaibhav Vavilala, David Forsyth

PDF

Convolutional Networks with Oriented 1d Kernels Alexandre Kirchmeyer, Jia Deng

PDF

COOL-CHIC: Coordinate-Based Low Complexity Hierarchical Image Codec Théo Ladune, Pierrick Philippe, Félix Henry, Gordon Clare, Thomas Leguay

PDF

COOP: Decoupling and Coupling of Whole-Body Grasping Pose Generation Yanzhao Zheng, Yunzhou Shi, Yuhao Cui, Zhongzhou Zhao, Zhiling Luo, Wei Zhou

PDF

Coordinate Quantized Neural Implicit Representations for Multi-View Reconstruction Sijia Jiang, Jing Hua, Zhizhong Han

PDF

Coordinate Transformer: Achieving Single-Stage Multi-Person Mesh Recovery from Videos Haoyuan Li, Haoye Dong, Hanchao Jia, Dong Huang, Michael C. Kampffmeyer, Liang Lin, Xiaodan Liang

PDF

COPILOT: Human-Environment Collision Prediction and Localization from Egocentric Videos Boxiao Pan, Bokui Shen, Davis Rempe, Despoina Paschalidou, Kaichun Mo, Yanchao Yang, Leonidas J. Guibas

PDF

CopyRNeRF: Protecting the CopyRight of Neural Radiance Fields Ziyuan Luo, Qing Guo, Ka Chun Cheung, Simon See, Renjie Wan

PDF

CORE: Co-Planarity Regularized Monocular Geometry Estimation with Weak Supervision Yuguang Li, Kai Wang, Hui Li, Seon-Min Rhee, Seungju Han, Jihye Kim, Min Yang, Ran Yang, Feng Zhu

PDF

CORE: Cooperative Reconstruction for Multi-Agent Perception Binglu Wang, Lei Zhang, Zhaozhong Wang, Yongqiang Zhao, Tianfei Zhou

PDF

Corrupting Neuron Explanations of Deep Visual Features Divyansh Srivastava, Tuomas Oikarinen, Tsui-Wei Weng

PDF

CoSign: Exploring Co-Occurrence Signals in Skeleton-Based Continuous Sign Language Recognition Peiqi Jiao, Yuecong Min, Yanan Li, Xiaotao Wang, Lei Lei, Xilin Chen

PDF

CoTDet: Affordance Knowledge Prompting for Task Driven Object Detection Jiajin Tang, Ge Zheng, Jingyi Yu, Sibei Yang

PDF

Counterfactual-Based Saliency mAP: Towards Visual Contrastive Explanations for Neural Networks Xue Wang, Zhibo Wang, Haiqin Weng, Hengchang Guo, Zhifei Zhang, Lu Jin, Tao Wei, Kui Ren

PDF

Counting Crowds in Bad Weather Zhi-Kai Huang, Wei-Ting Chen, Yuan-Chun Chiang, Sy-Yen Kuo, Ming-Hsuan Yang

PDF

CPCM: Contextual Point Cloud Modeling for Weakly-Supervised Point Cloud Semantic Segmentation Lizhao Liu, Zhuangwei Zhuang, Shangxin Huang, Xunlong Xiao, Tianhang Xiang, Cen Chen, Jingdong Wang, Mingkui Tan

PDF

Creative Birds: Self-Supervised Single-View 3D Style Transfer Renke Wang, Guimin Que, Shuo Chen, Xiang Li, Jun Li, Jian Yang

PDF

CRN: Camera Radar Net for Accurate, Robust, Efficient 3D Perception Youngseok Kim, Juyeb Shin, Sanmin Kim, In-Jae Lee, Jun Won Choi, Dongsuk Kum

PDF

CroCo V2: Improved Cross-View Completion Pre-Training for Stereo Matching and Optical Flow Philippe Weinzaepfel, Thomas Lucas, Vincent Leroy, Yohann Cabon, Vaibhav Arora, Romain Brégier, Gabriela Csurka, Leonid Antsfeld, Boris Chidlovskii, Jerome Revaud

PDF

Cross Contrasting Feature Perturbation for Domain Generalization Chenming Li, Daoan Zhang, Wenjian Huang, Jianguo Zhang

PDF

Cross Modal Transformer: Towards Fast and Robust 3D Object Detection Junjie Yan, Yingfei Liu, Jianjian Sun, Fan Jia, Shuailin Li, Tiancai Wang, Xiangyu Zhang

PDF

Cross-Domain Product Representation Learning for Rich-Content E-Commerce Xuehan Bai, Yan Li, Yanhua Cheng, Wenjie Yang, Quan Chen, Han Li

PDF

Cross-Modal Latent Space Alignment for Image to Avatar Translation Manuel Ladron de Guevara, Jose Echevarria, Yijun Li, Yannick Hold-Geoffroy, Cameron Smith, Daichi Ito

PDF

Cross-Modal Learning with 3D Deformable Attention for Action Recognition Sangwon Kim, Dasom Ahn, Byoung Chul Ko

PDF

Cross-Modal Orthogonal High-Rank Augmentation for RGB-Event Transformer-Trackers Zhiyu Zhu, Junhui Hou, Dapeng Oliver Wu

PDF

Cross-Modal Scalable Hyperbolic Hierarchical Clustering Teng Long, Nanne van Noord

PDF

Cross-Modal Translation and Alignment for Survival Analysis Fengtao Zhou, Hao Chen

PDF

Cross-Ray Neural Radiance Fields for Novel-View Synthesis from Unconstrained Image Collections Yifan Yang, Shuhai Zhang, Zixiong Huang, Yubing Zhang, Mingkui Tan

PDF

Cross-View Semantic Alignment for Livestreaming Product Recognition Wenjie Yang, Yiyi Chen, Yan Li, Yanhua Cheng, Xudong Liu, Quan Chen, Han Li

PDF

Cross-View Topology Based Consistent and Complementary Information for Deep Multi-View Clustering Zhibin Dong, Siwei Wang, Jiaqi Jin, Xinwang Liu, En Zhu

PDF

CROSSFIRE: Camera Relocalization on Self-Supervised Features from an Implicit Representation Arthur Moreau, Nathan Piasco, Moussab Bennehar, Dzmitry Tsishkou, Bogdan Stanciulescu, Arnaud de La Fortelle

PDF

CrossLoc3D: Aerial-Ground Cross-Source 3D Place Recognition Tianrui Guan, Aswath Muthuselvam, Montana Hoover, Xijun Wang, Jing Liang, Adarsh Jagan Sathyamoorthy, Damon Conover, Dinesh Manocha

PDF

CrossMatch: Source-Free Domain Adaptive Semantic Segmentation via Cross-Modal Consistency Training Yifang Yin, Wenmiao Hu, Zhenguang Liu, Guanfeng Wang, Shili Xiang, Roger Zimmermann

PDF

CSDA: Learning Category-Scale Joint Feature for Domain Adaptive Object Detection Changlong Gao, Chengxu Liu, Yujie Dun, Xueming Qian

PDF

CTP:Towards Vision-Language Continual Pretraining via Compatible Momentum Contrast and Topology Preservation Hongguang Zhu, Yunchao Wei, Xiaodan Liang, Chunjie Zhang, Yao Zhao

PDF

CTVIS: Consistent Training for Online Video Instance Segmentation Kaining Ying, Qing Zhong, Weian Mao, Zhenhua Wang, Hao Chen, Lin Yuanbo Wu, Yifan Liu, Chengxiang Fan, Yunzhi Zhuge, Chunhua Shen

PDF

Cumulative Spatial Knowledge Distillation for Vision Transformers Borui Zhao, Renjie Song, Jiajun Liang

PDF

CuNeRF: Cube-Based Neural Radiance Field for Zero-Shot Medical Image Arbitrary-Scale Super Resolution Zixuan Chen, Lingxiao Yang, Jian-Huang Lai, Xiaohua Xie

PDF

Curvature-Aware Training for Coordinate Networks Hemanth Saratchandran, Shin-Fang Chng, Sameera Ramasinghe, Lachlan MacDonald, Simon Lucey

PDF

CVRecon: Rethinking 3D Geometric Feature Learning for Neural Reconstruction Ziyue Feng, Liang Yang, Pengsheng Guo, Bing Li

PDF

CVSformer: Cross-View Synthesis Transformer for Semantic Scene Completion Haotian Dong, Enhui Ma, Lubo Wang, Miaohui Wang, Wuyuan Xie, Qing Guo, Ping Li, Lingyu Liang, Kairui Yang, Di Lin

PDF

Cyclic Test-Time Adaptation on Monocular Video for 3D Human Mesh Reconstruction Hyeongjin Nam, Daniel Sungho Jung, Yeonguk Oh, Kyoung Mu Lee

PDF

Cyclic-Bootstrap Labeling for Weakly Supervised Object Detection Yufei Yin, Jiajun Deng, Wengang Zhou, Li Li, Houqiang Li

PDF

D-IF: Uncertainty-Aware Human Digitization via Implicit Distribution Field Xueting Yang, Yihao Luo, Yuliang Xiu, Wei Wang, Hao Xu, Zhaoxin Fan

PDF

D3G: Exploring Gaussian Prior for Temporal Sentence Grounding with Glance Annotation Hanjun Li, Xiujun Shu, Sunan He, Ruizhi Qiao, Wei Wen, Taian Guo, Bei Gan, Xing Sun

PDF

DALL-Eval: Probing the Reasoning Skills and Social Biases of Text-to-Image Generation Models Jaemin Cho, Abhay Zala, Mohit Bansal

PDF

Dancing in the Dark: A Benchmark Towards General Low-Light Video Enhancement Huiyuan Fu, Wenkai Zheng, Xicong Wang, Jiaxuan Wang, Heng Zhang, Huadong Ma

PDF

DandelionNet: Domain Composition with Instance Adaptive Classification for Domain Generalization Lanqing Hu, Meina Kan, Shiguang Shan, Xilin Chen

PDF

Dark Side Augmentation: Generating Diverse Night Examples for Metric Learning Albert Mohwald, Tomas Jenicek, Ondřej Chum

PDF

DarSwin: Distortion Aware Radial Swin Transformer Akshaya Athwale, Arman Afrasiyabi, Justin Lagüe, Ichrak Shili, Ola Ahmad, Jean-François Lalonde

PDF

DARTH: Holistic Test-Time Adaptation for Multiple Object Tracking Mattia Segu, Bernt Schiele, Fisher Yu

PDF

Data Augmented Flatness-Aware Gradient Projection for Continual Learning Enneng Yang, Li Shen, Zhenyi Wang, Shiwei Liu, Guibing Guo, Xingwei Wang

PDF

Data-Free Class-Incremental Hand Gesture Recognition Shubhra Aich, Jesus Ruiz-Santaquiteria, Zhenyu Lu, Prachi Garg, K J Joseph, Alvaro Fernandez Garcia, Vineeth N Balasubramanian, Kenrick Kin, Chengde Wan, Necati Cihan Camgoz, Shugao Ma, Fernando De la Torre

PDF

Data-Free Knowledge Distillation for Fine-Grained Visual Categorization Renrong Shao, Wei Zhang, Jianhua Yin, Jun Wang

PDF

DataDAM: Efficient Dataset Distillation with Attention Matching Ahmad Sajedi, Samir Khaki, Ehsan Amjadian, Lucy Z. Liu, Yuri A. Lawryshyn, Konstantinos N. Plataniotis

PDF

Dataset Quantization Daquan Zhou, Kai Wang, Jianyang Gu, Xiangyu Peng, Dongze Lian, Yifan Zhang, Yang You, Jiashi Feng

PDF

DCPB: Deformable Convolution Based on the Poincare Ball for Top-View Fisheye Cameras Xuan Wei, Zhidan Ran, Xiaobo Lu

PDF

DDColor: Towards Photo-Realistic Image Colorization via Dual Decoders Xiaoyang Kang, Tao Yang, Wenqi Ouyang, Peiran Ren, Lingzhi Li, Xuansong Xie

PDF

DDFM: Denoising Diffusion Model for Multi-Modality Image Fusion Zixiang Zhao, Haowen Bai, Yuanzhi Zhu, Jiangshe Zhang, Shuang Xu, Yulun Zhang, Kai Zhang, Deyu Meng, Radu Timofte, Luc Van Gool

PDF

DDG-Net: Discriminability-Driven Graph Network for Weakly-Supervised Temporal Action Localization Xiaojun Tang, Junsong Fan, Chuanchen Luo, Zhaoxiang Zhang, Man Zhang, Zongyuan Yang

PDF

DDIT: Semantic Scene Completion via Deformable Deep Implicit Templates Haoang Li, Jinhu Dong, Binghui Wen, Ming Gao, Tianyu Huang, Yun-Hui Liu, Daniel Cremers

PDF

DDP: Diffusion Model for Dense Visual Prediction Yuanfeng Ji, Zhe Chen, Enze Xie, Lanqing Hong, Xihui Liu, Zhaoqiang Liu, Tong Lu, Zhenguo Li, Ping Luo

PDF

DDS2M: Self-Supervised Denoising Diffusion Spatio-Spectral Model for Hyperspectral Image Restoration Yuchun Miao, Lefei Zhang, Liangpei Zhang, Dacheng Tao

PDF

Dec-Adapter: Exploring Efficient Decoder-Side Adapter for Bridging Screen Content and Natural Image Compression Sheng Shen, Huanjing Yue, Jingyu Yang

PDF

DECO: Dense Estimation of 3D Human-Scene Contact in the Wild Shashank Tripathi, Agniv Chatterjee, Jean-Claude Passy, Hongwei Yi, Dimitrios Tzionas, Michael J. Black

PDF

Decomposition-Based Variational Network for Multi-Contrast MRI Super-Resolution and Reconstruction Pengcheng Lei, Faming Fang, Guixu Zhang, Tieyong Zeng

PDF

Decouple Before Interact: Multi-Modal Prompt Learning for Continual Visual Question Answering Zi Qian, Xin Wang, Xuguang Duan, Pengda Qin, Yuhong Li, Wenwu Zhu

PDF

Decoupled DETR: Spatially Disentangling Localization and Classification for Improved End-to-End Object Detection Manyuan Zhang, Guanglu Song, Yu Liu, Hongsheng Li

PDF

Decoupled Iterative Refinement Framework for Interacting Hands Reconstruction from a Single RGB Image Pengfei Ren, Chao Wen, Xiaozheng Zheng, Zhou Xue, Haifeng Sun, Qi Qi, Jingyu Wang, Jianxin Liao

PDF

DEDRIFT: Robust Similarity Search Under Content Drift Dmitry Baranchuk, Matthijs Douze, Yash Upadhyay, I. Zeki Yalniz

PDF

Deep Active Contours for Real-Time 6-DoF Object Tracking Long Wang, Shen Yan, Jianan Zhen, Yu Liu, Maojun Zhang, Guofeng Zhang, Xiaowei Zhou

PDF

Deep Directly-Trained Spiking Neural Networks for Object Detection Qiaoyi Su, Yuhong Chou, Yifan Hu, Jianing Li, Shijie Mei, Ziyang Zhang, Guoqi Li

PDF

Deep Equilibrium Object Detection Shuai Wang, Yao Teng, Limin Wang

PDF

Deep Feature Deblurring Diffusion for Detecting Out-of-Distribution Objects Aming Wu, Da Chen, Cheng Deng

PDF

Deep Fusion Transformer Network with Weighted Vector-Wise Keypoints Voting for Robust 6d Object Pose Estimation Jun Zhou, Kai Chen, Linlin Xu, Qi Dou, Jing Qin

PDF

Deep Geometrized Cartoon Line Inbetweening Li Siyao, Tianpei Gu, Weiye Xiao, Henghui Ding, Ziwei Liu, Chen Change Loy

PDF

Deep Geometry-Aware Camera Self-Calibration from Video Annika Hagemann, Moritz Knorr, Christoph Stiller

PDF

Deep Homography Mixture for Single Image Rolling Shutter Correction Weilong Yan, Robby T. Tan, Bing Zeng, Shuaicheng Liu

PDF

Deep Image Harmonization with Globally Guided Feature Transformation and Relation Distillation Li Niu, Linfeng Tan, Xinhao Tao, Junyan Cao, Fengjun Guo, Teng Long, Liqing Zhang

PDF

Deep Image Harmonization with Learnable Augmentation Li Niu, Junyan Cao, Wenyan Cong, Liqing Zhang

PDF

Deep Incubation: Training Large Models by Divide-and-Conquering Zanlin Ni, Yulin Wang, Jiangwei Yu, Haojun Jiang, Yue Cao, Gao Huang

PDF

Deep Multitask Learning with Progressive Parameter Sharing Haosen Shi, Shen Ren, Tianwei Zhang, Sinno Jialin Pan

PDF

Deep Multiview Clustering by Contrasting Cluster Assignments Jie Chen, Hua Mao, Wai Lok Woo, Xi Peng

PDF

Deep Optics for Video Snapshot Compressive Imaging Ping Wang, Lishun Wang, Xin Yuan

PDF

Deep Video Demoireing via Compact Invertible Dyadic Decomposition Yuhui Quan, Haoran Huang, Shengfeng He, Ruotao Xu

PDF

DeepChange: A Long-Term Person Re-Identification Benchmark with Clothes Change Peng Xu, Xiatian Zhu

PDF

DeePoint: Visual Pointing Recognition and Direction Estimation Shu Nakamura, Yasutomo Kawanishi, Shohei Nobuhara, Ko Nishino

PDF

Deformable Model-Driven Neural Rendering for High-Fidelity 3D Reconstruction of Human Heads Under Low-View Settings Baixin Xu, Jiarui Zhang, Kwan-Yee Lin, Chen Qian, Ying He

PDF

Deformable Neural Radiance Fields Using RGB and Event Cameras Qi Ma, Danda Pani Paudel, Ajad Chhatkuli, Luc Van Gool

PDF

Deformer: Dynamic Fusion Transformer for Robust Hand Pose Estimation Qichen Fu, Xingyu Liu, Ran Xu, Juan Carlos Niebles, Kris M. Kitani

PDF

DeFormer: Integrating Transformers with Deformable Models for 3D Shape Abstraction from a Single Image Di Liu, Xiang Yu, Meng Ye, Qilong Zhangli, Zhuowei Li, Zhixing Zhang, Dimitris N. Metaxas

PDF

DeformToon3D: Deformable Neural Radiance Fields for 3D Toonification Junzhe Zhang, Yushi Lan, Shuai Yang, Fangzhou Hong, Quan Wang, Chai Kiat Yeo, Ziwei Liu, Chen Change Loy

PDF

Degradation-Resistant Unfolding Network for Heterogeneous Image Fusion Chunming He, Kai Li, Guoxia Xu, Yulun Zhang, Runze Hu, Zhenhua Guo, Xiu Li

PDF

DELFlow: Dense Efficient Learning of Scene Flow for Large-Scale Point Clouds Chensheng Peng, Guangming Wang, Xian Wan Lo, Xinrui Wu, Chenfeng Xu, Masayoshi Tomizuka, Wei Zhan, Hesheng Wang

PDF

Delicate Textured Mesh Recovery from NeRF via Adaptive Surface Refinement Jiaxiang Tang, Hang Zhou, Xiaokang Chen, Tianshu Hu, Errui Ding, Jingdong Wang, Gang Zeng

PDF

DeLiRa: Self-Supervised Depth, Light, and Radiance Fields Vitor Guizilini, Igor Vasiljevic, Jiading Fang, Rares Ambrus, Sergey Zakharov, Vincent Sitzmann, Adrien Gaidon

PDF

Delta Denoising Score Amir Hertz, Kfir Aberman, Daniel Cohen-Or

PDF

Delving into Motion-Aware Matching for Monocular 3D Object Tracking Kuan-Chih Huang, Ming-Hsuan Yang, Yi-Hsuan Tsai

PDF

Democratising 2D Sketch to 3D Shape Retrieval Through Pivoting Pinaki Nath Chowdhury, Ayan Kumar Bhunia, Aneeshan Sain, Subhadeep Koley, Tao Xiang, Yi-Zhe Song

PDF

Denoising Diffusion Autoencoders Are Unified Self-Supervised Learners Weilai Xiang, Hongyu Yang, Di Huang, Yunhong Wang

PDF

Dense 2D-3D Indoor Prediction with Sound via Aligned Cross-Modal Distillation Heeseung Yun, Joonil Na, Gunhee Kim

PDF

Dense Text-to-Image Generation with Attention Modulation Yunji Kim, Jiyoung Lee, Jin-Hwa Kim, Jung-Woo Ha, Jun-Yan Zhu

PDF

DenseShift: Towards Accurate and Efficient Low-Bit Power-of-Two Quantization Xinlin Li, Bang Liu, Rui Heng Yang, Vanessa Courville, Chao Xing, Vahid Partovi Nia

PDF

Density-Invariant Features for Distant Point Cloud Registration Quan Liu, Hongzi Zhu, Yunsong Zhou, Hongyang Li, Shan Chang, Minyi Guo

PDF

Designing Phase Masks for Under-Display Cameras Anqi Yang, Eunhee Kang, Hyong-Euk Lee, Aswin C. Sankaranarayanan

PDF

DETA: Denoised Task Adaptation for Few-Shot Learning Ji Zhang, Lianli Gao, Xu Luo, Hengtao Shen, Jingkuan Song

PDF

Detecting Objects with Context-Likelihood Graphs and Graph Refinement Aritra Bhowmik, Yu Wang, Nora Baka, Martin R. Oswald, Cees G. M. Snoek

PDF

Detection Transformer with Stable Matching Shilong Liu, Tianhe Ren, Jiayu Chen, Zhaoyang Zeng, Hao Zhang, Feng Li, Hongyang Li, Jun Huang, Hang Su, Jun Zhu, Lei Zhang

PDF

DetermiNet: A Large-Scale Diagnostic Dataset for Complex Visually-Grounded Referencing Using Determiners Clarence Lee, M Ganesh Kumar, Cheston Tan

PDF

DETR Does Not Need Multi-Scale or Locality Design Yutong Lin, Yuhui Yuan, Zheng Zhang, Chen Li, Nanning Zheng, Han Hu

PDF

DETRDistill: A Universal Knowledge Distillation Framework for DETR-Families Jiahao Chang, Shuo Wang, Hai-Ming Xu, Zehui Chen, Chenhongyi Yang, Feng Zhao

PDF

DETRs with Collaborative Hybrid Assignments Training Zhuofan Zong, Guanglu Song, Yu Liu

PDF

DetZero: Rethinking Offboard 3D Object Detection with Long-Term Sequential Point Clouds Tao Ma, Xuemeng Yang, Hongbin Zhou, Xin Li, Botian Shi, Junjie Liu, Yuchen Yang, Zhizheng Liu, Liang He, Yu Qiao, Yikang Li, Hongsheng Li

PDF

DFA3D: 3D Deformable Attention for 2D-to-3D Feature Lifting Hongyang Li, Hao Zhang, Zhaoyang Zeng, Shilong Liu, Feng Li, Tianhe Ren, Lei Zhang

PDF

DG-Recon: Depth-Guided Neural 3D Scene Reconstruction Jihong Ju, Ching Wei Tseng, Oleksandr Bailo, Georgi Dikov, Mohsen Ghafoorian

PDF

DG3D: Generating High Quality 3D Textured Shapes by Learning to Discriminate Multi-Modal Diffusion-Renderings Qi Zuo, Yafei Song, Jianfang Li, Lin Liu, Liefeng Bo

PDF

DiFaReli: Diffusion Face Relighting Puntawat Ponglertnapakorn, Nontawat Tritrong, Supasorn Suwajanakorn

PDF

Diff-Retinex: Rethinking Low-Light Image Enhancement with a Generative Diffusion Model Xunpeng Yi, Han Xu, Hao Zhang, Linfeng Tang, Jiayi Ma

PDF

DiffCloth: Diffusion Based Garment Synthesis and Manipulation via Structural Cross-Modal Semantic Alignment Xujie Zhang, Binbin Yang, Michael C. Kampffmeyer, Wenqing Zhang, Shiyue Zhang, Guansong Lu, Liang Lin, Hang Xu, Xiaodan Liang

PDF

DiffDis: Empowering Generative Diffusion Model with Cross-Modal Discrimination Capability Runhui Huang, Jianhua Han, Guansong Lu, Xiaodan Liang, Yihan Zeng, Wei Zhang, Hang Xu

PDF

DiffDreamer: Towards Consistent Unsupervised Single-View Scene Extrapolation with Conditional Diffusion Models Shengqu Cai, Eric Ryan Chan, Songyou Peng, Mohamad Shahbazi, Anton Obukhov, Luc Van Gool, Gordon Wetzstein

PDF

Differentiable Transportation Pruning Yunqiang Li, Jan C. van Gemert, Torsten Hoefler, Bert Moons, Evangelos Eleftheriou, Bram-Ernst Verhoef

PDF

DiffFacto: Controllable Part-Based 3D Point Cloud Generation with Cross Diffusion George Kiyohiro Nakayama, Mikaela Angelina Uy, Jiahui Huang, Shi-Min Hu, Ke Li, Leonidas Guibas

PDF

DiffFit: Unlocking Transferability of Large Diffusion Models via Simple Parameter-Efficient Fine-Tuning Enze Xie, Lewei Yao, Han Shi, Zhili Liu, Daquan Zhou, Zhaoqiang Liu, Jiawei Li, Zhenguo Li

PDF

DIFFGUARD: Semantic Mismatch-Guided Out-of-Distribution Detection Using Pre-Trained Diffusion Models Ruiyuan Gao, Chenchen Zhao, Lanqing Hong, Qiang Xu

PDF

DiffIR: Efficient Diffusion Model for Image Restoration Bin Xia, Yulun Zhang, Shiyin Wang, Yitong Wang, Xinglong Wu, Yapeng Tian, Wenming Yang, Luc Van Gool

PDF

DiffPose: Multi-Hypothesis Human Pose Estimation Using Diffusion Models Karl Holmquist, Bastian Wandt

PDF

DiffPose: SpatioTemporal Diffusion Model for Video-Based Human Pose Estimation Runyang Feng, Yixing Gao, Tze Ho Elden Tse, Xueqing Ma, Hyung Jin Chang

PDF

DiffRate : Differentiable Compression Rate for Efficient Vision Transformers Mengzhao Chen, Wenqi Shao, Peng Xu, Mingbao Lin, Kaipeng Zhang, Fei Chao, Rongrong Ji, Yu Qiao, Ping Luo

PDF

DiffTAD: Temporal Action Detection with Proposal Denoising Diffusion Sauradip Nag, Xiatian Zhu, Jiankang Deng, Yi-Zhe Song, Tao Xiang

PDF

DiffuMask: Synthesizing Images with Pixel-Level Annotations for Semantic Segmentation Using Diffusion Models Weijia Wu, Yuzhong Zhao, Mike Zheng Shou, Hong Zhou, Chunhua Shen

PDF

Diffuse3D: Wide-Angle 3D Photography via Bilateral Diffusion Yutao Jiang, Yang Zhou, Yuan Liang, Wenxi Liu, Jianbo Jiao, Yuhui Quan, Shengfeng He

PDF

Diffusion Action Segmentation Daochang Liu, Qiyue Li, Anh-Dung Dinh, Tingting Jiang, Mubarak Shah, Chang Xu

PDF

Diffusion in Style Martin Nicolas Everaert, Marco Bocchio, Sami Arpa, Sabine Süsstrunk, Radhakrishna Achanta

PDF

Diffusion Model as Representation Learner Xingyi Yang, Xinchao Wang

PDF

Diffusion Models as Masked Autoencoders Chen Wei, Karttikeya Mangalam, Po-Yao Huang, Yanghao Li, Haoqi Fan, Hu Xu, Huiyu Wang, Cihang Xie, Alan Yuille, Christoph Feichtenhofer

PDF

Diffusion-Based 3D Human Pose Estimation with Multi-Hypothesis Aggregation Wenkang Shan, Zhenhua Liu, Xinfeng Zhang, Zhao Wang, Kai Han, Shanshe Wang, Siwei Ma, Wen Gao

PDF

Diffusion-Based Image Translation with Label Guidance for Domain Adaptive Semantic Segmentation Duo Peng, Ping Hu, Qiuhong Ke, Jun Liu

PDF

Diffusion-Guided Reconstruction of Everyday Hand-Object Interaction Clips Yufei Ye, Poorvi Hebbar, Abhinav Gupta, Shubham Tulsiani

PDF

Diffusion-SDF: Conditional Generative Modeling of Signed Distance Functions Gene Chou, Yuval Bahat, Felix Heide

PDF

DiffusionDet: Diffusion Model for Object Detection Shoufa Chen, Peize Sun, Yibing Song, Ping Luo

PDF

DiffusionRet: Generative Text-Video Retrieval with Diffusion Model Peng Jin, Hao Li, Zesen Cheng, Kehan Li, Xiangyang Ji, Chang Liu, Li Yuan, Jie Chen

PDF

DiffV2S: Diffusion-Based Video-to-Speech Synthesis with Vision-Guided Speaker Embedding Jeongsoo Choi, Joanna Hong, Yong Man Ro

PDF

DiLiGenT-Pi: Photometric Stereo for Planar Surfaces with Rich Details - Benchmark Dataset and Beyond Feishi Wang, Jieji Ren, Heng Guo, Mingjun Ren, Boxin Shi

PDF

DIME-FM : DIstilling Multimodal and Efficient Foundation Models Ximeng Sun, Pengchuan Zhang, Peizhao Zhang, Hardik Shah, Kate Saenko, Xide Xia

PDF

DINAR: Diffusion Inpainting of Neural Textures for One-Shot Human Avatars David Svitov, Dmitrii Gudkov, Renat Bashirov, Victor Lempitsky

PDF

DIRE for Diffusion-Generated Image Detection Zhendong Wang, Jianmin Bao, Wengang Zhou, Weilun Wang, Hezhen Hu, Hong Chen, Houqiang Li

PDF

Discovering Spatio-Temporal Rationales for Video Question Answering Yicong Li, Junbin Xiao, Chun Feng, Xiang Wang, Tat-Seng Chua

PDF

Discrepant and Multi-Instance Proxies for Unsupervised Person Re-Identification Chang Zou, Zeqi Chen, Zhichao Cui, Yuehu Liu, Chi Zhang

PDF

Discriminative Class Tokens for Text-to-Image Diffusion Models Idan Schwartz, Vésteinn Snæbjarnarson, Hila Chefer, Serge Belongie, Lior Wolf, Sagie Benaim

PDF

Disentangle Then Parse: Night-Time Semantic Segmentation with Illumination Disentanglement Zhixiang Wei, Lin Chen, Tao Tu, Pengyang Ling, Huaian Chen, Yi Jin

PDF

Disentangling Spatial and Temporal Learning for Efficient Image-to-Video Transfer Learning Zhiwu Qing, Shiwei Zhang, Ziyuan Huang, Yingya Zhang, Changxin Gao, Deli Zhao, Nong Sang

PDF

DISeR: Designing Imaging Systems with Reinforcement Learning Tzofi Klinghoffer, Kushagra Tiwary, Nikhil Behari, Bhavya Agrawalla, Ramesh Raskar

PDF

Disposable Transfer Learning for Selective Source Task Unlearning Seunghee Koh, Hyounguk Shon, Janghyeon Lee, Hyeong Gwon Hong, Junmo Kim

PDF

DistillBEV: Boosting Multi-Camera 3D Object Detection with Cross-Modal Knowledge Distillation Zeyu Wang, Dingwen Li, Chenxu Luo, Cihang Xie, Xiaodong Yang

PDF

Distilled Reverse Attention Network for Open-World Compositional Zero-Shot Learning Yun Li, Zhe Liu, Saurav Jha, Lina Yao

PDF

Distilling Coarse-to-Fine Semantic Matching Knowledge for Weakly Supervised 3D Visual Grounding Zehan Wang, Haifeng Huang, Yang Zhao, Linjun Li, Xize Cheng, Yichen Zhu, Aoxiong Yin, Zhou Zhao

PDF

Distilling DETR with Visual-Linguistic Knowledge for Open-Vocabulary Object Detection Liangqi Li, Jiaxu Miao, Dahu Shi, Wenming Tan, Ye Ren, Yi Yang, Shiliang Pu

PDF

Distilling from Similar Tasks for Transfer Learning on a Budget Kenneth Borup, Cheng Perng Phoo, Bharath Hariharan

PDF

Distilling Large Vision-Language Model with Out-of-Distribution Generalizability Xuanlin Li, Yunhao Fang, Minghua Liu, Zhan Ling, Zhuowen Tu, Hao Su

PDF

Distracting Downpour: Adversarial Weather Attacks for Motion Estimation Jenny Schmalfuss, Lukas Mehl, Andrés Bruhn

PDF

Distributed Bundle Adjustment with Block-Based Sparse Matrix Compression for Super Large Scale Datasets Maoteng Zheng, Nengcheng Chen, Junfeng Zhu, Xiaoru Zeng, Huanbin Qiu, Yuyao Jiang, Xingyue Lu, Hao Qu

PDF

Distribution Shift Matters for Knowledge Distillation with Webly Collected Images Jialiang Tang, Shuo Chen, Gang Niu, Masashi Sugiyama, Chen Gong

PDF

Distribution-Aligned Diffusion for Human Mesh Recovery Lin Geng Foo, Jia Gong, Hossein Rahmani, Jun Liu

PDF

Distribution-Aware Prompt Tuning for Vision-Language Models Eulrang Cho, Jooyeon Kim, Hyunwoo J Kim

PDF

Distribution-Consistent Modal Recovering for Incomplete Multimodal Learning Yuanzhi Wang, Zhen Cui, Yong Li

PDF

Diverse Cotraining Makes Strong Semi-Supervised Segmentor Yijiang Li, Xinjiang Wang, Lihe Yang, Litong Feng, Wayne Zhang, Ying Gao

PDF

Diverse Data Augmentation with Diffusions for Effective Test-Time Prompt Tuning Chun-Mei Feng, Kai Yu, Yong Liu, Salman Khan, Wangmeng Zuo

PDF

Diverse Inpainting and Editing with GAN Inversion Ahmet Burak Yildirim, Hamza Pehlivan, Bahri Batuhan Bilecen, Aysegul Dundar

PDF

Divide and Conquer: 3D Point Cloud Instance Segmentation with Point-Wise Binarization Weiguang Zhao, Yuyao Yan, Chaolong Yang, Jianan Ye, Xi Yang, Kaizhu Huang

PDF

Divide and Conquer: A Two-Step Method for High Quality Face De-Identification with Model Explainability Yunqian Wen, Bo Liu, Jingyi Cao, Rong Xie, Li Song

PDF

Divide&Classify: Fine-Grained Classification for City-Wide Visual Geo-Localization Gabriele Trivigno, Gabriele Berton, Juan Aragon, Barbara Caputo, Carlo Masone

PDF

DLGSANet: Lightweight Dynamic Local and Global Self-Attention Networks for Image Super-Resolution Xiang Li, Jiangxin Dong, Jinhui Tang, Jinshan Pan

PDF

DLT: Conditioned Layout Generation with Joint Discrete-Continuous Diffusion Layout Transformer Elad Levi, Eli Brosh, Mykola Mykhailych, Meir Perez

PDF

DMNet: Delaunay Meshing Network for 3D Shape Representation Chen Zhang, Ganzhangqin Yuan, Wenbing Tao

PDF

DNA-Rendering: A Diverse Neural Actor Repository for High-Fidelity Human-Centric Rendering Wei Cheng, Ruixiang Chen, Siming Fan, Wanqi Yin, Keyu Chen, Zhongang Cai, Jingbo Wang, Yang Gao, Zhengming Yu, Zhengyu Lin, Daxuan Ren, Lei Yang, Ziwei Liu, Chen Change Loy, Chen Qian, Wayne Wu, Dahua Lin, Bo Dai, Kwan-Yee Lin

PDF

Do DALL-E and Flamingo Understand Each Other? Hang Li, Jindong Gu, Rajat Koner, Sahand Sharifzadeh, Volker Tresp

PDF

DocTr: Document Transformer for Structured Information Extraction in Documents Haofu Liao, Aruni RoyChowdhury, Weijian Li, Ankan Bansal, Yuting Zhang, Zhuowen Tu, Ravi Kumar Satzoda, R. Manmatha, Vijay Mahadevan

PDF

Document Understanding Dataset and Evaluation (DUDE) Jordy Van Landeghem, Rubèn Tito, Łukasz Borchmann, Michał Pietruszka, Pawel Joziak, Rafal Powalski, Dawid Jurkiewicz, Mickael Coustaty, Bertrand Anckaert, Ernest Valveny, Matthew Blaschko, Sien Moens, Tomasz Stanislawek

PDF

Does Physical Adversarial Example Really Matter to Autonomous Driving? Towards System-Level Effect of Adversarial Object Evasion Attack Ningfei Wang, Yunpeng Luo, Takami Sato, Kaidi Xu, Qi Alfred Chen

PDF

DOLCE: A Model-Based Probabilistic Diffusion Framework for Limited-Angle CT Reconstruction Jiaming Liu, Rushil Anirudh, Jayaraman J. Thiagarajan, Stewart He, K Aditya Mohan, Ulugbek S. Kamilov, Hyojin Kim

PDF

Domain Adaptive Few-Shot Open-Set Learning Debabrata Pal, Deeptej More, Sai Bhargav, Dipesh Tamboli, Vaneet Aggarwal, Biplab Banerjee

PDF

Domain Generalization Guided by Gradient Signal to Noise Ratio of Parameters Mateusz Michalkiewicz, Masoud Faraki, Xiang Yu, Manmohan Chandraker, Mahsa Baktashmotlagh

PDF

Domain Generalization of 3D Semantic Segmentation in Autonomous Driving Jules Sanchez, Jean-Emmanuel Deschaud, François Goulette

PDF

Domain Generalization via Balancing Training Difficulty and Model Capability Xueying Jiang, Jiaxing Huang, Sheng Jin, Shijian Lu

PDF

Domain Generalization via Rationale Invariance Liang Chen, Yong Zhang, Yibing Song, Anton van den Hengel, Lingqiao Liu

PDF

Domain Specified Optimization for Deployment Authorization Haotian Wang, Haoang Chi, Wenjing Yang, Zhipeng Lin, Mingyang Geng, Long Lan, Jing Zhang, Dacheng Tao

PDF

Domain-Specificity Inducing Transformers for Source-Free Domain Adaptation Sunandini Sanyal, Ashish Ramayee Asokan, Suvaansh Bhambri, Akshay Kulkarni, Jogendra Nath Kundu, R Venkatesh Babu

PDF

DomainAdaptor: A Novel Approach to Test-Time Adaptation Jian Zhang, Lei Qi, Yinghuan Shi, Yang Gao

PDF

DomainDrop: Suppressing Domain-Sensitive Channels for Domain Generalization Jintao Guo, Lei Qi, Yinghuan Shi

PDF

Doppelgangers: Learning to Disambiguate Images of Similar Structures Ruojin Cai, Joseph Tung, Qianqian Wang, Hadar Averbuch-Elor, Bharath Hariharan, Noah Snavely

PDF

DOT: A Distillation-Oriented Trainer Borui Zhao, Quan Cui, Renjie Song, Jiajun Liang

PDF

Downscaled Representation Matters: Improving Image Rescaling with Collaborative Downscaled Images Bingna Xu, Yong Guo, Luoqian Jiang, Mianjie Yu, Jian Chen

PDF

Downstream-Agnostic Adversarial Examples Ziqi Zhou, Shengshan Hu, Ruizhi Zhao, Qian Wang, Leo Yu Zhang, Junhui Hou, Hai Jin

PDF

DPF-Net: Combining Explicit Shape Priors in Deformable Primitive Field for Unsupervised Structural Reconstruction of 3D Objects Qingyao Shuai, Chi Zhang, Kaizhi Yang, Xuejin Chen

PDF

DPM-OT: A New Diffusion Probabilistic Model Based on Optimal Transport Zezeng Li, Shenghao Li, Zhanpeng Wang, Na Lei, Zhongxuan Luo, David Xianfeng Gu

PDF

DPS-Net: Deep Polarimetric Stereo Depth Estimation Chaoran Tian, Weihong Pan, Zimo Wang, Mao Mao, Guofeng Zhang, Hujun Bao, Ping Tan, Zhaopeng Cui

PDF

DQS3D: Densely-Matched Quantization-Aware Semi-Supervised 3D Detection Huan-ang Gao, Beiwen Tian, Pengfei Li, Hao Zhao, Guyue Zhou

PDF

DR-Tune: Improving Fine-Tuning of Pretrained Visual Models by Distribution Regularization with Semantic Calibration Nan Zhou, Jiaxin Chen, Di Huang

PDF

DRAW: Defending Camera-Shooted RAW Against Image Manipulation Xiaoxiao Hu, Qichao Ying, Zhenxing Qian, Sheng Li, Xinpeng Zhang

PDF

DREAM: Efficient Dataset Distillation by Representative Matching Yanqing Liu, Jianyang Gu, Kai Wang, Zheng Zhu, Wei Jiang, Yang You

PDF

DreamBooth3D: Subject-Driven Text-to-3D Generation Amit Raj, Srinivas Kaza, Ben Poole, Michael Niemeyer, Nataniel Ruiz, Ben Mildenhall, Shiran Zada, Kfir Aberman, Michael Rubinstein, Jonathan Barron, Yuanzhen Li, Varun Jampani

PDF

DreamPose: Fashion Video Synthesis with Stable Diffusion Johanna Karras, Aleksander Holynski, Ting-Chun Wang, Ira Kemelmacher-Shlizerman

PDF

DreamTeacher: Pretraining Image Backbones with Deep Generative Models Daiqing Li, Huan Ling, Amlan Kar, David Acuna, Seung Wook Kim, Karsten Kreis, Antonio Torralba, Sanja Fidler

PDF

DREAMWALKER: Mental Planning for Continuous Vision-Language Navigation Hanqing Wang, Wei Liang, Luc Van Gool, Wenguan Wang

PDF

DReg-NeRF: Deep Registration for Neural Radiance Fields Yu Chen, Gim Hee Lee

PDF

DriveAdapter: Breaking the Coupling Barrier of Perception and Planning in End-to-End Autonomous Driving Xiaosong Jia, Yulu Gao, Li Chen, Junchi Yan, Patrick Langechuan Liu, Hongyang Li

PDF

DS-Fusion: Artistic Typography via Discriminated and Stylized Diffusion Maham Tanveer, Yizhi Wang, Ali Mahdavi-Amiri, Hao Zhang

PDF

Dual Aggregation Transformer for Image Super-Resolution Zheng Chen, Yulun Zhang, Jinjin Gu, Linghe Kong, Xiaokang Yang, Fisher Yu

PDF

Dual Learning with Dynamic Knowledge Distillation for Partially Relevant Video Retrieval Jianfeng Dong, Minsong Zhang, Zheng Zhang, Xianke Chen, Daizong Liu, Xiaoye Qu, Xun Wang, Baolong Liu

PDF

Dual Meta-Learning with Longitudinally Consistent Regularization for One-Shot Brain Tissue Segmentation Across the Human Lifespan Yongheng Sun, Fan Wang, Jun Shu, Haifeng Wang, Li Wang, Deyu Meng, Chunfeng Lian

PDF

Dual Pseudo-Labels Interactive Self-Training for Semi-Supervised Visible-Infrared Person Re-Identification Jiangming Shi, Yachao Zhang, Xiangbo Yin, Yuan Xie, Zhizhong Zhang, Jianping Fan, Zhongchao Shi, Yanyun Qu

PDF

DVGaze: Dual-View Gaze Estimation Yihua Cheng, Feng Lu

PDF

DVIS: Decoupled Video Instance Segmentation Framework Tao Zhang, Xingye Tian, Yu Wu, Shunping Ji, Xuebo Wang, Yuan Zhang, Pengfei Wan

PDF

DyGait: Exploiting Dynamic Representations for High-Performance Gait Recognition Ming Wang, Xianda Guo, Beibei Lin, Tian Yang, Zheng Zhu, Lincheng Li, Shunli Zhang, Xin Yu

PDF

Dynamic Hyperbolic Attention Network for Fine Hand-Object Reconstruction Zhiying Leng, Shun-Cheng Wu, Mahdi Saleh, Antonio Montanaro, Hao Yu, Yin Wang, Nassir Navab, Xiaohui Liang, Federico Tombari

PDF

Dynamic Mesh Recovery from Partial Point Cloud Sequence Hojun Jang, Minkwan Kim, Jinseok Bae, Young Min Kim

PDF

Dynamic Mesh-Aware Radiance Fields Yi-Ling Qiao, Alexander Gao, Yiran Xu, Yue Feng, Jia-Bin Huang, Ming C. Lin

PDF

Dynamic Perceiver for Efficient Visual Recognition Yizeng Han, Dongchen Han, Zeyu Liu, Yulin Wang, Xuran Pan, Yifan Pu, Chao Deng, Junlan Feng, Shiji Song, Gao Huang

PDF

Dynamic PlenOctree for Adaptive Sampling Refinement in Explicit NeRF Haotian Bai, Yiqi Lin, Yize Chen, Lin Wang

PDF

Dynamic Point Fields Sergey Prokudin, Qianli Ma, Maxime Raafat, Julien Valentin, Siyu Tang

PDF

Dynamic Residual Classifier for Class Incremental Learning Xiuwei Chen, Xiaobin Chang

PDF

Dynamic Snake Convolution Based on Topological Geometric Constraints for Tubular Structure Segmentation Yaolei Qi, Yuting He, Xiaoming Qi, Yuan Zhang, Guanyu Yang

PDF

Dynamic Token Pruning in Plain Vision Transformers for Semantic Segmentation Quan Tang, Bowen Zhang, Jiajun Liu, Fagui Liu, Yifan Liu

PDF

DynamicISP: Dynamically Controlled Image Signal Processor for Image Recognition Masakazu Yoshimura, Junji Otsuka, Atsushi Irie, Takeshi Ohashi

PDF

DynaMITe: Dynamic Query Bootstrapping for Multi-Object Interactive Segmentation Transformer Amit Kumar Rana, Sabarinath Mahadevan, Alexander Hermans, Bastian Leibe

PDF

E^2VPT: An Effective and Efficient Approach for Visual Prompt Tuning Cheng Han, Qifan Wang, Yiming Cui, Zhiwen Cao, Wenguan Wang, Siyuan Qi, Dongfang Liu

PDF

E2E-LOAD: End-to-End Long-Form Online Action Detection Shuqiang Cao, Weixin Luo, Bairui Wang, Wei Zhang, Lin Ma

PDF

E2NeRF: Event Enhanced Neural Radiance Fields from Blurry Images Yunshan Qi, Lin Zhu, Yu Zhang, Jia Li

PDF

E3Sym: Leveraging E(3) Invariance for Unsupervised 3D Planar Reflective Symmetry Detection Ren-Wu Li, Ling-Xiao Zhang, Chunpeng Li, Yu-Kun Lai, Lin Gao

PDF

EdaDet: Open-Vocabulary Object Detection Using Early Dense Alignment Cheng Shi, Sibei Yang

PDF

EDAPS: Enhanced Domain-Adaptive Panoptic Segmentation Suman Saha, Lukas Hoyer, Anton Obukhov, Dengxin Dai, Luc Van Gool

PDF

Editable Image Geometric Abstraction via Neural Primitive Assembly Ye Chen, Bingbing Ni, Xuanhong Chen, Zhangli Hu

PDF

Editing Implicit Assumptions in Text-to-Image Diffusion Models Hadas Orgad, Bahjat Kawar, Yonatan Belinkov

PDF

Effective Real Image Editing with Accelerated Iterative Diffusion Inversion Zhihong Pan, Riccardo Gherardi, Xiufeng Xie, Stephen Huang

PDF

Efficient 3D Semantic Segmentation with Superpoint Transformer Damien Robert, Hugo Raguet, Loic Landrieu

PDF

Efficient Adaptive Human-Object Interaction Detection with Concept-Guided Memory Ting Lei, Fabian Caba, Qingchao Chen, Hailin Jin, Yuxin Peng, Yang Liu

PDF

Efficient Computation Sharing for Multi-Task Visual Scene Understanding Sara Shoouri, Mingyu Yang, Zichen Fan, Hun-Seok Kim

PDF

Efficient Controllable Multi-Task Architectures Abhishek Aich, Samuel Schulter, Amit K. Roy-Chowdhury, Manmohan Chandraker, Yumin Suh

PDF

Efficient Converted Spiking Neural Network for 3D and 2D Classification Yuxiang Lan, Yachao Zhang, Xu Ma, Yanyun Qu, Yun Fu

PDF

Efficient Decision-Based Black-Box Patch Attacks on Video Recognition Kaixun Jiang, Zhaoyu Chen, Hao Huang, Jiafeng Wang, Dingkang Yang, Bo Li, Yan Wang, Wenqiang Zhang

PDF

Efficient Deep Space Filling Curve Wanli Chen, Xufeng Yao, Xinyun Zhang, Bei Yu

PDF

Efficient Diffusion Training via Min-SNR Weighting Strategy Tiankai Hang, Shuyang Gu, Chen Li, Jianmin Bao, Dong Chen, Han Hu, Xin Geng, Baining Guo

PDF

Efficient Discovery and Effective Evaluation of Visual Perceptual Similarity: A Benchmark and Beyond Oren Barkan, Tal Reiss, Jonathan Weill, Ori Katz, Roy Hirsch, Itzik Malkiel, Noam Koenigstein

PDF

Efficient Emotional Adaptation for Audio-Driven Talking-Head Generation Yuan Gan, Zongxin Yang, Xihang Yue, Lingyun Sun, Yi Yang

PDF

Efficient Joint Optimization of Layer-Adaptive Weight Pruning in Deep Neural Networks Kaixin Xu, Zhe Wang, Xue Geng, Min Wu, Xiaoli Li, Weisi Lin

PDF

Efficient LiDAR Point Cloud Oversegmentation Network Le Hui, Linghua Tang, Yuchao Dai, Jin Xie, Jian Yang

PDF

Efficient Model Personalization in Federated Learning via Client-Specific Prompt Generation Fu-En Yang, Chien-Yi Wang, Yu-Chiang Frank Wang

PDF

Efficient Neural Supersampling on a Novel Gaming Dataset Antoine Mercier, Ruan Erasmus, Yashesh Savani, Manik Dhingra, Fatih Porikli, Guillaume Berger

PDF

Efficient Region-Aware Neural Radiance Fields for High-Fidelity Talking Portrait Synthesis Jiahe Li, Jiawei Zhang, Xiao Bai, Jun Zhou, Lin Gu

PDF

Efficient Transformer-Based 3D Object Detection with Dynamic Token Halting Mao Ye, Gregory P. Meyer, Yuning Chai, Qiang Liu

PDF

Efficient Unified Demosaicing for Bayer and Non-Bayer Patterned Image Sensors Haechang Lee, Dongwon Park, Wongi Jeong, Kijeong Kim, Hyunwoo Je, Dongil Ryu, Se Young Chun

PDF

Efficient Video Action Detection with Token Dropout and Context Refinement Lei Chen, Zhan Tong, Yibing Song, Gangshan Wu, Limin Wang

PDF

Efficient Video Prediction via Sparsely Conditioned Flow Matching Aram Davtyan, Sepehr Sameni, Paolo Favaro

PDF

Efficient View Synthesis with Neural Radiance Distribution Field Yushuang Wu, Xiao Li, Jinglu Wang, Xiaoguang Han, Shuguang Cui, Yan Lu

PDF

Efficient-VQGAN: Towards High-Resolution Image Generation with Efficient Vision Transformers Shiyue Cao, Yueqin Yin, Lianghua Huang, Yu Liu, Xin Zhao, Deli Zhao, Kaigi Huang

PDF

Efficiently Robustify Pre-Trained Models Nishant Jain, Harkirat Behl, Yogesh Singh Rawat, Vibhav Vineet

PDF

EfficientTrain: Exploring Generalized Curriculum Learning for Training Visual Backbones Yulin Wang, Yang Yue, Rui Lu, Tianjiao Liu, Zhao Zhong, Shiji Song, Gao Huang

PDF

EfficientViT: Lightweight Multi-Scale Attention for High-Resolution Dense Prediction Han Cai, Junyan Li, Muyan Hu, Chuang Gan, Song Han

PDF

EGC: Image Generation and Classification via a Diffusion Energy-Based Model Qiushan Guo, Chuofan Ma, Yi Jiang, Zehuan Yuan, Yizhou Yu, Ping Luo

PDF

EGformer: Equirectangular Geometry-Biased Transformer for 360 Depth Estimation Ilwi Yun, Chanyong Shin, Hyunku Lee, Hyuk-Jae Lee, Chae Eun Rhee

PDF

Ego-Humans: An Ego-Centric 3D Multi-Human Benchmark Rawal Khirodkar, Aayush Bansal, Lingni Ma, Richard Newcombe, Minh Vo, Kris Kitani

PDF

Ego-Only: Egocentric Action Detection Without Exocentric Transferring Huiyu Wang, Mitesh Kumar Singh, Lorenzo Torresani

PDF

EgoLoc: Revisiting 3D Object Localization from Egocentric Videos with Visual Queries Jinjie Mai, Abdullah Hamdi, Silvio Giancola, Chen Zhao, Bernard Ghanem

PDF

EgoObjects: A Large-Scale Egocentric Dataset for Fine-Grained Object Understanding Chenchen Zhu, Fanyi Xiao, Andres Alvarado, Yasmine Babaei, Jiabo Hu, Hichem El-Mohri, Sean Culatana, Roshan Sumbaly, Zhicheng Yan

PDF

EgoPCA: A New Framework for Egocentric Hand-Object Interaction Understanding Yue Xu, Yong-Lu Li, Zhemin Huang, Michael Xu Liu, Cewu Lu, Yu-Wing Tai, Chi-Keung Tang

PDF

EgoTV: Egocentric Task Verification from Natural Language Task Descriptions Rishi Hazra, Brian Chen, Akshara Rai, Nitin Kamra, Ruta Desai

PDF

EgoVLPv2: Egocentric Video-Language Pre-Training with Fusion in the Backbone Shraman Pramanick, Yale Song, Sayan Nag, Kevin Qinghong Lin, Hardik Shah, Mike Zheng Shou, Rama Chellappa, Pengchuan Zhang

PDF

EigenPlaces: Training Viewpoint Robust Models for Visual Place Recognition Gabriele Berton, Gabriele Trivigno, Barbara Caputo, Carlo Masone

PDF

EigenTrajectory: Low-Rank Descriptors for Multi-Modal Trajectory Forecasting Inhwan Bae, Jean Oh, Hae-Gon Jeon

PDF

ElasticViT: Conflict-Aware Supernet Training for Deploying Fast Vision Transformer on Diverse Mobile Devices Chen Tang, Li Lyna Zhang, Huiqiang Jiang, Jiahang Xu, Ting Cao, Quanlu Zhang, Yuqing Yang, Zhi Wang, Mao Yang

PDF

ELFNet: Evidential Local-Global Fusion for Stereo Matching Jieming Lou, Weide Liu, Zhuo Chen, Fayao Liu, Jun Cheng

PDF

ELITE: Encoding Visual Concepts into Textual Embeddings for Customized Text-to-Image Generation Yuxiang Wei, Yabo Zhang, Zhilong Ji, Jinfeng Bai, Lei Zhang, Wangmeng Zuo

PDF

EMDB: The Electromagnetic Database of Global 3D Human Pose and Shape in the Wild Manuel Kaufmann, Jie Song, Chen Guo, Kaiyue Shen, Tianjian Jiang, Chengcheng Tang, Juan José Zárate, Otmar Hilliges

PDF

EMMN: Emotional Motion Memory Network for Audio-Driven Emotional Talking Face Generation Shuai Tan, Bin Ji, Ye Pan

PDF

EmoSet: A Large-Scale Visual Emotion Dataset with Rich Attributes Jingyuan Yang, Qirui Huang, Tingting Ding, Dani Lischinski, Danny Cohen-Or, Hui Huang

PDF

EmoTalk: Speech-Driven Emotional Disentanglement for 3D Face Animation Ziqiao Peng, Haoyu Wu, Zhenbo Song, Hao Xu, Xiangyu Zhu, Jun He, Hongyan Liu, Zhaoxin Fan

PDF

Emotional Listener Portrait: Neural Listener Head Generation with Emotion Luchuan Song, Guojun Yin, Zhenchao Jin, Xiaoyi Dong, Chenliang Xu

PDF

Empowering Low-Light Image Enhancer Through Customized Learnable Priors Naishan Zheng, Man Zhou, Yanmeng Dong, Xiangyu Rui, Jie Huang, Chongyi Li, Feng Zhao

PDF

EMQ: Evolving Training-Free Proxies for Automated Mixed Precision Quantization Peijie Dong, Lujun Li, Zimian Wei, Xin Niu, Zhiliang Tian, Hengyue Pan

PDF

EMR-MSF: Self-Supervised Recurrent Monocular Scene Flow Exploiting Ego-Motion Rigidity Zijie Jiang, Masatoshi Okutomi

PDF

Encyclopedic VQA: Visual Questions About Detailed Properties of Fine-Grained Categories Thomas Mensink, Jasper Uijlings, Lluis Castrejon, Arushi Goel, Felipe Cadar, Howard Zhou, Fei Sha, André Araujo, Vittorio Ferrari

PDF

End-to-End 3D Tracking with Decoupled Queries Yanwei Li, Zhiding Yu, Jonah Philion, Anima Anandkumar, Sanja Fidler, Jiaya Jia, Jose Alvarez

PDF

End-to-End Diffusion Latent Optimization Improves Classifier Guidance Bram Wallace, Akash Gokul, Stefano Ermon, Nikhil Naik

PDF

End2End Multi-View Feature Matching with Differentiable Pose Optimization Barbara Roessle, Matthias Nießner

PDF

Energy-Based Self-Training and Normalization for Unsupervised Domain Adaptation Samitha Herath, Basura Fernando, Ehsan Abbasnejad, Munawar Hayat, Shahram Khadivi, Mehrtash Harandi, Hamid Rezatofighi, Gholamreza Haffari

PDF

Enhanced Meta Label Correction for Coping with Label Corruption Mitchell Keren Taraday, Chaim Baskin

PDF

Enhanced Soft Label for Semi-Supervised Semantic Segmentation Jie Ma, Chuan Wang, Yang Liu, Liang Lin, Guanbin Li

PDF

Enhancing Adversarial Robustness in Low-Label Regime via Adaptively Weighted Regularization and Knowledge Distillation Dongyoon Yang, Insung Kong, Yongdai Kim

PDF

Enhancing Fine-Tuning Based Backdoor Defense with Sharpness-Aware Minimization Mingli Zhu, Shaokui Wei, Li Shen, Yanbo Fan, Baoyuan Wu

PDF

Enhancing Generalization of Universal Adversarial Perturbation Through Gradient Aggregation Xuannan Liu, Yaoyao Zhong, Yuhang Zhang, Lixiong Qin, Weihong Deng

PDF

Enhancing Modality-Agnostic Representations via Meta-Learning for Brain Tumor Segmentation Aishik Konwer, Xiaoling Hu, Joseph Bae, Xuan Xu, Chao Chen, Prateek Prasanna

PDF

Enhancing NeRF Akin to Enhancing LLMs: Generalizable NeRF Transformer with Mixture-of-View-Experts Wenyan Cong, Hanxue Liang, Peihao Wang, Zhiwen Fan, Tianlong Chen, Mukund Varma, Yi Wang, Zhangyang Wang

PDF

Enhancing Non-Line-of-Sight Imaging via Learnable Inverse Kernel and Attention Mechanisms Yanhua Yu, Siyuan Shen, Zi Wang, Binbin Huang, Yuehan Wang, Xingyue Peng, Suan Xia, Ping Liu, Ruiqian Li, Shiying Li

PDF

Enhancing Privacy Preservation in Federated Learning via Learning Rate Perturbation Guangnian Wan, Haitao Du, Xuejing Yuan, Jun Yang, Meiling Chen, Jie Xu

PDF

Enhancing Sample Utilization Through Sample Adaptive Augmentation in Semi-Supervised Learning Guan Gui, Zhen Zhao, Lei Qi, Luping Zhou, Lei Wang, Yinghuan Shi

PDF

ENTL: Embodied Navigation Trajectory Learner Klemen Kotar, Aaron Walsman, Roozbeh Mottaghi

PDF

ENVIDR: Implicit Differentiable Renderer with Neural Environment Lighting Ruofan Liang, Huiting Chen, Chunlin Li, Fan Chen, Selvakumar Panneer, Nandita Vijaykumar

PDF

Environment Agnostic Representation for Visual Reinforcement Learning Hyesong Choi, Hunsang Lee, Seongwon Jeong, Dongbo Min

PDF

Environment-Invariant Curriculum Relation Learning for Fine-Grained Scene Graph Generation Yukuan Min, Aming Wu, Cheng Deng

PDF

eP-ALM: Efficient Perceptual Augmentation of Language Models Mustafa Shukor, Corentin Dancette, Matthieu Cord

PDF

EP2P-Loc: End-to-End 3D Point to 2D Pixel Localization for Large-Scale Visual Localization Minjung Kim, Junseo Koo, Gunhee Kim

PDF

EPiC: Ensemble of Partial Point Clouds for Robust Classification Meir Yossef Levi, Guy Gilboa

PDF

EQ-Net: Elastic Quantization Neural Networks Ke Xu, Lei Han, Ye Tian, Shangshang Yang, Xingyi Zhang

PDF

Equivariant Similarity for Vision-Language Foundation Models Tan Wang, Kevin Lin, Linjie Li, Chung-Ching Lin, Zhengyuan Yang, Hanwang Zhang, Zicheng Liu, Lijuan Wang

PDF

Erasing Concepts from Diffusion Models Rohit Gandikota, Joanna Materzynska, Jaden Fiotto-Kaufman, David Bau

PDF

ESSAformer: Efficient Transformer for Hyperspectral Image Super-Resolution Mingjin Zhang, Chi Zhang, Qiming Zhang, Jie Guo, Xinbo Gao, Jing Zhang

PDF

Essential Matrix Estimation Using Convex Relaxations in Orthogonal Space Arman Karimian, Roberto Tron

PDF

ESTextSpotter: Towards Better Scene Text Spotting with Explicit Synergy in Transformer Mingxin Huang, Jiaxin Zhang, Dezhi Peng, Hao Lu, Can Huang, Yuliang Liu, Xiang Bai, Lianwen Jin

PDF

Estimator Meets Equilibrium Perspective: A Rectified Straight Through Estimator for Binary Neural Networks Training Xiao-Ming Wu, Dian Zheng, Zuhao Liu, Wei-Shi Zheng

PDF

ETran: Energy-Based Transferability Estimation Mohsen Gholami, Mohammad Akbari, Xinglu Wang, Behnam Kamranian, Yong Zhang

PDF

Eulerian Single-Photon Vision Shantanu Gupta, Mohit Gupta

PDF

Evaluating Data Attribution for Text-to-Image Models Sheng-Yu Wang, Alexei A. Efros, Jun-Yan Zhu, Richard Zhang

PDF

Evaluation and Improvement of Interpretability for Self-Explainable Part-Prototype Networks Qihan Huang, Mengqi Xue, Wenqi Huang, Haofei Zhang, Jie Song, Yongcheng Jing, Mingli Song

PDF

Event Camera Data Pre-Training Yan Yang, Liyuan Pan, Liu Liu

PDF

Event-Based Temporally Dense Optical Flow Estimation with Sequential Learning Wachirawit Ponghiran, Chamika Mihiranga Liyanagedera, Kaushik Roy

PDF

Event-Guided Procedure Planning from Instructional Videos with Text Supervision An-Lan Wang, Kun-Yu Lin, Jia-Run Du, Jingke Meng, Wei-Shi Zheng

PDF

Eventful Transformers: Leveraging Temporal Redundancy in Vision Transformers Matthew Dutson, Yin Li, Mohit Gupta

PDF

EverLight: Indoor-Outdoor Editable HDR Lighting Estimation Mohammad Reza Karimi Dastjerdi, Jonathan Eisenmann, Yannick Hold-Geoffroy, Jean-François Lalonde

PDF

Examining Autoexposure for Challenging Scenes SaiKiran Tedla, Beixuan Yang, Michael S. Brown

PDF

ExBluRF: Efficient Radiance Fields for Extreme Motion Blurred Images Dongwoo Lee, Jeongtaek Oh, Jaesung Rim, Sunghyun Cho, Kyoung Mu Lee

PDF

Exemplar-Free Continual Transformer with Convolutions Anurag Roy, Vinay K. Verma, Sravan Voonna, Kripabandhu Ghosh, Saptarshi Ghosh, Abir Das

PDF

Explaining Adversarial Robustness of Neural Networks from Clustering Effect Perspective Yulin Jin, Xiaoyu Zhang, Jian Lou, Xu Ma, Zilong Wang, Xiaofeng Chen

PDF

Explicit Motion Disentangling for Efficient Optical Flow Estimation Changxing Deng, Ao Luo, Haibin Huang, Shaodan Ma, Jiangyu Liu, Shuaicheng Liu

PDF

Exploiting Proximity-Aware Tasks for Embodied Social Navigation Enrico Cancelli, Tommaso Campari, Luciano Serafini, Angel X. Chang, Lamberto Ballan

PDF

Explore and Tell: Embodied Visual Captioning in 3D Environments Anwen Hu, Shizhe Chen, Liang Zhang, Qin Jin

PDF

Exploring Group Video Captioning with Efficient Relational Approximation Wang Lin, Tao Jin, Ye Wang, Wenwen Pan, Linjun Li, Xize Cheng, Zhou Zhao

PDF

Exploring Lightweight Hierarchical Vision Transformers for Efficient Visual Tracking Ben Kang, Xin Chen, Dong Wang, Houwen Peng, Huchuan Lu

PDF

Exploring Model Transferability Through the Lens of Potential Energy Xiaotong Li, Zixuan Hu, Yixiao Ge, Ying Shan, Ling-Yu Duan

PDF

Exploring Object-Centric Temporal Modeling for Efficient Multi-View 3D Object Detection Shihao Wang, Yingfei Liu, Tiancai Wang, Ying Li, Xiangyu Zhang

PDF

Exploring Open-Vocabulary Semantic Segmentation from CLIP Vision Encoder Distillation Only Jun Chen, Deyao Zhu, Guocheng Qian, Bernard Ghanem, Zhicheng Yan, Chenchen Zhu, Fanyi Xiao, Sean Chang Culatana, Mohamed Elhoseiny

PDF

Exploring Positional Characteristics of Dual-Pixel Data for Camera Autofocus Myungsub Choi, Hana Lee, Hyong-euk Lee

PDF

Exploring Predicate Visual Context in Detecting of Human-Object Interactions Frederic Z Zhang, Yuhui Yuan, Dylan Campbell, Zhuoyao Zhong, Stephen Gould

PDF

Exploring Temporal Concurrency for Video-Language Representation Learning Heng Zhang, Daqing Liu, Zezhong Lv, Bing Su, Dacheng Tao

PDF

Exploring Temporal Frequency Spectrum in Deep Video Deblurring Qi Zhu, Man Zhou, Naishan Zheng, Chongyi Li, Jie Huang, Feng Zhao

PDF

Exploring the Benefits of Visual Prompting in Differential Privacy Yizhe Li, Yu-Lin Tsai, Chia-Mu Yu, Pin-Yu Chen, Xuebin Ren

PDF

Exploring the Sim2Real Gap Using Digital Twins Sruthi Sudhakar, Jon Hanzelka, Josh Bobillot, Tanmay Randhavane, Neel Joshi, Vibhav Vineet

PDF

Exploring Transformers for Open-World Instance Segmentation Jiannan Wu, Yi Jiang, Bin Yan, Huchuan Lu, Zehuan Yuan, Ping Luo

PDF

Exploring Video Quality Assessment on User Generated Contents from Aesthetic and Technical Perspectives Haoning Wu, Erli Zhang, Liang Liao, Chaofeng Chen, Jingwen Hou, Annan Wang, Wenxiu Sun, Qiong Yan, Weisi Lin

PDF

ExposureDiffusion: Learning to Expose for Low-Light Image Enhancement Yufei Wang, Yi Yu, Wenhan Yang, Lanqing Guo, Lap-Pui Chau, Alex C. Kot, Bihan Wen

PDF

Expressive Text-to-Image Generation with Rich Text Songwei Ge, Taesung Park, Jun-Yan Zhu, Jia-Bin Huang

PDF

Extensible and Efficient Proxy for Neural Architecture Search Yuhong Li, Jiajie Li, Cong Hao, Pan Li, Jinjun Xiong, Deming Chen

PDF

F&F Attack: Adversarial Attack Against Multiple Object Trackers by Inducing False Negatives and False Positives Tao Zhou, Qi Ye, Wenhan Luo, Kaihao Zhang, Zhiguo Shi, Jiming Chen

PDF

Face Clustering via Graph Convolutional Networks with Confidence Edges Yang Wu, Zhiwei Ge, Yuhao Luo, Lin Liu, Sulong Xu

PDF

FaceCLIPNeRF: Text-Driven 3D Face Manipulation Using Deformable Neural Radiance Fields Sungwon Hwang, Junha Hyung, Daejin Kim, Min-Jung Kim, Jaegul Choo

PDF

FACET: Fairness in Computer Vision Evaluation Benchmark Laura Gustafson, Chloe Rolland, Nikhila Ravi, Quentin Duval, Aaron Adcock, Cheng-Yang Fu, Melissa Hall, Candace Ross

PDF

Factorized Inverse Path Tracing for Efficient and Accurate Material-Lighting Estimation Liwen Wu, Rui Zhu, Mustafa B. Yaldiz, Yinhao Zhu, Hong Cai, Janarbek Matai, Fatih Porikli, Tzu-Mao Li, Manmohan Chandraker, Ravi Ramamoorthi

PDF

FACTS: First Amplify Correlations and Then Slice to Discover Bias Sriram Yenamandra, Pratik Ramesh, Viraj Prabhu, Judy Hoffman

PDF

Fan-Beam Binarization Difference Projection (FB-BDP): A Novel Local Object Descriptor for Fine-Grained Leaf Image Retrieval Xin Chen, Bin Wang, Yongsheng Gao

PDF

Fantasia3D: Disentangling Geometry and Appearance for High-Quality Text-to-3D Content Creation Rui Chen, Yongwei Chen, Ningxin Jiao, Kui Jia

PDF

FashionNTM: Multi-Turn Fashion Image Retrieval via Cascaded Memory Anwesan Pal, Sahil Wadhwa, Ayush Jaiswal, Xu Zhang, Yue Wu, Rakesh Chada, Pradeep Natarajan, Henrik I. Christensen

PDF

Fast Adversarial Training with Smooth Convergence Mengnan Zhao, Lihe Zhang, Yuqiu Kong, Baocai Yin

PDF

Fast and Accurate Transferability Measurement by Evaluating Intra-Class Feature Variance Huiwen Xu, U Kang

PDF

Fast Full-Frame Video Stabilization with Iterative Optimization Weiyue Zhao, Xin Li, Zhan Peng, Xianrui Luo, Xinyi Ye, Hao Lu, Zhiguo Cao

PDF

Fast Globally Optimal Surface Normal Estimation from an Affine Correspondence Levente Hajder, Lajos Lóczi, Daniel Barath

PDF

Fast Inference and Update of Probabilistic Density Estimation on Trajectory Prediction Takahiro Maeda, Norimichi Ukita

PDF

Fast Neural Scene Flow Xueqian Li, Jianqiao Zheng, Francesco Ferroni, Jhony Kaesemodel Pontes, Simon Lucey

PDF

FastRecon: Few-Shot Industrial Anomaly Detection via Fast Feature Reconstruction Zheng Fang, Xiaoyang Wang, Haocheng Li, Jiejie Liu, Qiugui Hu, Jimin Xiao

PDF

FastViT: A Fast Hybrid Vision Transformer Using Structural Reparameterization Pavan Kumar Anasosalu Vasu, James Gabriel, Jeff Zhu, Oncel Tuzel, Anurag Ranjan

PDF

FateZero: Fusing Attentions for Zero-Shot Text-Based Video Editing Chenyang Qi, Xiaodong Cun, Yong Zhang, Chenyang Lei, Xintao Wang, Ying Shan, Qifeng Chen

PDF

FB-BEV: BEV Representation from Forward-Backward View Transformations Zhiqi Li, Zhiding Yu, Wenhai Wang, Anima Anandkumar, Tong Lu, Jose M. Alvarez

PDF

FBLNet: FeedBack Loop Network for Driver Attention Prediction Yilong Chen, Zhixiong Nan, Tao Xiang

PDF

Fcaformer: Forward Cross Attention in Hybrid Vision Transformer Haokui Zhang, Wenze Hu, Xiaoyu Wang

PDF

FCCNs: Fully Complex-Valued Convolutional Networks Using Complex-Valued Color Model and Loss Function Saurabh Yadav, Koteswar Rao Jerripothula

PDF

FDViT: Improve the Hierarchical Architecture of Vision Transformer Yixing Xu, Chao Li, Dong Li, Xiao Sheng, Fan Jiang, Lu Tian, Ashish Sirasao

PDF

FeatEnHancer: Enhancing Hierarchical Features for Object Detection and Beyond Under Low-Light Vision Khurram Azeem Hashmi, Goutham Kallempudi, Didier Stricker, Muhammad Zeshan Afzal

PDF

Feature Modulation Transformer: Cross-Refinement of Global Representation via High-Frequency Prior for Image Super-Resolution Ao Li, Le Zhang, Yun Liu, Ce Zhu

PDF

Feature Prediction Diffusion Model for Video Anomaly Detection Cheng Yan, Shiyu Zhang, Yang Liu, Guansong Pang, Wenjun Wang

PDF

Feature Proliferation -- the "Cancer" in StyleGAN and Its Treatments Shuang Song, Yuanbang Liang, Jing Wu, Yu-Kun Lai, Yipeng Qin

PDF

FeatureNeRF: Learning Generalizable NeRFs by Distilling Foundation Models Jianglong Ye, Naiyan Wang, Xiaolong Wang

PDF

Federated Learning over Images: Vertical Decompositions and Pre-Trained Backbones Are Difficult to Beat Erdong Hu, Yuxin Tang, Anastasios Kyrillidis, Chris Jermaine

PDF

FedPD: Federated Open Set Recognition with Parameter Disentanglement Chen Yang, Meilu Zhu, Yifan Liu, Yixuan Yuan

PDF

FedPerfix: Towards Partial Model Personalization of Vision Transformers in Federated Learning Guangyu Sun, Matias Mendieta, Jun Luo, Shandong Wu, Chen Chen

PDF

FemtoDet: An Object Detection Baseline for Energy Versus Performance Tradeoffs Peng Tu, Xu Xie, Guo Ai, Yuexiang Li, Yawen Huang, Yefeng Zheng

PDF

FerKD: Surgical Label Adaptation for Efficient Distillation Zhiqiang Shen

PDF

Few Shot Font Generation via Transferring Similarity Guided Global Style and Quantization Local Style Wei Pan, Anna Zhu, Xinyu Zhou, Brian Kenji Iwana, Shilin Li

PDF

Few-Shot Common Action Localization via Cross-Attentional Fusion of Context and Temporal Dynamics Juntae Lee, Mihir Jain, Sungrack Yun

PDF

Few-Shot Continual Infomax Learning Ziqi Gu, Chunyan Xu, Jian Yang, Zhen Cui

PDF

Few-Shot Dataset Distillation via Translative Pre-Training Songhua Liu, Xinchao Wang

PDF

Few-Shot Physically-Aware Articulated Mesh Generation via Hierarchical Deformation Xueyi Liu, Bin Wang, He Wang, Li Yi

PDF

Few-Shot Video Classification via Representation Fusion and Promotion Learning Haifeng Xia, Kai Li, Martin Renqiang Min, Zhengming Ding

PDF

Fg-T2M: Fine-Grained Text-Driven Human Motion Generation via Diffusion Model Yin Wang, Zhiying Leng, Frederick W. B. Li, Shun-Cheng Wu, Xiaohui Liang

PDF

Fine-Grained Unsupervised Domain Adaptation for Gait Recognition Kang Ma, Ying Fu, Dezhi Zheng, Yunjie Peng, Chunshui Cao, Yongzhen Huang

PDF

Fine-Grained Visible Watermark Removal Li Niu, Xing Zhao, Bo Zhang, Liqing Zhang

PDF

FineDance: A Fine-Grained Choreography Dataset for 3D Full Body Dance Generation Ronghui Li, Junfan Zhao, Yachao Zhang, Mingyang Su, Zeping Ren, Han Zhang, Yansong Tang, Xiu Li

PDF

FineRecon: Depth-Aware Feed-Forward Network for Detailed 3D Reconstruction Noah Stier, Anurag Ranjan, Alex Colburn, Yajie Yan, Liang Yang, Fangchang Ma, Baptiste Angles

PDF

Fingerprinting Deep Image Restoration Models Yuhui Quan, Huan Teng, Ruotao Xu, Jun Huang, Hui Ji

PDF

First Session Adaptation: A Strong Replay-Free Baseline for Class-Incremental Learning Aristeidis Panos, Yuriko Kobe, Daniel Olmeda Reino, Rahaf Aljundi, Richard E. Turner

PDF

FishNet: A Large-Scale Dataset and Benchmark for Fish Recognition, Detection, and Functional Trait Prediction Faizan Farooq Khan, Xiang Li, Andrew J. Temple, Mohamed Elhoseiny

PDF

Flatness-Aware Minimization for Domain Generalization Xingxuan Zhang, Renzhe Xu, Han Yu, Yancheng Dong, Pengfei Tian, Peng Cui

PDF

FLatten Transformer: Vision Transformer Using Focused Linear Attention Dongchen Han, Xuran Pan, Yizeng Han, Shiji Song, Gao Huang

PDF

Flexible Visual Recognition by Evidential Modeling of Confusion and Ignorance Lei Fan, Bo Liu, Haoxiang Li, Ying Wu, Gang Hua

PDF

FLIP: Cross-Domain Face Anti-Spoofing with Language Guidance Koushik Srivatsan, Muzammal Naseer, Karthik Nandakumar

PDF

FlipNeRF: Flipped Reflection Rays for Few-Shot Novel View Synthesis Seunghyeon Seo, Yeonjin Chang, Nojun Kwak

PDF

Focal Network for Image Restoration Yuning Cui, Wenqi Ren, Xiaochun Cao, Alois Knoll

PDF

FocalFormer3D: Focusing on Hard Instance for 3D Object Detection Yilun Chen, Zhiding Yu, Yukang Chen, Shiyi Lan, Anima Anandkumar, Jiaya Jia, Jose M. Alvarez

PDF

Focus on Your Target: A Dual Teacher-Student Framework for Domain-Adaptive Semantic Segmentation Xinyue Huo, Lingxi Xie, Wengang Zhou, Houqiang Li, Qi Tian

PDF

Focus the Discrepancy: Intra- and Inter-Correlation Learning for Image Anomaly Detection Xincheng Yao, Ruoqi Li, Zefeng Qian, Yan Luo, Chongyang Zhang

PDF

Forecast-MAE: Self-Supervised Pre-Training for Motion Forecasting with Masked Autoencoders Jie Cheng, Xiaodong Mei, Ming Liu

PDF

Foreground and Text-Lines Aware Document Image Rectification Heng Li, Xiangping Wu, Qingcai Chen, Qianjin Xiang

PDF

Foreground Object Search by Distilling Composite Image Feature Bo Zhang, Jiacheng Sui, Li Niu

PDF

Foreground-Background Distribution Modeling Transformer for Visual Object Tracking Dawei Yang, Jianfeng He, Yinchao Ma, Qianjin Yu, Tianzhu Zhang

PDF

Foreground-Background Separation Through Concept Distillation from Generative Image Foundation Models Mischa Dombrowski, Hadrien Reynaud, Matthew Baugh, Bernhard Kainz

PDF

Forward Flow for Novel View Synthesis of Dynamic Scenes Xiang Guo, Jiadai Sun, Yuchao Dai, Guanying Chen, Xiaoqing Ye, Xiao Tan, Errui Ding, Yumeng Zhang, Jingdong Wang

PDF

FPR: False Positive Rectification for Weakly Supervised Semantic Segmentation Liyi Chen, Chenyang Lei, Ruihuang Li, Shuai Li, Zhaoxiang Zhang, Lei Zhang

PDF

FRAug: Tackling Federated Learning with Non-IID Features via Representation Augmentation Haokun Chen, Ahmed Frikha, Denis Krompass, Jindong Gu, Volker Tresp

PDF

FreeCOS: Self-Supervised Learning from Fractals and Unlabeled Images for Curvilinear Object Segmentation Tianyi Shi, Xiaohuan Ding, Liang Zhang, Xin Yang

PDF

FreeDoM: Training-Free Energy-Guided Conditional Diffusion Model Jiwen Yu, Yinhuai Wang, Chen Zhao, Bernard Ghanem, Jian Zhang

PDF

Frequency Guidance Matters in Few-Shot Learning Hao Cheng, Siyuan Yang, Joey Tianyi Zhou, Lanqing Guo, Bihan Wen

PDF

Frequency-Aware GAN for Adversarial Manipulation Generation Peifei Zhu, Genki Osada, Hirokatsu Kataoka, Tsubasa Takahashi

PDF

From Chaos Comes Order: Ordering Event Representations for Object Recognition and Detection Nikola Zubić, Daniel Gehrig, Mathias Gehrig, Davide Scaramuzza

PDF

From Knowledge Distillation to Self-Knowledge Distillation: A Unified Approach with Normalized Loss and Customized Soft Labels Zhendong Yang, Ailing Zeng, Zhe Li, Tianke Zhang, Chun Yuan, Yu Li

PDF

From Sky to the Ground: A Large-Scale Benchmark and Simple Baseline Towards Real Rain Removal Yun Guo, Xueyao Xiao, Yi Chang, Shumin Deng, Luxin Yan

PDF

FrozenRecon: Pose-Free 3D Scene Reconstruction with Frozen Depth Models Guangkai Xu, Wei Yin, Hao Chen, Chunhua Shen, Kai Cheng, Feng Zhao

PDF

FS-DETR: Few-Shot DEtection TRansformer with Prompting and Without Re-Training Adrian Bulat, Ricardo Guerrero, Brais Martinez, Georgios Tzimiropoulos

PDF

FSAR: Federated Skeleton-Based Action Recognition with Adaptive Topology Structure and Knowledge Distillation Jingwen Guo, Hong Liu, Shitong Sun, Tianyu Guo, Min Zhang, Chenyang Si

PDF

FSI: Frequency and Spatial Interactive Learning for Image Restoration in Under-Display Cameras Chengxu Liu, Xuan Wang, Shuai Li, Yuzhi Wang, Xueming Qian

PDF

Full-Body Articulated Human-Object Interaction Nan Jiang, Tengyu Liu, Zhexuan Cao, Jieming Cui, Zhiyuan Zhang, Yixin Chen, He Wang, Yixin Zhu, Siyuan Huang

PDF

FULLER: Unified Multi-Modality Multi-Task 3D Perception via Multi-Level Gradient Calibration Zhijian Huang, Sihao Lin, Guiyu Liu, Mukun Luo, Chaoqiang Ye, Hang Xu, Xiaojun Chang, Xiaodan Liang

PDF

Fully Attentional Networks with Self-Emerging Token Labeling Bingyin Zhao, Zhiding Yu, Shiyi Lan, Yutao Cheng, Anima Anandkumar, Yingjie Lao, Jose M. Alvarez

PDF

FunnyBirds: A Synthetic Vision Dataset for a Part-Based Analysis of Explainable AI Methods Robin Hesse, Simone Schaub-Meyer, Stefan Roth

PDF

G2L: Semantically Aligned and Uniform Video Grounding via Geodesic and Game Theory Hongxiang Li, Meng Cao, Xuxin Cheng, Yaowei Li, Zhihong Zhu, Yuexian Zou

PDF

GACE: Geometry Aware Confidence Enhancement for Black-Box 3D Object Detectors on LiDAR-Data David Schinagl, Georg Krispel, Christian Fruhwirth-Reisinger, Horst Possegger, Horst Bischof

PDF

GAFlow: Incorporating Gaussian Attention into Optical Flow Ao Luo, Fan Yang, Xin Li, Lang Nie, Chunyu Lin, Haoqiang Fan, Shuaicheng Liu

PDF

GAIT: Generating Aesthetic Indoor Tours with Deep Reinforcement Learning Desai Xie, Ping Hu, Xin Sun, Soren Pirk, Jianming Zhang, Radomir Mech, Arie E. Kaufman

PDF

GameFormer: Game-Theoretic Modeling and Learning of Transformer-Based Interactive Prediction and Planning for Autonomous Driving Zhiyu Huang, Haochen Liu, Chen Lv

PDF

GaPro: Box-Supervised 3D Point Cloud Instance Segmentation Using Gaussian Processes as Pseudo Labelers Tuan Duc Ngo, Binh-Son Hua, Khoi Nguyen

PDF

GasMono: Geometry-Aided Self-Supervised Monocular Depth Estimation for Indoor Scenes Chaoqiang Zhao, Matteo Poggi, Fabio Tosi, Lei Zhou, Qiyu Sun, Yang Tang, Stefano Mattoccia

PDF

GECCO: Geometrically-Conditioned Point Diffusion Models Michał J Tyszkiewicz, Pascal Fua, Eduard Trulls

PDF

GEDepth: Ground Embedding for Monocular Depth Estimation Xiaodong Yang, Zhuang Ma, Zhiyu Ji, Zhe Ren

PDF

Gender Artifacts in Visual Datasets Nicole Meister, Dora Zhao, Angelina Wang, Vikram V. Ramaswamy, Ruth Fong, Olga Russakovsky

PDF

General Image-to-Image Translation with One-Shot Image Guidance Bin Cheng, Zuhao Liu, Yunbo Peng, Yue Lin

PDF

General Planar Motion from a Pair of 3D Correspondences Juan Carlos Dibene, Zhixiang Min, Enrique Dunn

PDF

Generalizable Decision Boundaries: Dualistic Meta-Learning for Open Set Domain Generalization Xiran Wang, Jian Zhang, Lei Qi, Yinghuan Shi

PDF

Generalizable Neural Fields as Partially Observed Neural Processes Jeffrey Gu, Kuan-Chieh Wang, Serena Yeung

PDF

Generalized Differentiable RANSAC Tong Wei, Yash Patel, Alexander Shekhovtsov, Jiri Matas, Daniel Barath

PDF

Generalized Few-Shot Point Cloud Segmentation via Geometric Words Yating Xu, Conghui Hu, Na Zhao, Gim Hee Lee

PDF

Generalized Lightness Adaptation with Channel Selective Normalization Mingde Yao, Jie Huang, Xin Jin, Ruikang Xu, Shenglong Zhou, Man Zhou, Zhiwei Xiong

PDF

Generalized Sum Pooling for Metric Learning Yeti Z. Gürbüz, Ozan Sener, A. Aydin Alatan

PDF

Generalizing Event-Based Motion Deblurring in Real-World Scenarios Xiang Zhang, Lei Yu, Wen Yang, Jianzhuang Liu, Gui-Song Xia

PDF

Generalizing Neural Human Fitting to Unseen Poses with Articulated SE(3) Equivariance Haiwen Feng, Peter Kulits, Shichen Liu, Michael J. Black, Victoria Fernandez Abrevaya

PDF

Generating Dynamic Kernels via Transformers for Lane Detection Ziye Chen, Yu Liu, Mingming Gong, Bo Du, Guoqi Qian, Kate Smith-Miles

PDF

Generating Instance-Level Prompts for Rehearsal-Free Continual Learning Dahuin Jung, Dongyoon Han, Jihwan Bang, Hwanjun Song

PDF

Generating Realistic Images from In-the-Wild Sounds Taegyeong Lee, Jeonghun Kang, Hyeonyu Kim, Taehwan Kim

PDF

Generating Visual Scenes from Touch Fengyu Yang, Jiacheng Zhang, Andrew Owens

PDF

Generative Action Description Prompts for Skeleton-Based Action Recognition Wangmeng Xiang, Chao Li, Yuxuan Zhou, Biao Wang, Lei Zhang

PDF

Generative Gradient Inversion via Over-Parameterized Networks in Federated Learning Chi Zhang, Zhang Xiaoman, Ekanut Sotthiwat, Yanyu Xu, Ping Liu, Liangli Zhen, Yong Liu

PDF

Generative Multiplane Neural Radiance for 3D-Aware Image Generation Amandeep Kumar, Ankan Kumar Bhunia, Sanath Narayan, Hisham Cholakkal, Rao Muhammad Anwer, Salman Khan, Ming-Hsuan Yang, Fahad Shahbaz Khan

PDF

Generative Novel View Synthesis with 3D-Aware Diffusion Models Eric R. Chan, Koki Nagano, Matthew A. Chan, Alexander W. Bergman, Jeong Joon Park, Axel Levy, Miika Aittala, Shalini De Mello, Tero Karras, Gordon Wetzstein

PDF

Generative Prompt Model for Weakly Supervised Object Localization Yuzhong Zhao, Qixiang Ye, Weijia Wu, Chunhua Shen, Fang Wan

PDF

Geometric Viewpoint Learning with Hyper-Rays and Harmonics Encoding Zhixiang Min, Juan Carlos Dibene, Enrique Dunn

PDF

Geometrized Transformer for Self-Supervised Homography Estimation Jiazhen Liu, Xirong Li

PDF

Geometry-Guided Feature Learning and Fusion for Indoor Scene Reconstruction Ruihong Yin, Sezer Karaoglu, Theo Gevers

PDF

GeoMIM: Towards Better 3D Knowledge Transfer via Masked Image Modeling for Multi-View 3D Understanding Jihao Liu, Tai Wang, Boxiao Liu, Qihang Zhang, Yu Liu, Hongsheng Li

PDF

GeoUDF: Surface Reconstruction from 3D Point Clouds via Geometry-Guided Distance Representation Siyu Ren, Junhui Hou, Xiaodong Chen, Ying He, Wenping Wang

PDF

GePSAn: Generative Procedure Step Anticipation in Cooking Videos Mohamed A. Abdelsalam, Samrudhdhi B. Rangrej, Isma Hadji, Nikita Dvornik, Konstantinos G. Derpanis, Afsaneh Fazly

PDF

Get the Best of Both Worlds: Improving Accuracy and Transferability by Grassmann Class Representation Haoqi Wang, Zhizhong Li, Wayne Zhang

PDF

GeT: Generative Target Structure Debiasing for Domain Adaptation Can Zhang, Gim Hee Lee

PDF

GET: Group Event Transformer for Event-Based Vision Yansong Peng, Yueyi Zhang, Zhiwei Xiong, Xiaoyan Sun, Feng Wu

PDF

Get3DHuman: Lifting StyleGAN-Human into a 3D Generative Model Using Pixel-Aligned Reconstruction Priors Zhangyang Xiong, Di Kang, Derong Jin, Weikai Chen, Linchao Bao, Shuguang Cui, Xiaoguang Han

PDF

GETAvatar: Generative Textured Meshes for Animatable Human Avatars Xuanmeng Zhang, Jianfeng Zhang, Rohan Chacko, Hongyi Xu, Guoxian Song, Yi Yang, Jiashi Feng

PDF

GIFD: A Generative Gradient Inversion Method with Feature Domain Optimization Hao Fang, Bin Chen, Xuan Wang, Zhi Wang, Shu-Tao Xia

PDF

GLA-GCN: Global-Local Adaptive Graph Convolutional Network for 3D Human Pose Estimation from Monocular Video Bruce X.B. Yu, Zhi Zhang, Yongxu Liu, Sheng-hua Zhong, Yan Liu, Chang Wen Chen

PDF

Global Adaptation Meets Local Generalization: Unsupervised Domain Adaptation for 3D Human Pose Estimation Wenhao Chai, Zhongyu Jiang, Jenq-Neng Hwang, Gaoang Wang

PDF

Global Balanced Experts for Federated Long-Tailed Learning Yaopei Zeng, Lei Liu, Li Liu, Li Shen, Shaoguo Liu, Baoyuan Wu

PDF

Global Features Are All You Need for Image Retrieval and Reranking Shihao Shao, Kaifeng Chen, Arjun Karpur, Qinghua Cui, André Araujo, Bingyi Cao

PDF

Global Knowledge Calibration for Fast Open-Vocabulary Segmentation Kunyang Han, Yong Liu, Jun Hao Liew, Henghui Ding, Jiajun Liu, Yitong Wang, Yansong Tang, Yujiu Yang, Jiashi Feng, Yao Zhao, Yunchao Wei

PDF

Global Perception Based Autoregressive Neural Processes Jinyang Tai

PDF

GlobalMapper: Arbitrary-Shaped Urban Layout Generation Liu He, Daniel Aliaga

PDF

Gloss-Free Sign Language Translation: Improving from Visual-Language Pretraining Benjia Zhou, Zhigang Chen, Albert Clapés, Jun Wan, Yanyan Liang, Sergio Escalera, Zhen Lei, Du Zhang

PDF

GlowGAN: Unsupervised Learning of HDR Images from LDR Images in the Wild Chao Wang, Ana Serrano, Xingang Pan, Bin Chen, Karol Myszkowski, Hans-Peter Seidel, Christian Theobalt, Thomas Leimkühler

PDF

GlueGen: Plug and Play Multi-Modal Encoders for X-to-Image Generation Can Qin, Ning Yu, Chen Xing, Shu Zhang, Zeyuan Chen, Stefano Ermon, Yun Fu, Caiming Xiong, Ran Xu

PDF

GlueStick: Robust Image Matching by Sticking Points and Lines Together Rémi Pautrat, Iago Suárez, Yifan Yu, Marc Pollefeys, Viktor Larsson

PDF

GO-SLAM: Global Optimization for Consistent 3D Instant Reconstruction Youmin Zhang, Fabio Tosi, Stefano Mattoccia, Matteo Poggi

PDF

Going Beyond Nouns with Vision & Language Models Using Synthetic Data Paola Cascante-Bonilla, Khaled Shehada, James Seale Smith, Sivan Doveh, Donghyun Kim, Rameswar Panda, Gul Varol, Aude Oliva, Vicente Ordonez, Rogerio Feris, Leonid Karlinsky

PDF

Going Denser with Open-Vocabulary Part Segmentation Peize Sun, Shoufa Chen, Chenchen Zhu, Fanyi Xiao, Ping Luo, Saining Xie, Zhicheng Yan

PDF

GPA-3D: Geometry-Aware Prototype Alignment for Unsupervised Domain Adaptive 3D Object Detection from Point Clouds Ziyu Li, Jingming Guo, Tongtong Cao, Liu Bingbing, Wankou Yang

PDF

GPFL: Simultaneously Learning Global and Personalized Feature Information for Personalized Federated Learning Jianqing Zhang, Yang Hua, Hao Wang, Tao Song, Zhengui Xue, Ruhui Ma, Jian Cao, Haibing Guan

PDF

GPGait: Generalized Pose-Based Gait Recognition Yang Fu, Shibei Meng, Saihui Hou, Xuecai Hu, Yongzhen Huang

PDF

Gradient-Based Sampling for Class Imbalanced Semi-Supervised Object Detection Jiaming Li, Xiangru Lin, Wei Zhang, Xiao Tan, Yingying Li, Junyu Han, Errui Ding, Jingdong Wang, Guanbin Li

PDF

Gradient-Regulated Meta-Prompt Learning for Generalizable Vision-Language Models Juncheng Li, Minghe Gao, Longhui Wei, Siliang Tang, Wenqiao Zhang, Mengze Li, Wei Ji, Qi Tian, Tat-Seng Chua, Yueting Zhuang

PDF

Gram-Based Attentive Neural Ordinary Differential Equations Network for Video Nystagmography Classification Xihe Qiu, Shaojie Shi, Xiaoyu Tan, Chao Qu, Zhijun Fang, Hailing Wang, Yongbin Gao, Peixia Wu, Huawei Li

PDF

GRAM-HD: 3D-Consistent Image Generation at High Resolution with Generative Radiance Manifolds Jianfeng Xiang, Jiaolong Yang, Yu Deng, Xin Tong

PDF

Gramian Attention Heads Are Strong yet Efficient Vision Learners Jongbin Ryu, Dongyoon Han, Jongwoo Lim

PDF

Graph Matching with Bi-Level Noisy Correspondence Yijie Lin, Mouxing Yang, Jun Yu, Peng Hu, Changqing Zhang, Xi Peng

PDF

GraphAlign: Enhancing Accurate Feature Alignment by Graph Matching for Multi-Modal 3D Object Detection Ziying Song, Haiyue Wei, Lin Bai, Lei Yang, Caiyan Jia

PDF

GraphEcho: Graph-Driven Unsupervised Domain Adaptation for Echocardiogram Video Segmentation Jiewen Yang, Xinpeng Ding, Ziyang Zheng, Xiaowei Xu, Xiaomeng Li

PDF

Graphics2RAW: Mapping Computer Graphics Images to Sensor RAW Images Donghwan Seo, Abhijith Punnappurath, Luxi Zhao, Abdelrahman Abdelhamed, Sai Kiran Tedla, Sanguk Park, Jihwan Choe, Michael S. Brown

PDF

GridMM: Grid Memory mAP for Vision-and-Language Navigation Zihan Wang, Xiangyang Li, Jiahao Yang, Yeqi Liu, Shuqiang Jiang

PDF

GridPull: Towards Scalability in Learning Implicit Representations from 3D Point Clouds Chao Chen, Yu-Shen Liu, Zhizhong Han

PDF

Grounded Entity-Landmark Adaptive Pre-Training for Vision-and-Language Navigation Yibo Cui, Liang Xie, Yakun Zhang, Meishan Zhang, Ye Yan, Erwei Yin

PDF

Grounded Image Text Matching with Mismatched Relation Reasoning Yu Wu, Yana Wei, Haozhe Wang, Yongfei Liu, Sibei Yang, Xuming He

PDF

Grounding 3D Object Affordance from 2D Interactions in Images Yuhang Yang, Wei Zhai, Hongchen Luo, Yang Cao, Jiebo Luo, Zheng-Jun Zha

PDF

Group DETR: Fast DETR Training with Group-Wise One-to-Many Assignment Qiang Chen, Xiaokang Chen, Jian Wang, Shan Zhang, Kun Yao, Haocheng Feng, Junyu Han, Errui Ding, Gang Zeng, Jingdong Wang

PDF

Group Pose: A Simple Baseline for End-to-End Multi-Person Pose Estimation Huan Liu, Qiang Chen, Zichang Tan, Jiang-Jiang Liu, Jian Wang, Xiangbo Su, Xiaolong Li, Kun Yao, Junyu Han, Errui Ding, Yao Zhao, Jingdong Wang

PDF

GrowCLIP: Data-Aware Automatic Model Growing for Large-Scale Contrastive Language-Image Pre-Training Xinchi Deng, Han Shi, Runhui Huang, Changlin Li, Hang Xu, Jianhua Han, James Kwok, Shen Zhao, Wei Zhang, Xiaodan Liang

PDF

Growing a Brain with Sparsity-Inducing Generation for Continual Learning Hyundong Jin, Gyeong-hyeon Kim, Chanho Ahn, Eunwoo Kim

PDF

Guided Motion Diffusion for Controllable Human Motion Synthesis Korrawe Karunratanakul, Konpat Preechakul, Supasorn Suwajanakorn, Siyu Tang

PDF

Guiding Image Captioning Models Toward More Specific Captions Simon Kornblith, Lala Li, Zirui Wang, Thao Nguyen

PDF

Guiding Local Feature Matching with Surface Curvature Shuzhe Wang, Juho Kannala, Marc Pollefeys, Daniel Barath

PDF

H3WB: Human3.6M 3D WholeBody Dataset and Benchmark Yue Zhu, Nermin Samet, David Picard

PDF

HairCLIPv2: Unifying Hair Editing via Proxy Feature Blending Tianyi Wei, Dongdong Chen, Wenbo Zhou, Jing Liao, Weiming Zhang, Gang Hua, Nenghai Yu

PDF

HairNeRF: Geometry-Aware Image Synthesis for Hairstyle Transfer Seunggyu Chang, Gihoon Kim, Hayeon Kim

PDF

HAL3D: Hierarchical Active Learning for Fine-Grained 3D Part Labeling Fenggen Yu, Yiming Qian, Francisca Gil-Ureta, Brian Jackson, Eric Bennett, Hao Zhang

PDF

Hallucination Improves the Performance of Unsupervised Visual Representation Learning Jing Wu, Jennifer Hobbs, Naira Hovakimyan

PDF

HaMuCo: Hand Pose Estimation via Multiview Collaborative Self-Supervised Learning Xiaozheng Zheng, Chao Wen, Zhou Xue, Pengfei Ren, Jingyu Wang

PDF

HandR2N2: Iterative 3D Hand Pose Estimation Using a Residual Recurrent Neural Network Wencan Cheng, Jong Hwan Ko

PDF

Handwritten and Printed Text Segmentation: A Signature Case Study Sina Gholamian, Ali Vahdat

PDF

Hard No-Box Adversarial Attack on Skeleton-Based Human Action Recognition with Skeleton-Motion-Informed Gradient Zhengzhi Lu, He Wang, Ziyi Chang, Guoan Yang, Hubert P. H. Shum

PDF

Harnessing the Spatial-Temporal Attention of Diffusion Models for High-Fidelity Text-to-Image Synthesis Qiucheng Wu, Yujian Liu, Handong Zhao, Trung Bui, Zhe Lin, Yang Zhang, Shiyu Chang

PDF

Harvard Glaucoma Detection and Progression: A Multimodal Multitask Dataset and Generalization-Reinforced Semi-Supervised Learning Yan Luo, Min Shi, Yu Tian, Tobias Elze, Mengyu Wang

PDF

Hashing Neural Video Decomposition with Multiplicative Residuals in Space-Time Cheng-Hung Chan, Cheng-Yang Yuan, Cheng Sun, Hwann-Tzong Chen

PDF

HDG-ODE: A Hierarchical Continuous-Time Model for Human Pose Forecasting Yucheng Xing, Xin Wang

PDF

Helping Hands: An Object-Aware Ego-Centric Video Recognition Model Chuhan Zhang, Ankush Gupta, Andrew Zisserman

PDF

Heterogeneous Diversity Driven Active Learning for Multi-Object Tracking Rui Li, Baopeng Zhang, Jun Liu, Wei Liu, Jian Zhao, Zhu Teng

PDF

Heterogeneous Forgetting Compensation for Class-Incremental Learning Jiahua Dong, Wenqi Liang, Yang Cong, Gan Sun

PDF

Hidden Biases of End-to-End Driving Models Bernhard Jaeger, Kashyap Chitta, Andreas Geiger

PDF

Hiding Visual Information via Obfuscating Adversarial Perturbations Zhigang Su, Dawei Zhou, Nannan Wang, Decheng Liu, Zhen Wang, Xinbo Gao

PDF

Hierarchical Contrastive Learning for Pattern-Generalizable Image Corruption Detection Xin Feng, Yifeng Xu, Guangming Lu, Wenjie Pei

PDF

Hierarchical Generation of Human-Object Interactions with Diffusion Probabilistic Models Huaijin Pi, Sida Peng, Minghui Yang, Xiaowei Zhou, Hujun Bao

PDF

Hierarchical Point-Based Active Learning for Semi-Supervised Point Cloud Semantic Segmentation Zongyi Xu, Bo Yuan, Shanshan Zhao, Qianni Zhang, Xinbo Gao

PDF

Hierarchical Prior Mining for Non-Local Multi-View Stereo Chunlin Ren, Qingshan Xu, Shikun Zhang, Jiaqi Yang

PDF

Hierarchical Spatio-Temporal Representation Learning for Gait Recognition Lei Wang, Bo Liu, Fangfang Liang, Bincheng Wang

PDF

Hierarchical Visual Categories Modeling: A Joint Representation Learning and Density Estimation Framework for Out-of-Distribution Detection Jinglun Li, Xinyu Zhou, Pinxue Guo, Yixuan Sun, Yiwen Huang, Weifeng Ge, Wenqiang Zhang

PDF

Hierarchical Visual Primitive Experts for Compositional Zero-Shot Learning Hanjae Kim, Jiyoung Lee, Seongheon Park, Kwanghoon Sohn

PDF

Hierarchically Decomposed Graph Convolutional Networks for Skeleton-Based Action Recognition Jungho Lee, Minhyeok Lee, Dogyoon Lee, Sangyoun Lee

PDF

HiFace: High-Fidelity 3D Face Reconstruction by Learning Static and Dynamic Details Zenghao Chai, Tianke Zhang, Tianyu He, Xu Tan, Tadas Baltrusaitis, HsiangTao Wu, Runnan Li, Sheng Zhao, Chun Yuan, Jiang Bian

PDF

High Quality Entity Segmentation Lu Qi, Jason Kuen, Tiancheng Shen, Jiuxiang Gu, Wenbo Li, Weidong Guo, Jiaya Jia, Zhe Lin, Ming-Hsuan Yang

PDF

High-Resolution Document Shadow Removal via a Large-Scale Real-World Dataset and a Frequency-Aware Shadow Erasing Net Zinuo Li, Xuhang Chen, Chi-Man Pun, Xiaodong Cun

PDF

HiLo: Exploiting High Low Frequency Relations for Unbiased Panoptic Scene Graph Generation Zijian Zhou, Miaojing Shi, Holger Caesar

PDF

HiTeA: Hierarchical Temporal-Aware Video-Language Pre-Training Qinghao Ye, Guohai Xu, Ming Yan, Haiyang Xu, Qi Qian, Ji Zhang, Fei Huang

PDF

HiVLP: Hierarchical Interactive Video-Language Pre-Training Bin Shao, Jianzhuang Liu, Renjing Pei, Songcen Xu, Peng Dai, Juwei Lu, Weimian Li, Youliang Yan

PDF

HM-ViT: Hetero-Modal Vehicle-to-Vehicle Cooperative Perception with Vision Transformer Hao Xiang, Runsheng Xu, Jiaqi Ma

PDF

HMD-NeMo: Online 3D Avatar Motion Generation from Sparse Observations Sadegh Aliakbarian, Fatemeh Saleh, David Collier, Pashmina Cameron, Darren Cosker

PDF

Holistic Geometric Feature Learning for Structured Reconstruction Ziqiong Lu, Linxi Huan, Qiyuan Ma, Xianwei Zheng

PDF

Holistic Label Correction for Noisy Multi-Label Classification Xiaobo Xia, Jiankang Deng, Wei Bao, Yuxuan Du, Bo Han, Shiguang Shan, Tongliang Liu

PDF

HollowNeRF: Pruning Hashgrid-Based NeRFs with Trainable Collision Mitigation Xiufeng Xie, Riccardo Gherardi, Zhihong Pan, Stephen Huang

PDF

HoloAssist: An Egocentric Human Interaction Dataset for Interactive AI Assistants in the Real World Xin Wang, Taein Kwon, Mahdi Rad, Bowen Pan, Ishani Chakraborty, Sean Andrist, Dan Bohus, Ashley Feniello, Bugra Tekin, Felipe Vieira Frujeri, Neel Joshi, Marc Pollefeys

PDF

HoloFusion: Towards Photo-Realistic 3D Generative Modeling Animesh Karnewar, Niloy J. Mitra, Andrea Vedaldi, David Novotny

PDF

Homeomorphism Alignment for Unsupervised Domain Adaptation Lihua Zhou, Mao Ye, Xiatian Zhu, Siying Xiao, Xu-Qian Fan, Ferrante Neri

PDF

Homography Guided Temporal Fusion for Road Line and Marking Segmentation Shan Wang, Chuong Nguyen, Jiawei Liu, Kaihao Zhang, Wenhan Luo, Yanhao Zhang, Sundaram Muthu, Fahira Afzal Maken, Hongdong Li

PDF

HopFIR: Hop-Wise GraphFormer with Intragroup Joint Refinement for 3D Human Pose Estimation Kai Zhai, Qiang Nie, Bo Ouyang, Xiang Li, Shanlin Yang

PDF

HOSNeRF: Dynamic Human-Object-Scene Neural Radiance Fields from a Single Video Jia-Wei Liu, Yan-Pei Cao, Tianyuan Yang, Zhongcong Xu, Jussi Keppo, Ying Shan, Xiaohu Qie, Mike Zheng Shou

PDF

Householder Projector for Unsupervised Latent Semantics Discovery Yue Song, Jichao Zhang, Nicu Sebe, Wei Wang

PDF

How Far Pre-Trained Models Are from Neural Collapse on the Target Dataset Informs Their Transferability Zijian Wang, Yadan Luo, Liang Zheng, Zi Huang, Mahsa Baktashmotlagh

PDF

How Much Temporal Long-Term Context Is Needed for Action Segmentation? Emad Bahrami, Gianpiero Francesca, Juergen Gall

PDF

How to Boost Face Recognition with StyleGAN? Artem Sevastopolskiy, Yury Malkov, Nikita Durasov, Luisa Verdoliva, Matthias Nießner

PDF

How to Choose Your Best Allies for a Transferable Attack? Thibault Maho, Seyed-Mohsen Moosavi-Dezfooli, Teddy Furon

PDF

HRS-Bench: Holistic, Reliable and Scalable Benchmark for Text-to-Image Models Eslam Mohamed Bakr, Pengzhan Sun, Xiaoqian Shen, Faizan Farooq Khan, Li Erran Li, Mohamed Elhoseiny

PDF

HSE: Hybrid Species Embedding for Deep Metric Learning Bailin Yang, Haoqiang Sun, Frederick W. B. Li, Zheng Chen, Jianlu Cai, Chao Song

PDF

HSR-Diff: Hyperspectral Image Super-Resolution via Conditional Diffusion Models Chanyue Wu, Dong Wang, Yunpeng Bai, Hanyu Mao, Ying Li, Qiang Shen

PDF

HTML: Hybrid Temporal-Scale Multimodal Learning Framework for Referring Video Object Segmentation Mingfei Han, Yali Wang, Zhihui Li, Lina Yao, Xiaojun Chang, Yu Qiao

PDF

Human from Blur: Human Pose Tracking from Blurry Images Yiming Zhao, Denys Rozumnyi, Jie Song, Otmar Hilliges, Marc Pollefeys, Martin R. Oswald

PDF

Human Part-Wise 3D Motion Context Learning for Sign Language Recognition Taeryung Lee, Yeonguk Oh, Kyoung Mu Lee

PDF

Human Preference Score: Better Aligning Text-to-Image Models with Human Preference Xiaoshi Wu, Keqiang Sun, Feng Zhu, Rui Zhao, Hongsheng Li

PDF

Human-Centric Scene Understanding for 3D Large-Scale Scenarios Yiteng Xu, Peishan Cong, Yichen Yao, Runnan Chen, Yuenan Hou, Xinge Zhu, Xuming He, Jingyi Yu, Yuexin Ma

PDF

Human-Inspired Facial Sketch Synthesis with Dynamic Adaptation Fei Gao, Yifan Zhu, Chang Jiang, Nannan Wang

PDF

HumanMAC: Masked Motion Completion for Human Motion Prediction Ling-Hao Chen, JiaWei Zhang, Yewen Li, Yiren Pang, Xiaobo Xia, Tongliang Liu

PDF

Humans in 4D: Reconstructing and Tracking Humans with Transformers Shubham Goel, Georgios Pavlakos, Jathushan Rajasegaran, Angjoo Kanazawa, Jitendra Malik

PDF

HumanSD: A Native Skeleton-Guided Diffusion Model for Human Image Generation Xuan Ju, Ailing Zeng, Chenchen Zhao, Jianan Wang, Lei Zhang, Qiang Xu

PDF

Hybrid Spectral Denoising Transformer with Guided Attention Zeqiang Lai, Chenggang Yan, Ying Fu

PDF

HybridAugment++: Unified Frequency Spectra Perturbations for Model Robustness Mehmet Kerim Yucel, Ramazan Gokberk Cinbis, Pinar Duygulu

PDF

Hyperbolic Audio-Visual Zero-Shot Learning Jie Hong, Zeeshan Hayder, Junlin Han, Pengfei Fang, Mehrtash Harandi, Lars Petersson

PDF

Hyperbolic Chamfer Distance for Point Cloud Completion Fangzhou Lin, Yun Yue, Songlin Hou, Xuechu Yu, Yajun Xu, Kazunori D Yamada, Ziming Zhang

PDF

HyperDiffusion: Generating Implicit Neural Fields with Weight-Space Diffusion Ziya Erkoç, Fangchang Ma, Qi Shan, Matthias Nießner, Angela Dai

PDF

HyperReenact: One-Shot Reenactment via Jointly Learning to Refine and Retarget Faces Stella Bounareli, Christos Tzelepis, Vasileios Argyriou, Ioannis Patras, Georgios Tzimiropoulos

PDF

I Can't Believe There's No Images! Learning Visual Tasks Using Only Language Supervision Sophia Gu, Christopher Clark, Aniruddha Kembhavi

PDF

I-ViT: Integer-Only Quantization for Efficient Vision Transformer Inference Zhikai Li, Qingyi Gu

PDF

ICD-Face: Intra-Class Compactness Distillation for Face Recognition Zhipeng Yu, Jiaheng Liu, Haoyu Qin, Yichao Wu, Kun Hu, Jiayi Tian, Ding Liang

PDF

ICE-NeRF: Interactive Color Editing of NeRFs via Decomposition-Aware Weight Optimization Jae-Hyeok Lee, Dae-Shik Kim

PDF

ICICLE: Interpretable Class Incremental Continual Learning Dawid Rymarczyk, Joost van de Weijer, Bartosz Zieliński, Bartlomiej Twardowski

PDF

ICL-D3IE: In-Context Learning with Diverse Demonstrations Updating for Document Information Extraction Jiabang He, Lei Wang, Yi Hu, Ning Liu, Hui Liu, Xing Xu, Heng Tao Shen

PDF

iDAG: Invariant DAG Searching for Domain Generalization Zenan Huang, Haobo Wang, Junbo Zhao, Nenggan Zheng

PDF

Identification of Systematic Errors of Image Classifiers on Rare Subgroups Jan Hendrik Metzen, Robin Hutmacher, N. Grace Hua, Valentyn Boreiko, Dan Zhang

PDF

Identity-Consistent Aggregation for Video Object Detection Chaorui Deng, Da Chen, Qi Wu

PDF

Identity-Seeking Self-Supervised Representation Learning for Generalizable Person Re-Identification Zhaopeng Dou, Zhongdao Wang, Yali Li, Shengjin Wang

PDF

IDiff-Face: Synthetic-Based Face Recognition Through Fizzy Identity-Conditioned Diffusion Model Fadi Boutros, Jonas Henry Grebe, Arjan Kuijper, Naser Damer

PDF

IHNet: Iterative Hierarchical Network Guided by High-Resolution Estimated Information for Scene Flow Estimation Yun Wang, Cheng Chi, Min Lin, Xin Yang

PDF

IIEU: Rethinking Neural Feature Activation from Decision-Making Sudong Cai

PDF

Image-Free Classifier Injection for Zero-Shot Classification Anders Christensen, Massimiliano Mancini, A. Sophia Koepke, Ole Winther, Zeynep Akata

PDF

ImbSAM: A Closer Look at Sharpness-Aware Minimization in Class-Imbalanced Recognition Yixuan Zhou, Yi Qu, Xing Xu, Hengtao Shen

PDF

ImGeoNet: Image-Induced Geometry-Aware Voxel Representation for Multi-View 3D Object Detection Tao Tu, Shun-Po Chuang, Yu-Lun Liu, Cheng Sun, Ke Zhang, Donna Roy, Cheng-Hao Kuo, Min Sun

PDF

Imitator: Personalized Speech-Driven 3D Facial Animation Balamurugan Thambiraja, Ikhsanul Habibie, Sadegh Aliakbarian, Darren Cosker, Christian Theobalt, Justus Thies

PDF

Implicit Autoencoder for Point-Cloud Self-Supervised Representation Learning Siming Yan, Zhenpei Yang, Haoxiang Li, Chen Song, Li Guan, Hao Kang, Gang Hua, Qixing Huang

PDF

Implicit Identity Representation Conditioned Memory Compensation Network for Talking Head Video Generation Fa-Ting Hong, Dan Xu

PDF

Implicit Neural Representation for Cooperative Low-Light Image Enhancement Shuzhou Yang, Moxuan Ding, Yanmin Wu, Zihan Li, Jian Zhang

PDF

Implicit Temporal Modeling with Learnable Alignment for Video Recognition Shuyuan Tu, Qi Dai, Zuxuan Wu, Zhi-Qi Cheng, Han Hu, Yu-Gang Jiang

PDF

Improved Knowledge Transfer for Semi-Supervised Domain Adaptation via Trico Training Strategy Ba Hung Ngo, Yeon Jeong Chae, Jung Eun Kwon, Jae Hyeon Park, Sung In Cho

PDF

Improved Visual Fine-Tuning with Natural Language Supervision Junyang Wang, Yuanhong Xu, Juhua Hu, Ming Yan, Jitao Sang, Qi Qian

PDF

Improving 3D Imaging with Pre-Trained Perpendicular 2D Diffusion Models Suhyeon Lee, Hyungjin Chung, Minyoung Park, Jonghyuk Park, Wi-Sun Ryu, Jong Chul Ye

PDF

Improving Adversarial Robustness of Masked Autoencoders via Test-Time Frequency-Domain Prompting Qidong Huang, Xiaoyi Dong, Dongdong Chen, Yinpeng Chen, Lu Yuan, Gang Hua, Weiming Zhang, Nenghai Yu

PDF

Improving CLIP Fine-Tuning Performance Yixuan Wei, Han Hu, Zhenda Xie, Ze Liu, Zheng Zhang, Yue Cao, Jianmin Bao, Dong Chen, Baining Guo

PDF

Improving Continuous Sign Language Recognition with Cross-Lingual Signs Fangyun Wei, Yutong Chen

PDF

Improving Diversity in Zero-Shot GAN Adaptation with Semantic Variations Seogkyu Jeon, Bei Liu, Pilhyeon Lee, Kibeom Hong, Jianlong Fu, Hyeran Byun

PDF

Improving Equivariance in State-of-the-Art Supervised Depth and Normal Predictors Yuanyi Zhong, Anand Bhattad, Yu-Xiong Wang, David Forsyth

PDF

Improving Generalization in Visual Reinforcement Learning via Conflict-Aware Gradient Agreement Augmentation Siao Liu, Zhaoyu Chen, Yang Liu, Yuzheng Wang, Dingkang Yang, Zhile Zhao, Ziqing Zhou, Xie Yi, Wei Li, Wenqiang Zhang, Zhongxue Gan

PDF

Improving Generalization of Adversarial Training via Robust Critical Fine-Tuning Kaijie Zhu, Xixu Hu, Jindong Wang, Xing Xie, Ge Yang

PDF

Improving Lens Flare Removal with General-Purpose Pipeline and Multiple Light Sources Recovery Yuyan Zhou, Dong Liang, Songcan Chen, Sheng-Jun Huang, Shuo Yang, Chongyi Li

PDF

Improving Online Lane Graph Extraction by Object-Lane Clustering Yigit Baran Can, Alexander Liniger, Danda Pani Paudel, Luc Van Gool

PDF

Improving Pixel-Based MIM by Reducing Wasted Modeling Capability Yuan Liu, Songyang Zhang, Jiacheng Chen, Zhaohui Yu, Kai Chen, Dahua Lin

PDF

Improving Representation Learning for Histopathologic Images with Cluster Constraints Weiyi Wu, Chongyang Gao, Joseph DiPalma, Soroush Vosoughi, Saeed Hassanpour

PDF

Improving Sample Quality of Diffusion Models Using Self-Attention Guidance Susung Hong, Gyuseong Lee, Wooseok Jang, Seungryong Kim

PDF

Improving Transformer-Based Image Matching by Cascaded Capturing Spatially Informative Keypoints Chenjie Cao, Yanwei Fu

PDF

Improving Unsupervised Visual Program Inference with Code Rewriting Families Aditya Ganeshan, R. Kenny Jones, Daniel Ritchie

PDF

In-Style: Bridging Text and Uncurated Videos with Style Transfer for Text-Video Retrieval Nina Shvetsova, Anna Kukleva, Bernt Schiele, Hilde Kuehne

PDF

Incremental Generalized Category Discovery Bingchen Zhao, Oisin Mac Aodha

PDF

Indoor Depth Recovery Based on Deep Unfolding with Non-Local Prior Yuhui Dai, Junkang Zhang, Faming Fang, Guixu Zhang

PDF

Inducing Neural Collapse to a Fixed Hierarchy-Aware Frame for Reducing Mistake Severity Tong Liang, Jim Davis

PDF

InfiniCity: Infinite-Scale City Synthesis Chieh Hubert Lin, Hsin-Ying Lee, Willi Menapace, Menglei Chai, Aliaksandr Siarohin, Ming-Hsuan Yang, Sergey Tulyakov

PDF

Informative Data Mining for One-Shot Cross-Domain Semantic Segmentation Yuxi Wang, Jian Liang, Jun Xiao, Shuqi Mei, Yuran Yang, Zhaoxiang Zhang

PDF

Inherent Redundancy in Spiking Neural Networks Man Yao, Jiakui Hu, Guangshe Zhao, Yaoyuan Wang, Ziyang Zhang, Bo Xu, Guoqi Li

PDF

Innovating Real Fisheye Image Correction with Dual Diffusion Architecture Shangrong Yang, Chunyu Lin, Kang Liao, Yao Zhao

PDF

Inspecting the Geographical Representativeness of Images from Text-to-Image Models Abhipsa Basu, R. Venkatesh Babu, Danish Pruthi

PDF

INSTA-BNN: Binary Neural Network with INSTAnce-Aware Threshold Changhun Lee, Hyungjun Kim, Eunhyeok Park, Jae-Joon Kim

PDF

Instance and Category Supervision Are Alternate Learners for Continual Learning Xudong Tian, Zhizhong Zhang, Xin Tan, Jun Liu, Chengjie Wang, Yanyun Qu, Guannan Jiang, Yuan Xie

PDF

Instance Neural Radiance Field Yichen Liu, Benran Hu, Junkai Huang, Yu-Wing Tai, Chi-Keung Tang

PDF

Instance-Aware Dynamic Prompt Tuning for Pre-Trained Point Cloud Models Yaohua Zha, Jinpeng Wang, Tao Dai, Bin Chen, Zhi Wang, Shu-Tao Xia

PDF

Instruct-NeRF2NeRF: Editing 3D Scenes with Instructions Ayaan Haque, Matthew Tancik, Alexei A. Efros, Aleksander Holynski, Angjoo Kanazawa

PDF

INT2: Interactive Trajectory Prediction at Intersections Zhijie Yan, Pengfei Li, Zheng Fu, Shaocong Xu, Yongliang Shi, Xiaoxue Chen, Yuhang Zheng, Yang Li, Tianyu Liu, Chuxuan Li, Nairui Luo, Xu Gao, Yilun Chen, Zuoxu Wang, Yifeng Shi, Pengfei Huang, Zhengxiao Han, Jirui Yuan, Jiangtao Gong, Guyue Zhou, Hang Zhao, Hao Zhao

PDF

Integrally Migrating Pre-Trained Transformer Encoder-Decoders for Visual Object Detection Feng Liu, Xiaosong Zhang, Zhiliang Peng, Zonghao Guo, Fang Wan, Xiangyang Ji, Qixiang Ye

PDF

Integrating Boxes and Masks: A Multi-Object Framework for Unified Visual Tracking and Segmentation Yuanyou Xu, Zongxin Yang, Yi Yang

PDF

IntentQA: Context-Aware Video Intent Reasoning Jiapeng Li, Ping Wei, Wenjuan Han, Lifeng Fan

PDF

Inter-Realization Channels: Unsupervised Anomaly Detection Beyond One-Class Classification Declan McIntosh, Alexandra Branzan Albu

PDF

Interaction-Aware Joint Attention Estimation Using People Attributes Chihiro Nakatani, Hiroaki Kawashima, Norimichi Ukita

PDF

Interactive Class-Agnostic Object Counting Yifeng Huang, Viresh Ranjan, Minh Hoai

PDF

InterDiff: Generating 3D Human-Object Interactions with Physics-Informed Diffusion Sirui Xu, Zhengyuan Li, Yu-Xiong Wang, Liang-Yan Gui

PDF

InterFormer: Real-Time Interactive Image Segmentation You Huang, Hao Yang, Ke Sun, Shengchuan Zhang, Liujuan Cao, Guannan Jiang, Rongrong Ji

PDF

IntrinsicNeRF: Learning Intrinsic Neural Radiance Fields for Editable Novel View Synthesis Weicai Ye, Shuo Chen, Chong Bao, Hujun Bao, Marc Pollefeys, Zhaopeng Cui, Guofeng Zhang

PDF

Introducing Language Guidance in Prompt-Based Continual Learning Muhammad Gul Zain Ali Khan, Muhammad Ferjad Naeem, Luc Van Gool, Didier Stricker, Federico Tombari, Muhammad Zeshan Afzal

PDF

Invariant Feature Regularization for Fair Face Recognition Jiali Ma, Zhongqi Yue, Kagaya Tomoyuki, Suzuki Tomoki, Karlekar Jayashree, Sugiri Pranata, Hanwang Zhang

PDF

Invariant Training 2D-3D Joint Hard Samples for Few-Shot Point Cloud Recognition Xuanyu Yi, Jiajun Deng, Qianru Sun, Xian-Sheng Hua, Joo-Hwee Lim, Hanwang Zhang

PDF

Inverse Compositional Learning for Weakly-Supervised Relation Grounding Huan Li, Ping Wei, Zeyu Ma, Nanning Zheng

PDF

Inverse Problem Regularization with Hierarchical Variational Autoencoders Jean Prost, Antoine Houdard, Andrés Almansa, Nicolas Papadakis

PDF

IOMatch: Simplifying Open-Set Semi-Supervised Learning with Joint Inliers and Outliers Utilization Zekun Li, Lei Qi, Yinghuan Shi, Yang Gao

PDF

Is Imitation All You Need? Generalized Decision-Making with Dual-Phase Training Yao Wei, Yanchao Sun, Ruijie Zheng, Sai Vemprala, Rogerio Bonatti, Shuhang Chen, Ratnesh Madaan, Zhongjie Ba, Ashish Kapoor, Shuang Ma

PDF

Isomer: Isomerous Transformer for Zero-Shot Video Object Segmentation Yichen Yuan, Yifan Wang, Lijun Wang, Xiaoqi Zhao, Huchuan Lu, Yu Wang, Weibo Su, Lei Zhang

PDF

IST-Net: Prior-Free Category-Level Pose Estimation with Implicit Space Transformation Jianhui Liu, Yukang Chen, Xiaoqing Ye, Xiaojuan Qi

PDF

Iterative Denoiser and Noise Estimator for Self-Supervised Image Denoising Yunhao Zou, Chenggang Yan, Ying Fu

PDF

Iterative Prompt Learning for Unsupervised Backlit Image Enhancement Zhexin Liang, Chongyi Li, Shangchen Zhou, Ruicheng Feng, Chen Change Loy

PDF

Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution Jiamian Wang, Huan Wang, Yulun Zhang, Yun Fu, Zhiqiang Tao

PDF

Iterative Superquadric Recomposition of 3D Objects from Multiple Views Stephan Alaniz, Massimiliano Mancini, Zeynep Akata

PDF

ITI-GEN: Inclusive Text-to-Image Generation Cheng Zhang, Xuanbai Chen, Siqi Chai, Chen Henry Wu, Dmitry Lagun, Thabo Beeler, Fernando De la Torre

PDF

iVS-Net: Learning Human View Synthesis from Internet Videos Junting Dong, Qi Fang, Tianshuo Yang, Qing Shuai, Chengyu Qiao, Sida Peng

PDF

Joint Demosaicing and Deghosting of Time-Varying Exposures for Single-Shot HDR Imaging Jungwoo Kim, Min H. Kim

PDF

Joint Implicit Neural Representation for High-Fidelity and Compact Vector Fonts Chia-Hao Chen, Ying-Tian Liu, Zhifei Zhang, Yuan-Chen Guo, Song-Hai Zhang

PDF

Joint Metrics Matter: A Better Standard for Trajectory Forecasting Erica Weng, Hana Hoshino, Deva Ramanan, Kris Kitani

PDF

Joint-Relation Transformer for Multi-Person Motion Prediction Qingyao Xu, Weibo Mao, Jingze Gong, Chenxin Xu, Siheng Chen, Weidi Xie, Ya Zhang, Yanfeng Wang

PDF

JOTR: 3D Joint Contrastive Learning with Transformers for Occluded Human Mesh Recovery Jiahao Li, Zongxin Yang, Xiaohan Wang, Jianxin Ma, Chang Zhou, Yi Yang

PDF

Jumping Through Local Minima: Quantization in the Loss Landscape of Vision Transformers Natalia Frumkin, Dibakar Gope, Diana Marculescu

PDF

KECOR: Kernel Coding Rate Maximization for Active 3D Object Detection Yadan Luo, Zhuoxiao Chen, Zhen Fang, Zheng Zhang, Mahsa Baktashmotlagh, Zi Huang

PDF

Keep It SimPool: Who Said Supervised Transformers Suffer from Attention Deficit? Bill Psomas, Ioannis Kakogeorgiou, Konstantinos Karantzalos, Yannis Avrithis

PDF

Kick Back & Relax: Learning to Reconstruct the World by Watching SlowTV Jaime Spencer, Chris Russell, Simon Hadfield, Richard Bowden

PDF

Knowing Where to Focus: Event-Aware Transformer for Video Grounding Jinhyun Jang, Jungin Park, Jin Kim, Hyeongjun Kwon, Kwanghoon Sohn

PDF

Knowledge Proxy Intervention for Deconfounded Video Question Answering Jiangtong Li, Li Niu, Liqing Zhang

PDF

Knowledge Restore and Transfer for Multi-Label Class-Incremental Learning Songlin Dong, Haoyu Luo, Yuhang He, Xing Wei, Jie Cheng, Yihong Gong

PDF

Knowledge-Aware Federated Active Learning with Non-IID Data Yu-Tong Cao, Ye Shi, Baosheng Yu, Jingya Wang, Dacheng Tao

PDF

Knowledge-Aware Prompt Tuning for Generalizable Vision-Language Models Baoshuo Kan, Teng Wang, Wenpeng Lu, Xiantong Zhen, Weili Guan, Feng Zheng

PDF

Knowledge-Spreader: Learning Semi-Supervised Facial Action Dynamics by Consistifying Knowledge Granularity Xiaotian Li, Xiang Zhang, Taoyue Wang, Lijun Yin

PDF

L-DAWA: Layer-Wise Divergence Aware Weight Aggregation in Federated Self-Supervised Visual Representation Learning Yasar Abbas Ur Rehman, Yan Gao, Pedro Porto Buarque de Gusmao, Mina Alibeigi, Jiajun Shen, Nicholas D. Lane

PDF

LA-Net: Landmark-Aware Learning for Reliable Facial Expression Recognition Under Label Noise Zhiyu Wu, Jinshi Cui

PDF

Label Shift Adapter for Test-Time Adaptation Under Covariate and Label Shifts Sunghyun Park, Seunghan Yang, Jaegul Choo, Sungrack Yun

PDF

Label-Efficient Online Continual Object Detection in Streaming Video Jay Zhangjie Wu, David Junhao Zhang, Wynne Hsu, Mengmi Zhang, Mike Zheng Shou

PDF

Label-Free Event-Based Object Recognition via Joint Learning with Image Reconstruction from Events Hoonhee Cho, Hyeonseong Kim, Yujeong Chae, Kuk-Jin Yoon

PDF

Label-Guided Knowledge Distillation for Continual Semantic Segmentation on 2D Images and 3D Point Clouds Ze Yang, Ruibo Li, Evan Ling, Chi Zhang, Yiming Wang, Dezhao Huang, Keng Teck Ma, Minhoe Hur, Guosheng Lin

PDF

Label-Noise Learning with Intrinsically Long-Tailed Data Yang Lu, Yiliang Zhang, Bo Han, Yiu-ming Cheung, Hanzi Wang

PDF

LAC - Latent Action Composition for Skeleton-Based Action Segmentation Di Yang, Yaohui Wang, Antitza Dantcheva, Quan Kong, Lorenzo Garattoni, Gianpiero Francesca, Francois Bremond

PDF

LAN-HDR: Luminance-Based Alignment Network for High Dynamic Range Video Reconstruction Haesoo Chung, Nam Ik Cho

PDF

Landscape Learning for Neural Network Inversion Ruoshi Liu, Chengzhi Mao, Purva Tendulkar, Hao Wang, Carl Vondrick

PDF

LaPE: Layer-Adaptive Position Embedding for Vision Transformers with Independent Layer Normalization Runyi Yu, Zhennan Wang, Yinhuai Wang, Kehan Li, Chang Liu, Haoyi Duan, Xiangyang Ji, Jie Chen

PDF

Large Selective Kernel Network for Remote Sensing Object Detection Yuxuan Li, Qibin Hou, Zhaohui Zheng, Ming-Ming Cheng, Jian Yang, Xiang Li

PDF

Large-Scale Land Cover Mapping with Fine-Grained Classes via Class-Aware Semi-Supervised Semantic Segmentation Runmin Dong, Lichao Mou, Mengxuan Chen, Weijia Li, Xin-Yi Tong, Shuai Yuan, Lixian Zhang, Juepeng Zheng, Xiaoxiang Zhu, Haohuan Fu

PDF

Large-Scale Person Detection and Localization Using Overhead Fisheye Cameras Lu Yang, Liulei Li, Xueshi Xin, Yifan Sun, Qing Song, Wenguan Wang

PDF

LARS: A Diverse Panoptic Maritime Obstacle Detection Dataset and Benchmark Lojze Žust, Janez Perš, Matej Kristan

PDF

Late Stopping: Avoiding Confidently Learning from Mislabeled Examples Suqin Yuan, Lei Feng, Tongliang Liu

PDF

Latent-OFER: Detect, Mask, and Reconstruct with Latent Vectors for Occluded Facial Expression Recognition Isack Lee, Eungi Lee, Seok Bong Yoo

PDF

LATR: 3D Lane Detection from Monocular Images with Transformer Yueru Luo, Chaoda Zheng, Xu Yan, Tang Kun, Chao Zheng, Shuguang Cui, Zhen Li

PDF

LAW-Diffusion: Complex Scene Generation by Diffusion with Layouts Binbin Yang, Yi Luo, Ziliang Chen, Guangrun Wang, Xiaodan Liang, Liang Lin

PDF

LayoutDiffusion: Improving Graphic Layout Generation by Discrete Diffusion Probabilistic Models Junyi Zhang, Jiaqi Guo, Shizhao Sun, Jian-Guang Lou, Dongmei Zhang

PDF

LD-ZNet: A Latent Diffusion Approach for Text-Based Image Segmentation Koutilya Pnvr, Bharat Singh, Pallabi Ghosh, Behjat Siddiquie, David Jacobs

PDF

LDL: Line Distance Functions for Panoramic Localization Junho Kim, Changwoon Choi, Hojun Jang, Young Min Kim

PDF

LDP-Feat: Image Features with Local Differential Privacy Francesco Pittaluga, Bingbing Zhuang

PDF

LEA2: A Lightweight Ensemble Adversarial Attack via Non-Overlapping Vulnerable Frequency Regions Yaguan Qian, Shuke He, Chenyu Zhao, Jiaqiang Sha, Wei Wang, Bin Wang

PDF

LeaF: Learning Frames for 4D Point Cloud Sequence Understanding Yunze Liu, Junyu Chen, Zekai Zhang, Jingwei Huang, Li Yi

PDF

Leaping into Memories: Space-Time Deep Feature Synthesis Alexandros Stergiou, Nikos Deligiannis

PDF

Learn TAROT with MENTOR: A Meta-Learned Self-Supervised Approach for Trajectory Prediction Mozhgan Pourkeshavarz, Changhe Chen, Amir Rasouli

PDF

Learned Compressive Representations for Single-Photon 3D Imaging Felipe Gutierrez-Barragan, Fangzhou Mu, Andrei Ardelean, Atul Ingle, Claudio Bruschini, Edoardo Charbon, Yin Li, Mohit Gupta, Andreas Velten

PDF

Learned Image Reasoning Prior Penetrates Deep Unfolding Network for Panchromatic and Multi-Spectral Image Fusion Man Zhou, Jie Huang, Naishan Zheng, Chongyi Li

PDF

Learning a More Continuous Zero Level Set in Unsigned Distance Fields Through Level Set Projection Junsheng Zhou, Baorui Ma, Shujuan Li, Yu-Shen Liu, Zhizhong Han

PDF

Learning a Room with the Occ-SDF Hybrid: Signed Distance Function Mingled with Occupancy Aids Scene Representation Xiaoyang Lyu, Peng Dai, Zizhang Li, Dongyu Yan, Yi Lin, Yifan Peng, Xiaojuan Qi

PDF

Learning Adaptive Neighborhoods for Graph Neural Networks Avishkar Saha, Oscar Mendez, Chris Russell, Richard Bowden

PDF

Learning by Sorting: Self-Supervised Learning with Group Ordering Constraints Nina Shvetsova, Felix Petersen, Anna Kukleva, Bernt Schiele, Hilde Kuehne

PDF

Learning Clothing and Pose Invariant 3D Shape Representation for Long-Term Person Re-Identification Feng Liu, Minchul Kim, ZiAng Gu, Anil Jain, Xiaoming Liu

PDF

Learning Concise and Descriptive Attributes for Visual Recognition An Yan, Yu Wang, Yiwu Zhong, Chengyu Dong, Zexue He, Yujie Lu, William Yang Wang, Jingbo Shang, Julian McAuley

PDF

Learning Concordant Attention via Target-Aware Alignment for Visible-Infrared Person Re-Identification Jianbing Wu, Hong Liu, Yuxin Su, Wei Shi, Hao Tang

PDF

Learning Continuous Exposure Value Representations for Single-Image HDR Reconstruction Su-Kai Chen, Hung-Lin Yen, Yu-Lun Liu, Min-Hung Chen, Hou-Ning Hu, Wen-Hsiao Peng, Yen-Yu Lin

PDF

Learning Correction Filter via Degradation-Adaptive Regression for Blind Single Image Super-Resolution Hongyang Zhou, Xiaobin Zhu, Jianqing Zhu, Zheng Han, Shi-Xue Zhang, Jingyan Qin, Xu-Cheng Yin

PDF

Learning Cross-Modal Affinity for Referring Video Object Segmentation Targeting Limited Samples Guanghui Li, Mingqi Gao, Heng Liu, Xiantong Zhen, Feng Zheng

PDF

Learning Cross-Representation Affinity Consistency for Sparsely Supervised Biomedical Instance Segmentation Xiaoyu Liu, Wei Huang, Zhiwei Xiong, Shenglong Zhou, Yueyi Zhang, Xuejin Chen, Zheng-Jun Zha, Feng Wu

PDF

Learning Data-Driven Vector-Quantized Degradation Model for Animation Video Super-Resolution Zixi Tuo, Huan Yang, Jianlong Fu, Yujie Dun, Xueming Qian

PDF

Learning Depth Estimation for Transparent and Mirror Surfaces Alex Costanzino, Pierluigi Zama Ramirez, Matteo Poggi, Fabio Tosi, Stefano Mattoccia, Luigi Di Stefano

PDF

Learning Fine-Grained Features for Pixel-Wise Video Correspondences Rui Li, Shenglong Zhou, Dong Liu

PDF

Learning Foresightful Dense Visual Affordance for Deformable Object Manipulation Ruihai Wu, Chuanruo Ning, Hao Dong

PDF

Learning from Noisy Data for Semi-Supervised 3D Object Detection Zehui Chen, Zhenyu Li, Shuo Wang, Dengpan Fu, Feng Zhao

PDF

Learning from Noisy Pseudo Labels for Semi-Supervised Temporal Action Localization Kun Xia, Le Wang, Sanping Zhou, Gang Hua, Wei Tang

PDF

Learning from Semantic Alignment Between Unpaired Multiviews for Egocentric Video Recognition Qitong Wang, Long Zhao, Liangzhe Yuan, Ting Liu, Xi Peng

PDF

Learning Gabor Texture Features for Fine-Grained Recognition Lanyun Zhu, Tianrun Chen, Jianxiong Yin, Simon See, Jun Liu

PDF

Learning Global-Aware Kernel for Image Harmonization Xintian Shen, Jiangning Zhang, Jun Chen, Shipeng Bai, Yue Han, Yabiao Wang, Chengjie Wang, Yong Liu

PDF

Learning Hierarchical Features with Joint Latent Space Energy-Based Prior Jiali Cui, Ying Nian Wu, Tian Han

PDF

Learning Human Dynamics in Autonomous Driving Scenarios Jingbo Wang, Ye Yuan, Zhengyi Luo, Kevin Xie, Dahua Lin, Umar Iqbal, Sanja Fidler, Sameh Khamis

PDF

Learning Human-Human Interactions in Images from Weak Textual Supervision Morris Alper, Hadar Averbuch-Elor

PDF

Learning Image Harmonization in the Linear Color Space Ke Xu, Gerhard Petrus Hancke, Rynson W.H. Lau

PDF

Learning Image-Adaptive Codebooks for Class-Agnostic Image Restoration Kechun Liu, Yitong Jiang, Inchang Choi, Jinwei Gu

PDF

Learning in Imperfect Environment: Multi-Label Classification with Long-Tailed Distribution and Partial Labels Wenqiao Zhang, Changshuo Liu, Lingze Zeng, Bengchin Ooi, Siliang Tang, Yueting Zhuang

PDF

Learning Long-Range Information with Dual-Scale Transformers for Indoor Scene Completion Ziqi Wang, Fei Luo, Xiaoxiao Long, Wenxiao Zhang, Chunxia Xiao

PDF

Learning Navigational Visual Representations with Semantic mAP Supervision Yicong Hong, Yang Zhou, Ruiyi Zhang, Franck Dernoncourt, Trung Bui, Stephen Gould, Hao Tan

PDF

Learning Neural Eigenfunctions for Unsupervised Semantic Segmentation Zhijie Deng, Yucen Luo

PDF

Learning Neural Implicit Surfaces with Object-Aware Radiance Fields Yiheng Zhang, Zhaofan Qiu, Yingwei Pan, Ting Yao, Tao Mei

PDF

Learning Non-Local Spatial-Angular Correlation for Light Field Image Super-Resolution Zhengyu Liang, Yingqian Wang, Longguang Wang, Jungang Yang, Shilin Zhou, Yulan Guo

PDF

Learning Optical Flow from Event Camera with Rendered Dataset Xinglong Luo, Kunming Luo, Ao Luo, Zhengning Wang, Ping Tan, Shuaicheng Liu

PDF

Learning Point Cloud Completion Without Complete Point Clouds: A Pose-Aware Approach Jihun Kim, Hyeokjun Kweon, Yunseo Yang, Kuk-Jin Yoon

PDF

Learning Pseudo-Relations for Cross-Domain Semantic Segmentation Dong Zhao, Shuang Wang, Qi Zang, Dou Quan, Xiutiao Ye, Rui Yang, Licheng Jiao

PDF

Learning Rain Location Prior for Nighttime Deraining Fan Zhang, Shaodi You, Yu Li, Ying Fu

PDF

Learning Robust Representations with Information Bottleneck and Memory Network for RGB-D-Based Gesture Recognition Yunan Li, Huizhou Chen, Guanwen Feng, Qiguang Miao

PDF

Learning Semi-Supervised Gaussian Mixture Models for Generalized Category Discovery Bingchen Zhao, Xin Wen, Kai Han

PDF

Learning Shape Primitives via Implicit Convexity Regularization Xiaoyang Huang, Yi Zhang, Kai Chen, Teng Li, Wenjun Zhang, Bingbing Ni

PDF

Learning Spatial-Context-Aware Global Visual Feature Representation for Instance Image Retrieval Zhongyan Zhang, Lei Wang, Luping Zhou, Piotr Koniusz

PDF

Learning Support and Trivial Prototypes for Interpretable Image Classification Chong Wang, Yuyuan Liu, Yuanhong Chen, Fengbei Liu, Yu Tian, Davis McCarthy, Helen Frazer, Gustavo Carneiro

PDF

Learning Symmetry-Aware Geometry Correspondences for 6d Object Pose Estimation Heng Zhao, Shenxing Wei, Dahu Shi, Wenming Tan, Zheyang Li, Ye Ren, Xing Wei, Yi Yang, Shiliang Pu

PDF

Learning to Distill Global Representation for Sparse-View CT Zilong Li, Chenglong Ma, Jie Chen, Junping Zhang, Hongming Shan

PDF

Learning to Generate Semantic Layouts for Higher Text-Image Correspondence in Text-to-Image Synthesis Minho Park, Jooyeol Yun, Seunghwan Choi, Jaegul Choo

PDF

Learning to Ground Instructional Articles in Videos Through Narrations Effrosyni Mavroudi, Triantafyllos Afouras, Lorenzo Torresani

PDF

Learning to Identify Critical States for Reinforcement Learning from Videos Haozhe Liu, Mingchen Zhuge, Bing Li, Yuhui Wang, Francesco Faccio, Bernard Ghanem, Jürgen Schmidhuber

PDF

Learning to Learn: How to Continuously Teach Humans and Machines Parantak Singh, You Li, Ankur Sikarwar, Stan Weixian Lei, Difei Gao, Morgan B. Talbot, Ying Sun, Mike Zheng Shou, Gabriel Kreiman, Mengmi Zhang

PDF

Learning to Transform for Generalizable Instance-Wise Invariance Utkarsh Singhal, Carlos Esteves, Ameesh Makadia, Stella X. Yu

PDF

Learning to Upsample by Learning to Sample Wenze Liu, Hao Lu, Hongtao Fu, Zhiguo Cao

PDF

Learning Trajectory-Word Alignments for Video-Language Tasks Xu Yang, Zhangzikang Li, Haiyang Xu, Hanwang Zhang, Qinghao Ye, Chenliang Li, Ming Yan, Yu Zhang, Fei Huang, Songfang Huang

PDF

Learning Unified Decompositional and Compositional NeRF for Editable Novel View Synthesis Yuxin Wang, Wayne Wu, Dan Xu

PDF

Learning Versatile 3D Shape Generation with Improved Auto-Regressive Models Simian Luo, Xuelin Qian, Yanwei Fu, Yinda Zhang, Ying Tai, Zhenyu Zhang, Chengjie Wang, Xiangyang Xue

PDF

Learning Vision-and-Language Navigation from YouTube Videos Kunyang Lin, Peihao Chen, Diwei Huang, Thomas H. Li, Mingkui Tan, Chuang Gan

PDF

Learning with Diversity: Self-Expanded Equalization for Better Generalized Deep Metric Learning Jiexi Yan, Zhihui Yin, Erkun Yang, Yanhua Yang, Heng Huang

PDF

Lecture Presentations Multimodal Dataset: Towards Understanding Multimodality in Educational Videos Dong Won Lee, Chaitanya Ahuja, Paul Pu Liang, Sanika Natu, Louis-Philippe Morency

PDF

Lens Parameter Estimation for Realistic Depth of Field Modeling Dominique Piché-Meunier, Yannick Hold-Geoffroy, Jianming Zhang, Jean-François Lalonde

PDF

LERF: Language Embedded Radiance Fields Justin Kerr, Chung Min Kim, Ken Goldberg, Angjoo Kanazawa, Matthew Tancik

PDF

Less Is More: Focus Attention for Efficient DETR Dehua Zheng, Wenhui Dong, Hailin Hu, Xinghao Chen, Yunhe Wang

PDF

Leveraging Inpainting for Single-Image Shadow Removal Xiaoguang Li, Qing Guo, Rabab Abdelfattah, Di Lin, Wei Feng, Ivor Tsang, Song Wang

PDF

Leveraging Intrinsic Properties for Non-Rigid Garment Alignment Siyou Lin, Boyao Zhou, Zerong Zheng, Hongwen Zhang, Yebin Liu

PDF

Leveraging SE(3) Equivariance for Learning 3D Geometric Shape Assembly Ruihai Wu, Chenrui Tie, Yushi Du, Yan Zhao, Hao Dong

PDF

Leveraging Spatio-Temporal Dependency for Skeleton-Based Action Recognition Jungho Lee, Minhyeok Lee, Suhwan Cho, Sungmin Woo, Sungjun Jang, Sangyoun Lee

PDF

LexLIP: Lexicon-Bottlenecked Language-Image Pre-Training for Large-Scale Image-Text Sparse Retrieval Ziyang Luo, Pu Zhao, Can Xu, Xiubo Geng, Tao Shen, Chongyang Tao, Jing Ma, Qingwei Lin, Daxin Jiang

PDF

LFS-GAN: Lifelong Few-Shot Image Generation Juwon Seo, Ji-Su Kang, Gyeong-Moon Park

PDF

LiDAR-Camera Panoptic Segmentation via Geometry-Consistent and Semantic-Aware Alignment Zhiwei Zhang, Zhizhong Zhang, Qian Yu, Ran Yi, Yuan Xie, Lizhuang Ma

PDF

LiDAR-UDA: Self-Ensembling Through Time for Unsupervised LiDAR Domain Adaptation Amirreza Shaban, JoonHo Lee, Sanghun Jung, Xiangyun Meng, Byron Boots

PDF

LightDepth: Single-View Depth Self-Supervision from Illumination Decline Javier Rodríguez-Puigvert, Víctor M. Batlle, J.M.M. Montiel, Ruben Martinez-Cantin, Pascal Fua, Juan D. Tardós, Javier Civera

PDF

LightGlue: Local Feature Matching at Light Speed Philipp Lindenberger, Paul-Edouard Sarlin, Marc Pollefeys

PDF

Lighting Every Darkness in Two Pairs: A Calibration-Free Pipeline for RAW Denoising Xin Jin, Jia-Wen Xiao, Ling-Hao Han, Chunle Guo, Ruixun Zhang, Xialei Liu, Chongyi Li

PDF

Lighting up NeRF via Unsupervised Decomposition and Enhancement Haoyuan Wang, Xiaogang Xu, Ke Xu, Rynson W.H. Lau

PDF

Lightweight Image Super-Resolution with Superpixel Token Interaction Aiping Zhang, Wenqi Ren, Yi Liu, Xiaochun Cao

PDF

LIMITR: Leveraging Local Information for Medical Image-Text Representation Gefen Dawidowicz, Elad Hirsch, Ayellet Tal

PDF

Linear Spaces of Meanings: Compositional Structures in Vision-Language Models Matthew Trager, Pramuditha Perera, Luca Zancato, Alessandro Achille, Parminder Bhatia, Stefano Soatto

PDF

Linear-Covariance Loss for End-to-End Learning of 6d Pose Estimation Fulin Liu, Yinlin Hu, Mathieu Salzmann

PDF

LinkGAN: Linking GAN Latents to Pixels for Controllable Image Synthesis Jiapeng Zhu, Ceyuan Yang, Yujun Shen, Zifan Shi, Bo Dai, Deli Zhao, Qifeng Chen

PDF

Lip Reading for Low-Resource Languages by Learning and Combining General Speech Knowledge and Language-Specific Knowledge Minsu Kim, Jeong Hun Yeo, Jeongsoo Choi, Yong Man Ro

PDF

Lip2Vec: Efficient and Robust Visual Speech Recognition via Latent-to-Latent Visual to Audio Representation Mapping Yasser Abdelaziz Dahou Djilali, Sanath Narayan, Haithem Boussaid, Ebtessam Almazrouei, Merouane Debbah

PDF

LIST: Learning Implicitly from Spatial Transformers for Single-View 3D Reconstruction Mohammad Samiul Arshad, William J. Beksi

PDF

LISTER: Neighbor Decoding for Length-Insensitive Scene Text Recognition Changxu Cheng, Peng Wang, Cheng Da, Qi Zheng, Cong Yao

PDF

LiveHand: Real-Time and Photorealistic Neural Hand Rendering Akshay Mundra, B R Mallikarjun, Jiayi Wang, Marc Habermann, Christian Theobalt, Mohamed Elgharib

PDF

LivelySpeaker: Towards Semantic-Aware Co-Speech Gesture Generation Yihao Zhi, Xiaodong Cun, Xuelin Chen, Xi Shen, Wen Guo, Shaoli Huang, Shenghua Gao

PDF

LivePose: Online 3D Reconstruction from Monocular Video with Dynamic Camera Poses Noah Stier, Baptiste Angles, Liang Yang, Yajie Yan, Alex Colburn, Ming Chuang

PDF

LLM-Planner: Few-Shot Grounded Planning for Embodied Agents with Large Language Models Chan Hee Song, Jiaman Wu, Clayton Washington, Brian M Sadler, Wei-Lun Chao, Yu Su

PDF

LMR: A Large-Scale Multi-Reference Dataset for Reference-Based Super-Resolution Lin Zhang, Xin Li, Dongliang He, Fu Li, Errui Ding, Zhaoxiang Zhang

PDF

LNPL-MIL: Learning from Noisy Pseudo Labels for Promoting Multiple Instance Learning in Whole Slide Image Zhuchen Shao, Yifeng Wang, Yang Chen, Hao Bian, Shaohui Liu, Haoqian Wang, Yongbing Zhang

PDF

Local and Global Logit Adjustments for Long-Tailed Learning Yingfan Tao, Jingna Sun, Hao Yang, Li Chen, Xu Wang, Wenming Yang, Daniel Du, Min Zheng

PDF

Local Context-Aware Active Domain Adaptation Tao Sun, Cheng Lu, Haibin Ling

PDF

Local or Global: Selective Knowledge Assimilation for Federated Learning with Limited Labels Yae Jee Cho, Gauri Joshi, Dimitrios Dimitriadis

PDF

Localizing Moments in Long Video via Multimodal Guidance Wayner Barrios, Mattia Soldan, Alberto Mario Ceballos-Arroyo, Fabian Caba Heilbron, Bernard Ghanem

PDF

Localizing Object-Level Shape Variations with Text-to-Image Diffusion Models Or Patashnik, Daniel Garibi, Idan Azuri, Hadar Averbuch-Elor, Daniel Cohen-Or

PDF

Locally Stylized Neural Radiance Fields Hong-Wing Pang, Binh-Son Hua, Sai-Kit Yeung

PDF

Locating Noise Is Halfway Denoising for Semi-Supervised Segmentation Yan Fang, Feng Zhu, Bowen Cheng, Luoqi Liu, Yao Zhao, Yunchao Wei

PDF

Locomotion-Action-Manipulation: Synthesizing Human-Scene Interactions in Complex 3D Environments Jiye Lee, Hanbyul Joo

PDF

LoCUS: Learning Multiscale 3D-Consistent Features from Posed Images Dominik A. Kloepfer, Dylan Campbell, João F. Henriques

PDF

Logic-Induced Diagnostic Reasoning for Semi-Supervised Semantic Segmentation Chen Liang, Wenguan Wang, Jiaxu Miao, Yi Yang

PDF

LogicSeg: Parsing Visual Semantics with Neural Logic Learning and Reasoning Liulei Li, Wenguan Wang, Yi Yang

PDF

LoGoPrompt: Synthetic Text Images Can Be Good Visual Prompts for Vision-Language Models Cheng Shi, Sibei Yang

PDF

LoLep: Single-View View Synthesis with Locally-Learned Planes and Self-Attention Occlusion Inference Cong Wang, Yu-Ping Wang, Dinesh Manocha

PDF

Long-Range Grouping Transformer for Multi-View 3D Reconstruction Liying Yang, Zhenwei Zhu, Xuxin Lin, Jian Nong, Yanyan Liang

PDF

Long-Range Multimodal Pretraining for Movie Understanding Dawit Mureja Argaw, Joon-Young Lee, Markus Woodson, In So Kweon, Fabian Caba Heilbron

PDF

Long-Term Photometric Consistent Novel View Synthesis with Diffusion Models Jason J. Yu, Fereshteh Forghani, Konstantinos G. Derpanis, Marcus A. Brubaker

PDF

Look at the Neighbor: Distortion-Aware Unsupervised Domain Adaptation for Panoramic Semantic Segmentation Xu Zheng, Tianbo Pan, Yunhao Luo, Lin Wang

PDF

Lossy and Lossless (l2) Post-Training Model Size Compression Yumeng Shi, Shihao Bai, Xiuying Wei, Ruihao Gong, Jianlei Yang

PDF

LoTE-Animal: A Long Time-Span Dataset for Endangered Animal Behavior Understanding Dan Liu, Jin Hou, Shaoli Huang, Jing Liu, Yuxin He, Bochuan Zheng, Jifeng Ning, Jingdong Zhang

PDF

Low-Light Image Enhancement with Illumination-Aware Gamma Correction and Complete Image Modelling Network Yinglong Wang, Zhen Liu, Jianzhuang Liu, Songcen Xu, Shuaicheng Liu

PDF

Low-Light Image Enhancement with Multi-Stage Residue Quantization and Brightness-Aware Attention Yunlong Liu, Tao Huang, Weisheng Dong, Fangfang Wu, Xin Li, Guangming Shi

PDF

LPFF: A Portrait Dataset for Face Generators Across Large Poses Yiqian Wu, Jing Zhang, Hongbo Fu, Xiaogang Jin

PDF

LRRU: Long-Short Range Recurrent Updating Networks for Depth Completion Yufei Wang, Bo Li, Ge Zhang, Qi Liu, Tao Gao, Yuchao Dai

PDF

LU-NeRF: Scene and Pose Estimation by Synchronizing Local Unposed NeRFs Zezhou Cheng, Carlos Esteves, Varun Jampani, Abhishek Kar, Subhransu Maji, Ameesh Makadia

PDF

Luminance-Aware Color Transform for Multiple Exposure Correction Jong-Hyeon Baek, DaeHyun Kim, Su-Min Choi, Hyo-jun Lee, Hanul Kim, Yeong Jun Koh

PDF

LVOS: A Benchmark for Long-Term Video Object Segmentation Lingyi Hong, Wenchao Chen, Zhongying Liu, Wei Zhang, Pinxue Guo, Zhaoyu Chen, Wenqiang Zhang

PDF

M2T: Masking Transformers Twice for Faster Decoding Fabian Mentzer, Eirikur Agustson, Michael Tschannen

PDF

MAAL: Multimodality-Aware Autoencoder-Based Affordance Learning for 3D Articulated Objects Yuanzhi Liang, Xiaohan Wang, Linchao Zhu, Yi Yang

PDF

MAGI: Multi-Annotated Explanation-Guided Learning Yifei Zhang, Siyi Gu, Yuyang Gao, Bo Pan, Xiaofeng Yang, Liang Zhao

PDF

MagicFusion: Boosting Text-to-Image Generation Performance by Fusing Diffusion Models Jing Zhao, Heliang Zheng, Chaoyue Wang, Long Lan, Wenjing Yang

PDF

Make Encoder Great Again in 3D GAN Inversion Through Geometry and Occlusion-Aware Encoding Ziyang Yuan, Yiming Zhu, Yu Li, Hongyu Liu, Chun Yuan

PDF

Make-an-Animation: Large-Scale Text-Conditional 3D Human Motion Generation Samaneh Azadi, Akbar Shah, Thomas Hayes, Devi Parikh, Sonal Gupta

PDF

Make-It-3D: High-Fidelity 3D Creation from a Single Image with Diffusion Prior Junshu Tang, Tengfei Wang, Bo Zhang, Ting Zhang, Ran Yi, Lizhuang Ma, Dong Chen

PDF

MAMo: Leveraging Memory and Attention for Monocular Video Depth Estimation Rajeev Yasarla, Hong Cai, Jisoo Jeong, Yunxiao Shi, Risheek Garrepalli, Fatih Porikli

PDF

Manipulate by Seeing: Creating Manipulation Controllers from Pre-Trained Representations Jianren Wang, Sudeep Dasari, Mohan Kumar Srirama, Shubham Tulsiani, Abhinav Gupta

PDF

MAP: Towards Balanced Generalization of IID and OOD Through Model-Agnostic Adapters Min Zhang, Junkun Yuan, Yue He, Wenbin Li, Zhengyu Chen, Kun Kuang

PDF

MAPConNet: Self-Supervised 3D Pose Transfer with Mesh and Point Contrastive Learning Jiaze Sun, Zhixiang Chen, Tae-Kyun Kim

PDF

MapFormer: Boosting Change Detection by Using Pre-Change Information Maximilian Bernhard, Niklas Strauß, Matthias Schubert

PDF

MapPrior: Bird's-Eye View mAP Layout Estimation with Generative Models Xiyue Zhu, Vlas Zyrianov, Zhijian Liu, Shenlong Wang

PDF

March in Chat: Interactive Prompting for Remote Embodied Referring Expression Yanyuan Qiao, Yuankai Qi, Zheng Yu, Jing Liu, Qi Wu

PDF

Markov Game Video Augmentation for Action Segmentation Nicolas Aziere, Sinisa Todorovic

PDF

MARS: Model-Agnostic Biased Object Removal Without Additional Supervision for Weakly-Supervised Semantic Segmentation Sanghyun Jo, In-Jae Yu, Kyungsu Kim

PDF

MAS: Towards Resource-Efficient Federated Multiple-Task Learning Weiming Zhuang, Yonggang Wen, Lingjuan Lyu, Shuai Zhang

PDF

MasaCtrl: Tuning-Free Mutual Self-Attention Control for Consistent Image Synthesis and Editing Mingdeng Cao, Xintao Wang, Zhongang Qi, Ying Shan, Xiaohu Qie, Yinqiang Zheng

PDF

Mask-Attention-Free Transformer for 3D Instance Segmentation Xin Lai, Yuhui Yuan, Ruihang Chu, Yukang Chen, Han Hu, Jiaya Jia

PDF

Masked Autoencoders Are Efficient Class Incremental Learners Jiang-Tian Zhai, Xialei Liu, Andrew D. Bagdanov, Ke Li, Ming-Ming Cheng

PDF

Masked Autoencoders Are Stronger Knowledge Distillers Shanshan Lao, Guanglu Song, Boxiao Liu, Yu Liu, Yujiu Yang

PDF

Masked Diffusion Transformer Is a Strong Image Synthesizer Shanghua Gao, Pan Zhou, Ming-Ming Cheng, Shuicheng Yan

PDF

Masked Motion Predictors Are Strong 3D Action Representation Learners Yunyao Mao, Jiajun Deng, Wengang Zhou, Yao Fang, Wanli Ouyang, Houqiang Li

PDF

Masked Retraining Teacher-Student Framework for Domain Adaptive Object Detection Zijing Zhao, Sitong Wei, Qingchao Chen, Dehui Li, Yifan Yang, Yuxin Peng, Yang Liu

PDF

Masked Spatio-Temporal Structure Prediction for Self-Supervised Learning on Point Cloud Videos Zhiqiang Shen, Xiaoxiao Sheng, Hehe Fan, Longguang Wang, Yulan Guo, Qiong Liu, Hao Wen, Xi Zhou

PDF

Masked Spiking Transformer Ziqing Wang, Yuetong Fang, Jiahang Cao, Qiang Zhang, Zhongrui Wang, Renjing Xu

PDF

MasQCLIP for Open-Vocabulary Universal Image Segmentation Xin Xu, Tianyi Xiong, Zheng Ding, Zhuowen Tu

PDF

Mastering Spatial Graph Prediction of Road Networks Anagnostidis Sotiris, Aurelien Lucchi, Thomas Hofmann

PDF

MAtch, eXpand and Improve: Unsupervised Finetuning for Zero-Shot Action Recognition with Language Knowledge Wei Lin, Leonid Karlinsky, Nina Shvetsova, Horst Possegger, Mateusz Kozinski, Rameswar Panda, Rogerio Feris, Hilde Kuehne, Horst Bischof

PDF

MATE: Masked Autoencoders Are Online 3D Test-Time Learners M. Jehanzeb Mirza, Inkyu Shin, Wei Lin, Andreas Schriebl, Kunyang Sun, Jaesung Choe, Mateusz Kozinski, Horst Possegger, In So Kweon, Kuk-Jin Yoon, Horst Bischof

PDF

MatrixCity: A Large-Scale City Dataset for City-Scale Neural Rendering and Beyond Yixuan Li, Lihan Jiang, Linning Xu, Yuanbo Xiangli, Zhenzhi Wang, Dahua Lin, Bo Dai

PDF

MatrixVT: Efficient Multi-Camera to BEV Transformation for 3D Perception Hongyu Zhou, Zheng Ge, Zeming Li, Xiangyu Zhang

PDF

MB-TaylorFormer: Multi-Branch Efficient Transformer Expanded by Taylor Formula for Image Dehazing Yuwei Qiu, Kaihao Zhang, Chenxi Wang, Wenhan Luo, Hongdong Li, Zhi Jin

PDF

MBPTrack: Improving 3D Point Cloud Tracking with Memory Networks and Box Priors Tian-Xing Xu, Yuan-Chen Guo, Yu-Kun Lai, Song-Hai Zhang

PDF

MDCS: More Diverse Experts with Consistency Self-Distillation for Long-Tailed Recognition Qihao Zhao, Chen Jiang, Wei Hu, Fan Zhang, Jun Liu

PDF

Measuring Asymmetric Gradient Discrepancy in Parallel Continual Learning Fan Lyu, Qing Sun, Fanhua Shang, Liang Wan, Wei Feng

PDF

MedKLIP: Medical Knowledge Enhanced Language-Image Pre-Training for X-Ray Diagnosis Chaoyi Wu, Xiaoman Zhang, Ya Zhang, Yanfeng Wang, Weidi Xie

PDF

MEFLUT: Unsupervised 1d Lookup Tables for Multi-Exposure Image Fusion Ting Jiang, Chuan Wang, Xinpeng Li, Ru Li, Haoqiang Fan, Shuaicheng Liu

PDF

MEGA: Multimodal Alignment Aggregation and Distillation for Cinematic Video Segmentation Najmeh Sadoughi, Xinyu Li, Avijit Vajpayee, David Fan, Bing Shuai, Hector Santos-Villalobos, Vimal Bhat, Rohith Mv

PDF

Membrane Potential Batch Normalization for Spiking Neural Networks Yufei Guo, Yuhan Zhang, Yuanpei Chen, Weihang Peng, Xiaode Liu, Liwen Zhang, Xuhui Huang, Zhe Ma

PDF

Memory-and-Anticipation Transformer for Online Action Understanding Jiahao Wang, Guo Chen, Yifei Huang, Limin Wang, Tong Lu

PDF

MemorySeg: Online LiDAR Semantic Segmentation with a Latent Memory Enxu Li, Sergio Casas, Raquel Urtasun

PDF

MeMOTR: Long-Term Memory-Augmented Transformer for Multi-Object Tracking Ruopeng Gao, Limin Wang

PDF

Mesh2Tex: Generating Mesh Textures from Image Queries Alexey Bokhovkin, Shubham Tulsiani, Angela Dai

PDF

Meta OOD Learning for Continuously Adaptive OOD Detection Xinheng Wu, Jie Lu, Zhen Fang, Guangquan Zhang

PDF

Meta-ZSDETR: Zero-Shot DETR with Meta-Learning Lu Zhang, Chenbo Zhang, Jiajia Zhao, Jihong Guan, Shuigeng Zhou

PDF

MetaBEV: Solving Sensor Failures for 3D Detection and mAP Segmentation Chongjian Ge, Junsong Chen, Enze Xie, Zhongdao Wang, Lanqing Hong, Huchuan Lu, Zhenguo Li, Ping Luo

PDF

MetaF2N: Blind Image Super-Resolution by Learning Efficient Model Adaptation from Faces Zhicun Yin, Ming Liu, Xiaoming Li, Hui Yang, Longan Xiao, Wangmeng Zuo

PDF

MetaGCD: Learning to Continually Learn in Generalized Category Discovery Yanan Wu, Zhixiang Chi, Yang Wang, Songhe Feng

PDF

Metric3D: Towards Zero-Shot Metric 3D Prediction from a Single Image Wei Yin, Chi Zhang, Hao Chen, Zhipeng Cai, Gang Yu, Kaixuan Wang, Xiaozhi Chen, Chunhua Shen

PDF

MeViS: A Large-Scale Benchmark for Video Segmentation with Motion Expressions Henghui Ding, Chang Liu, Shuting He, Xudong Jiang, Chen Change Loy

PDF

MGMAE: Motion Guided Masking for Video Masked Autoencoding Bingkun Huang, Zhiyu Zhao, Guozhen Zhang, Yu Qiao, Limin Wang

PDF

MHCN: A Hyperbolic Neural Network Model for Multi-View Hierarchical Clustering Fangfei Lin, Bing Bai, Yiwen Guo, Hao Chen, Yazhou Ren, Zenglin Xu

PDF

MHEntropy: Entropy Meets Multiple Hypotheses for Pose and Shape Recovery Rongyu Chen, Linlin Yang, Angela Yao

PDF

MI-GAN: A Simple Baseline for Image Inpainting on Mobile Devices Andranik Sargsyan, Shant Navasardyan, Xingqian Xu, Humphrey Shi

PDF

Mimic3D: Thriving 3D-Aware GANs via 3D-to-2D Imitation Xingyu Chen, Yu Deng, Baoyuan Wang

PDF

MIMO-NeRF: Fast Neural Rendering with Multi-Input Multi-Output Neural Radiance Fields Takuhiro Kaneko

PDF

Minimal Solutions to Generalized Three-View Relative Pose Problem Yaqing Ding, Chiang-Heng Chien, Viktor Larsson, Karl Åström, Benjamin Kimia

PDF

Minimal Solutions to Uncalibrated Two-View Geometry with Known Epipoles Gaku Nakano

PDF

Minimum Latency Deep Online Video Stabilization Zhuofan Zhang, Zhen Liu, Ping Tan, Bing Zeng, Shuaicheng Liu

PDF

Mining Bias-Target Alignment from Voronoi Cells Rémi Nahon, Van-Tam Nguyen, Enzo Tartaglione

PDF

MiniROAD: Minimal RNN Framework for Online Action Detection Joungbin An, Hyolim Kang, Su Ho Han, Ming-Hsuan Yang, Seon Joo Kim

PDF

Misalign, Contrast Then Distill: Rethinking Misalignments in Language-Image Pre-Training Bumsoo Kim, Yeonsik Jo, Jinhyung Kim, Seunghwan Kim

PDF

Mitigating Adversarial Vulnerability Through Causal Parameter Estimation by Adversarial Double Machine Learning Byung-Kwan Lee, Junho Kim, Yong Man Ro

PDF

Mitigating and Evaluating Static Bias of Action Representations in the Background and the Foreground Haoxin Li, Yuan Liu, Hanwang Zhang, Boyang Li

PDF

MixBag: Bag-Level Data Augmentation for Learning from Label Proportions Takanori Asanomi, Shinnosuke Matsuo, Daiki Suehiro, Ryoma Bise

PDF

MixCycle: Mixup Assisted Semi-Supervised 3D Single Object Tracking with Cycle Consistency Qiao Wu, Jiaqi Yang, Kun Sun, Chu'ai Zhang, Yanning Zhang, Mathieu Salzmann

PDF

Mixed Neural Voxels for Fast Multi-View Video Synthesis Feng Wang, Sinan Tan, Xinghang Li, Zeyue Tian, Yafei Song, Huaping Liu

PDF

MixPath: A Unified Approach for One-Shot Neural Architecture Search Xiangxiang Chu, Shun Lu, Xudong Li, Bo Zhang

PDF

MixReorg: Cross-Modal Mixed Patch Reorganization Is a Good Mask Learner for Open-World Semantic Segmentation Kaixin Cai, Pengzhen Ren, Yi Zhu, Hang Xu, Jianzhuang Liu, Changlin Li, Guangrun Wang, Xiaodan Liang

PDF

MixSpeech: Cross-Modality Self-Learning with Audio-Visual Stream Mixup for Visual Speech Translation and Recognition Xize Cheng, Tao Jin, Rongjie Huang, Linjun Li, Wang Lin, Zehan Wang, Ye Wang, Huadai Liu, Aoxiong Yin, Zhou Zhao

PDF

MixSynthFormer: A Transformer Encoder-like Structure with Mixed Synthetic Self-Attention for Efficient Human Pose Estimation Yuran Sun, Alan William Dougherty, Zhuoying Zhang, Yi King Choi, Chuan Wu

PDF

MMST-ViT: Climate Change-Aware Crop Yield Prediction via Multi-Modal Spatial-Temporal Vision Transformer Fudong Lin, Summer Crawford, Kaleb Guillot, Yihe Zhang, Yan Chen, Xu Yuan, Li Chen, Shelby Williams, Robert Minvielle, Xiangming Xiao, Drew Gholson, Nicolas Ashwell, Tri Setiyono, Brenda Tubana, Lu Peng, Magdy Bayoumi, Nian-Feng Tzeng

PDF

MMVP: Motion-Matrix-Based Video Prediction Yiqi Zhong, Luming Liang, Ilya Zharkov, Ulrich Neumann

PDF

MODA: Mapping-Once Audio-Driven Portrait Animation with Dual Attentions Yunfei Liu, Lijian Lin, Fei Yu, Changyin Zhou, Yu Li

PDF

Modality Unifying Network for Visible-Infrared Person Re-Identification Hao Yu, Xu Cheng, Wei Peng, Weihao Liu, Guoying Zhao

PDF

Model Calibration in Dense Classification with Adaptive Label Perturbation Jiawei Liu, Changkun Ye, Shan Wang, Ruikai Cui, Jing Zhang, Kaihao Zhang, Nick Barnes

PDF

ModelGiF: Gradient Fields for Model Functional Distance Jie Song, Zhengqi Xu, Sai Wu, Gang Chen, Mingli Song

PDF

Modeling the Relative Visual Tempo for Self-Supervised Skeleton-Based Action Recognition Yisheng Zhu, Hu Han, Zhengtao Yu, Guangcan Liu

PDF

MolGrapher: Graph-Based Visual Recognition of Chemical Structures Lucas Morin, Martin Danelljan, Maria Isabel Agea, Ahmed Nassar, Valery Weber, Ingmar Meijer, Peter Staar, Fisher Yu

PDF

Moment Detection in Long Tutorial Videos Ioana Croitoru, Simion-Vlad Bogolin, Samuel Albanie, Yang Liu, Zhaowen Wang, Seunghyun Yoon, Franck Dernoncourt, Hailin Jin, Trung Bui

PDF

Monocular 3D Object Detection with Bounding Box Denoising in 3D by Perceiver Xianpeng Liu, Ce Zheng, Kelvin B Cheng, Nan Xue, Guo-Jun Qi, Tianfu Wu

PDF

MonoDETR: Depth-Guided Transformer for Monocular 3D Object Detection Renrui Zhang, Han Qiu, Tai Wang, Ziyu Guo, Ziteng Cui, Yu Qiao, Hongsheng Li, Peng Gao

PDF

MonoNeRD: NeRF-like Representations for Monocular 3D Object Detection Junkai Xu, Liang Peng, Haoran Cheng, Hao Li, Wei Qian, Ke Li, Wenxiao Wang, Deng Cai

PDF

MonoNeRF: Learning a Generalizable Dynamic Radiance Field from Monocular Videos Fengrui Tian, Shaoyi Du, Yueqi Duan

PDF

Monte Carlo Linear Clustering with Single-Point Supervision Is Enough for Infrared Small Target Detection Boyang Li, Yingqian Wang, Longguang Wang, Fei Zhang, Ting Liu, Zaiping Lin, Wei An, Yulan Guo

PDF

MoreauGrad: Sparse and Robust Interpretation of Neural Networks via Moreau Envelope Jingwei Zhang, Farzan Farnia

PDF

MosaiQ: Quantum Generative Adversarial Networks for Image Generation on NISQ Computers Daniel Silver, Tirthak Patel, William Cutler, Aditya Ranjan, Harshitta Gandhi, Devesh Tiwari

PDF

MOSE: A New Dataset for Video Object Segmentation in Complex Scenes Henghui Ding, Chang Liu, Shuting He, Xudong Jiang, Philip H.S. Torr, Song Bai

PDF

Most Important Person-Guided Dual-Branch Cross-Patch Attention for Group Affect Recognition Hongxia Xie, Ming-Xian Lee, Tzu-Jui Chen, Hung-Jen Chen, Hou-I Liu, Hong-Han Shuai, Wen-Huang Cheng

PDF

MOST: Multiple Object Localization with Self-Supervised Transformers for Object Discovery Sai Saketh Rambhatla, Ishan Misra, Rama Chellappa, Abhinav Shrivastava

PDF

MoTIF: Learning Motion Trajectories with Local Implicit Neural Functions for Continuous Space-Time Video Super-Resolution Yi-Hsin Chen, Si-Cun Chen, Yi-Hsin Chen, Yen-Yu Lin, Wen-Hsiao Peng

PDF

Motion-Guided Masking for Spatiotemporal Representation Learning David Fan, Jue Wang, Shuai Liao, Yi Zhu, Vimal Bhat, Hector Santos-Villalobos, Rohith Mv, Xinyu Li

PDF

MotionBERT: A Unified Perspective on Learning Human Motion Representations Wentao Zhu, Xiaoxuan Ma, Zhaoyang Liu, Libin Liu, Wayne Wu, Yizhou Wang

PDF

MotionDeltaCNN: Sparse CNN Inference of Frame Differences in Moving Camera Videos with Spherical Buffers and Padded Convolutions Mathias Parger, Chengcheng Tang, Thomas Neff, Christopher D. Twigg, Cem Keskin, Robert Wang, Markus Steinberger

PDF

MotionLM: Multi-Agent Motion Forecasting as Language Modeling Ari Seff, Brian Cera, Dian Chen, Mason Ng, Aurick Zhou, Nigamaa Nayakanti, Khaled S. Refaat, Rami Al-Rfou, Benjamin Sapp

PDF

Movement Enhancement Toward Multi-Scale Video Feature Representation for Temporal Action Detection Zixuan Zhao, Dongqi Wang, Xu Zhao

PDF

MPCViT: Searching for Accurate and Efficient MPC-Friendly Vision Transformer with Heterogeneous Attention Wenxuan Zeng, Meng Li, Wenjie Xiong, Tong Tong, Wen-jie Lu, Jin Tan, Runsheng Wang, Ru Huang

PDF

MPI-Flow: Learning Realistic Optical Flow with Multiplane Images Yingping Liang, Jiaming Liu, Debing Zhang, Ying Fu

PDF

MRM: Masked Relation Modeling for Medical Image Pre-Training with Genetics Qiushi Yang, Wuyang Li, Baopu Li, Yixuan Yuan

PDF

MRN: Multiplexed Routing Network for Incremental Multilingual Text Recognition Tianlun Zheng, Zhineng Chen, Bingchen Huang, Wei Zhang, Yu-Gang Jiang

PDF

MSI: Maximize Support-Set Information for Few-Shot Segmentation Seonghyeon Moon, Samuel S. Sohn, Honglu Zhou, Sejong Yoon, Vladimir Pavlovic, Muhammad Haris Khan, Mubbasir Kapadia

PDF

MST-Compression: Compressing and Accelerating Binary Neural Networks with Minimum Spanning Tree Quang Hieu Vo, Linh-Tam Tran, Sung-Ho Bae, Lok-Won Kim, Choong Seon Hong

PDF

MULLER: Multilayer Laplacian Resizer for Vision Zhengzhong Tu, Peyman Milanfar, Hossein Talebi

PDF

Multi-Body Depth and Camera Pose Estimation from Multiple Views Andrea Porfiri Dal Cin, Giacomo Boracchi, Luca Magri

PDF

Multi-Directional Subspace Editing in Style-Space Chen Naveh

PDF

Multi-Event Video-Text Retrieval Gengyuan Zhang, Jisen Ren, Jindong Gu, Volker Tresp

PDF

Multi-Frequency Representation Enhancement with Privilege Information for Video Super-Resolution Fei Li, Linfeng Zhang, Zikun Liu, Juan Lei, Zhenbo Li

PDF

Multi-Grained Temporal Prototype Learning for Few-Shot Video Object Segmentation Nian Liu, Kepan Nan, Wangbo Zhao, Yuanwei Liu, Xiwen Yao, Salman Khan, Hisham Cholakkal, Rao Muhammad Anwer, Junwei Han, Fahad Shahbaz Khan

PDF

Multi-Granularity Interaction Simulation for Unsupervised Interactive Segmentation Kehan Li, Yian Zhao, Zhennan Wang, Zesen Cheng, Peng Jin, Xiangyang Ji, Li Yuan, Chang Liu, Jie Chen

PDF

Multi-Interactive Feature Learning and a Full-Time Multi-Modality Benchmark for Image Fusion and Segmentation Jinyuan Liu, Zhu Liu, Guanyao Wu, Long Ma, Risheng Liu, Wei Zhong, Zhongxuan Luo, Xin Fan

PDF

Multi-Label Affordance Mapping from Egocentric Vision Lorenzo Mur-Labadia, Jose J. Guerrero, Ruben Martinez-Cantin

PDF

Multi-Label Knowledge Distillation Penghui Yang, Ming-Kun Xie, Chen-Chen Zong, Lei Feng, Gang Niu, Masashi Sugiyama, Sheng-Jun Huang

PDF

Multi-Label Self-Supervised Learning with Scene Images Ke Zhu, Minghao Fu, Jianxin Wu

PDF

Multi-Metrics Adaptively Identifies Backdoors in Federated Learning Siquan Huang, Yijiang Li, Chong Chen, Leyu Shi, Ying Gao

PDF

Multi-Modal Continual Test-Time Adaptation for 3D Semantic Segmentation Haozhi Cao, Yuecong Xu, Jianfei Yang, Pengyu Yin, Shenghai Yuan, Lihua Xie

PDF

Multi-Modal Gated Mixture of Local-to-Global Experts for Dynamic Image Fusion Bing Cao, Yiming Sun, Pengfei Zhu, Qinghua Hu

PDF

Multi-Modal Neural Radiance Field for Monocular Dense SLAM with a Light-Weight ToF Sensor Xinyang Liu, Yijin Li, Yanbin Teng, Hujun Bao, Guofeng Zhang, Yinda Zhang, Zhaopeng Cui

PDF

Multi-Object Discovery by Low-Dimensional Object Motion Sadra Safadoust, Fatma Güney

PDF

Multi-Object Navigation with Dynamically Learned Neural Implicit Representations Pierre Marza, Laetitia Matignon, Olivier Simonin, Christian Wolf

PDF

Multi-Scale Bidirectional Recurrent Network with Hybrid Correlation for Point Cloud Based Scene Flow Estimation Wencan Cheng, Jong Hwan Ko

PDF

Multi-Scale Residual Low-Pass Filter Network for Image Deblurring Jiangxin Dong, Jinshan Pan, Zhongbao Yang, Jinhui Tang

PDF

Multi-Task Learning with Knowledge Distillation for Dense Prediction Yangyang Xu, Yibo Yang, Lefei Zhang

PDF

Multi-Task View Synthesis with Neural Radiance Fields Shuhong Zheng, Zhipeng Bao, Martial Hebert, Yu-Xiong Wang

PDF

Multi-View Active Fine-Grained Visual Recognition Ruoyi Du, Wenqing Yu, Heqing Wang, Ting-En Lin, Dongliang Chang, Zhanyu Ma

PDF

Multi-View Self-Supervised Disentanglement for General Image Denoising Hao Chen, Chenyuan Qu, Yu Zhang, Chen Chen, Jianbo Jiao

PDF

Multi-View Spectral Polarization Propagation for Video Glass Segmentation Yu Qiao, Bo Dong, Ao Jin, Yu Fu, Seung-Hwan Baek, Felix Heide, Pieter Peers, Xiaopeng Wei, Xin Yang

PDF

Multi-Weather Image Restoration via Domain Translation Prashant W. Patil, Sunil Gupta, Santu Rana, Svetha Venkatesh, Subrahmanyam Murala

PDF

Multi3DRefer: Grounding Text Description to Multiple 3D Objects Yiming Zhang, ZeMing Gong, Angel X. Chang

PDF

Multimodal Distillation for Egocentric Action Recognition Gorjan Radevski, Dusan Grujicic, Matthew Blaschko, Marie-Francine Moens, Tinne Tuytelaars

PDF

Multimodal Garment Designer: Human-Centric Latent Diffusion Models for Fashion Image Editing Alberto Baldrati, Davide Morelli, Giuseppe Cartella, Marcella Cornia, Marco Bertini, Rita Cucchiara

PDF

Multimodal High-Order Relation Transformer for Scene Boundary Detection Xi Wei, Zhangxiang Shi, Tianzhu Zhang, Xiaoyuan Yu, Lei Xiao

PDF

Multimodal Motion Conditioned Diffusion Model for Skeleton-Based Video Anomaly Detection Alessandro Flaborea, Luca Collorone, Guido Maria D'Amely di Melendugno, Stefano D'Arrigo, Bardh Prenkaj, Fabio Galasso

PDF

Multimodal Optimal Transport-Based Co-Attention Transformer with Global Structure Consistency for Survival Prediction Yingxue Xu, Hao Chen

PDF

Multimodal Variational Auto-Encoder Based Audio-Visual Segmentation Yuxin Mao, Jing Zhang, Mochu Xiang, Yiran Zhong, Yuchao Dai

PDF

Multiple Instance Learning Framework with Masked Hard Instance Mining for Whole Slide Image Classification Wenhao Tang, Sheng Huang, Xiaoxian Zhang, Fengtao Zhou, Yi Zhang, Bo Liu

PDF

Multiple Planar Object Tracking Zhicheng Zhang, Shengzhe Liu, Jufeng Yang

PDF

Multiscale Representation for Real-Time Anti-Aliasing Neural Rendering Dongting Hu, Zhenkai Zhang, Tingbo Hou, Tongliang Liu, Huan Fu, Mingming Gong

PDF

Multiscale Structure Guided Diffusion for Image Deblurring Mengwei Ren, Mauricio Delbracio, Hossein Talebi, Guido Gerig, Peyman Milanfar

PDF

Muscles in Action Mia Chiquier, Carl Vondrick

PDF

MUter: Machine Unlearning on Adversarially Trained Models Junxu Liu, Mingsheng Xue, Jian Lou, Xiaoyu Zhang, Li Xiong, Zhan Qin

PDF

MUVA: A New Large-Scale Benchmark for Multi-View Amodal Instance Segmentation in the Shopping Scenario Zhixuan Li, Weining Ye, Juan Terven, Zachary Bennett, Ying Zheng, Tingting Jiang, Tiejun Huang

PDF

MV-DeepSDF: Implicit Modeling with Multi-Sweep Point Clouds for 3D Vehicle Reconstruction in Autonomous Driving Yibo Liu, Kelly Zhu, Guile Wu, Yuan Ren, Bingbing Liu, Yang Liu, Jinjun Shan

PDF

MV-mAP: Offboard HD-mAP Generation with Multi-View Consistency Ziyang Xie, Ziqi Pang, Yu-Xiong Wang

PDF

MVPSNet: Fast Generalizable Multi-View Photometric Stereo Dongxu Zhao, Daniel Lichy, Pierre-Nicolas Perrin, Jan-Michael Frahm, Soumyadip Sengupta

PDF

Name Your Colour for the Task: Artificially Discover Colour Naming via Colour Quantisation Transformer Shenghan Su, Lin Gu, Yue Yang, Zenghui Zhang, Tatsuya Harada

PDF

NAPA-VQ: Neighborhood-Aware Prototype Augmentation with Vector Quantization for Continual Learning Tamasha Malepathirana, Damith Senanayake, Saman Halgamuge

PDF

Narrator: Towards Natural Control of Human-Scene Interaction Generation via Relationship Reasoning Haibiao Xuan, Xiongzheng Li, Jinsong Zhang, Hongwen Zhang, Yebin Liu, Kun Li

PDF

Navigating to Objects Specified by Images Jacob Krantz, Theophile Gervet, Karmesh Yadav, Austin Wang, Chris Paxton, Roozbeh Mottaghi, Dhruv Batra, Jitendra Malik, Stefan Lee, Devendra Singh Chaplot

PDF

NaviNeRF: NeRF-Based 3D Representation Disentanglement by Latent Semantic Navigation Baao Xie, Bohan Li, Zequn Zhang, Junting Dong, Xin Jin, Jingyu Yang, Wenjun Zeng

PDF

NCHO: Unsupervised Learning for Neural 3D Composition of Humans and Objects Taeksoo Kim, Shunsuke Saito, Hanbyul Joo

PDF

NDC-Scene: Boost Monocular 3D Semantic Scene Completion in Normalized Device Coordinates Space Jiawei Yao, Chuming Li, Keqiang Sun, Yingjie Cai, Hao Li, Wanli Ouyang, Hongsheng Li

PDF

NDDepth: Normal-Distance Assisted Monocular Depth Estimation Shuwei Shao, Zhongcai Pei, Weihai Chen, Xingming Wu, Zhengguo Li

PDF

Nearest Neighbor Guidance for Out-of-Distribution Detection Jaewoo Park, Yoon Gyo Jung, Andrew Beng Jin Teoh

PDF

Neglected Free Lunch - Learning Image Classifiers Using Annotation Byproducts Dongyoon Han, Junsuk Choe, Seonghyeok Chun, John Joon Young Chung, Minsuk Chang, Sangdoo Yun, Jean Y. Song, Seong Joon Oh

PDF

NeILF++: Inter-Reflectable Light Fields for Geometry and Material Estimation Jingyang Zhang, Yao Yao, Shiwei Li, Jingbo Liu, Tian Fang, David McKinnon, Yanghai Tsin, Long Quan

PDF

NeMF: Inverse Volume Rendering with Neural Microflake Field Youjia Zhang, Teng Xu, Junqing Yu, Yuteng Ye, Yanqing Jing, Junle Wang, Jingyi Yu, Wei Yang

PDF

NEMTO: Neural Environment Matting for Novel View and Relighting Synthesis of Transparent Objects Dongqing Wang, Tong Zhang, Sabine Süsstrunk

PDF

NeO 360: Neural Fields for Sparse View Synthesis of Outdoor Scenes Muhammad Zubair Irshad, Sergey Zakharov, Katherine Liu, Vitor Guizilini, Thomas Kollar, Adrien Gaidon, Zsolt Kira, Rares Ambrus

PDF

NeRF-Det: Learning Geometry-Aware Volumetric Representation for Multi-View 3D Object Detection Chenfeng Xu, Bichen Wu, Ji Hou, Sam Tsai, Ruilong Li, Jialiang Wang, Wei Zhan, Zijian He, Peter Vajda, Kurt Keutzer, Masayoshi Tomizuka

PDF

NeRF-LOAM: Neural Implicit Representation for Large-Scale Incremental LiDAR Odometry and Mapping Junyuan Deng, Qi Wu, Xieyuanli Chen, Songpengcheng Xia, Zhen Sun, Guoqing Liu, Wenxian Yu, Ling Pei

PDF

NeRF-MS: Neural Radiance Fields with Multi-Sequence Peihao Li, Shaohui Wang, Chen Yang, Bingbing Liu, Weichao Qiu, Haoqian Wang

PDF

NerfAcc: Efficient Sampling Accelerates NeRFs Ruilong Li, Hang Gao, Matthew Tancik, Angjoo Kanazawa

PDF

Nerfbusters: Removing Ghostly Artifacts from Casually Captured NeRFs Frederik Warburg, Ethan Weber, Matthew Tancik, Aleksander Holynski, Angjoo Kanazawa

PDF

NeRFrac: Neural Radiance Fields Through Refractive Surface Yifan Zhan, Shohei Nobuhara, Ko Nishino, Yinqiang Zheng

PDF

NeSS-ST: Detecting Good and Stable Keypoints with a Neural Stability Score and the Shi-Tomasi Detector Konstantin Pakulev, Alexander Vakhitov, Gonzalo Ferrer

PDF

NeTO:Neural Reconstruction of Transparent Objects with Self-Occlusion Aware Refraction-Tracing Zongcheng Li, Xiaoxiao Long, Yusen Wang, Tuo Cao, Wenping Wang, Fei Luo, Chunxia Xiao

PDF

Neural Characteristic Function Learning for Conditional Image Generation Shengxi Li, Jialu Zhang, Yifei Li, Mai Xu, Xin Deng, Li Li

PDF

Neural Collage Transfer: Artistic Reconstruction via Material Manipulation Ganghun Lee, Minji Kim, Yunsu Lee, Minsu Lee, Byoung-Tak Zhang

PDF

Neural Deformable Models for 3D Bi-Ventricular Heart Shape Reconstruction and Modeling from 2D Sparse Cardiac Magnetic Resonance Imaging Meng Ye, Dong Yang, Mikael Kanski, Leon Axel, Dimitris Metaxas

PDF

Neural Fields for Structured Lighting Aarrushi Shandilya, Benjamin Attal, Christian Richardt, James Tompkin, Matthew O'toole

PDF

Neural Haircut: Prior-Guided Strand-Based Hair Reconstruction Vanessa Sklyarova, Jenya Chelishev, Andreea Dogaru, Igor Medvedev, Victor Lempitsky, Egor Zakharov

PDF

Neural Implicit Surface Evolution Tiago Novello, Vinicius da Silva, Guilherme Schardong, Luiz Schirmer, Helio Lopes, Luiz Velho

PDF

Neural Interactive Keypoint Detection Jie Yang, Ailing Zeng, Feng Li, Shilong Liu, Ruimao Zhang, Lei Zhang

PDF

Neural LiDAR Fields for Novel View Synthesis Shengyu Huang, Zan Gojcic, Zian Wang, Francis Williams, Yoni Kasten, Sanja Fidler, Konrad Schindler, Or Litany

PDF

Neural Microfacet Fields for Inverse Rendering Alexander Mai, Dor Verbin, Falko Kuester, Sara Fridovich-Keil

PDF

Neural Radiance Field with LiDAR Maps MingFang Chang, Akash Sharma, Michael Kaess, Simon Lucey

PDF

Neural Reconstruction of Relightable Human Model from Monocular Video Wenzhang Sun, Yunlong Che, Han Huang, Yandong Guo

PDF

Neural Video Depth Stabilizer Yiran Wang, Min Shi, Jiaqi Li, Zihao Huang, Zhiguo Cao, Jianming Zhang, Ke Xian, Guosheng Lin

PDF

Neural-PBIR Reconstruction of Shape, Material, and Illumination Cheng Sun, Guangyan Cai, Zhengqin Li, Kai Yan, Cheng Zhang, Carl Marshall, Jia-Bin Huang, Shuang Zhao, Zhao Dong

PDF

NeuRBF: A Neural Fields Representation with Adaptive Radial Basis Functions Zhang Chen, Zhong Li, Liangchen Song, Lele Chen, Jingyi Yu, Junsong Yuan, Yi Xu

PDF

NeuS2: Fast Learning of Neural Implicit Surfaces for Multi-View Reconstruction Yiming Wang, Qin Han, Marc Habermann, Kostas Daniilidis, Christian Theobalt, Lingjie Liu

PDF

NIR-Assisted Video Enhancement via Unpaired 24-Hour Data Muyao Niu, Zhihang Zhong, Yinqiang Zheng

PDF

NLOS-NeuS: Non-Line-of-Sight Neural Implicit Surface Yuki Fujimura, Takahiro Kushida, Takuya Funatomi, Yasuhiro Mukaigawa

PDF

No Fear of Classifier Biases: Neural Collapse Inspired Federated Learning with Synthetic and Fixed Classifier Zexi Li, Xinyi Shang, Rui He, Tao Lin, Chao Wu

PDF

Noise-Aware Learning from Web-Crawled Image-Text Data for Image Captioning Wooyoung Kang, Jonghwan Mun, Sungjun Lee, Byungseok Roh

PDF

Noise2Info: Noisy Image to Information of Noise for Self-Supervised Image Denoising Jiachuan Wang, Shimin Di, Lei Chen, Charles Wang Wai Ng

PDF

Non-Coaxial Event-Guided Motion Deblurring with Spatial Alignment Hoonhee Cho, Yuhwan Jeong, Taewoo Kim, Kuk-Jin Yoon

PDF

Non-Semantics Suppressed Mask Learning for Unsupervised Video Semantic Compression Yuan Tian, Guo Lu, Guangtao Zhai, Zhiyong Gao

PDF

Nonrigid Object Contact Estimation with Regional Unwrapping Transformer Wei Xie, Zimeng Zhao, Shiying Li, Binghui Zuo, Yangang Wang

PDF

Normalizing Flows for Human Pose Anomaly Detection Or Hirschorn, Shai Avidan

PDF

Not All Features Matter: Enhancing Few-Shot CLIP with Adaptive Prior Refinement Xiangyang Zhu, Renrui Zhang, Bowei He, Aojun Zhou, Dong Wang, Bin Zhao, Peng Gao

PDF

Not All Steps Are Created Equal: Selective Diffusion Distillation for Image Manipulation Luozhou Wang, Shuai Yang, Shu Liu, Ying-cong Chen

PDF

Not Every Side Is Equal: Localization Uncertainty Estimation for Semi-Supervised 3D Object Detection Chuxin Wang, Wenfei Yang, Tianzhu Zhang

PDF

Novel Scenes & Classes: Towards Adaptive Open-Set Object Detection Wuyang Li, Xiaoqing Guo, Yixuan Yuan

PDF

Novel-View Synthesis and Pose Estimation for Hand-Object Interaction from Sparse Views Wentian Qu, Zhaopeng Cui, Yinda Zhang, Chenyu Meng, Cuixia Ma, Xiaoming Deng, Hongan Wang

PDF

NPC: Neural Point Characters from Video Shih-Yang Su, Timur Bagautdinov, Helge Rhodin

PDF

NSF: Neural Surface Fields for Human Modeling from Monocular Depth Yuxuan Xue, Bharat Lal Bhatnagar, Riccardo Marin, Nikolaos Sarafianos, Yuanlu Xu, Gerard Pons-Moll, Tony Tung

PDF

Object as Query: Lifting Any 2D Object Detector to 3D Detection Zitian Wang, Zehao Huang, Jiahui Fu, Naiyan Wang, Si Liu

PDF

Object-Aware Gaze Target Detection Francesco Tonini, Nicola Dall'Asen, Cigdem Beyan, Elisa Ricci

PDF

Object-Centric Multiple Object Tracking Zixu Zhao, Jiaze Wang, Max Horn, Yizhuo Ding, Tong He, Zechen Bai, Dominik Zietlow, Carl-Johann Simon-Gabriel, Bing Shuai, Zhuowen Tu, Thomas Brox, Bernt Schiele, Yanwei Fu, Francesco Locatello, Zheng Zhang, Tianjun Xiao

PDF

ObjectFusion: Multi-Modal 3D Object Detection with Object-Centric Fusion Qi Cai, Yingwei Pan, Ting Yao, Chong-Wah Ngo, Tao Mei

PDF

Objects Do Not Disappear: Video Object Detection by Single-Frame Object Location Anticipation Xin Liu, Fatemeh Karimi Nejadasl, Jan C. van Gemert, Olaf Booij, Silvia L. Pintea

PDF

ObjectSDF++: Improved Object-Compositional Neural Implicit Surfaces Qianyi Wu, Kaisiyuan Wang, Kejie Li, Jianmin Zheng, Jianfei Cai

PDF

Occ^2Net: Robust Image Matching Based on 3D Occupancy Estimation for Occluded Regions Miao Fan, Mingrui Chen, Chen Hu, Shuchang Zhou

PDF

OccFormer: Dual-Path Transformer for Vision-Based 3D Semantic Occupancy Prediction Yunpeng Zhang, Zheng Zhu, Dalong Du

PDF

OCHID-Fi: Occlusion-Robust Hand Pose Estimation in 3D via RF-Vision Shujie Zhang, Tianyue Zheng, Zhe Chen, Jingzhi Hu, Abdelwahed Khamis, Jiajun Liu, Jun Luo

PDF

OFVL-MS: Once for Visual Localization Across Multiple Indoor Scenes Tao Xie, Kun Dai, Siyi Lu, Ke Wang, Zhiqiang Jiang, Jinghan Gao, Dedong Liu, Jie Xu, Lijun Zhao, Ruifeng Li

PDF

Omnidirectional Information Gathering for Knowledge Transfer-Based Audio-Visual Navigation Jinyu Chen, Wenguan Wang, Si Liu, Hongsheng Li, Yi Yang

PDF

OmniLabel: A Challenging Benchmark for Language-Based Object Detection Samuel Schulter, B G Vijay Kumar, Yumin Suh, Konstantinos M. Dafnis, Zhixing Zhang, Shiyu Zhao, Dimitris Metaxas

PDF

OmnimatteRF: Robust Omnimatte with 3D Background Modeling Geng Lin, Chen Gao, Jia-Bin Huang, Changil Kim, Yipeng Wang, Matthias Zwicker, Ayush Saraf

PDF

OmniZoomer: Learning to Move and Zoom in on Sphere at High-Resolution Zidong Cao, Hao Ai, Yan-Pei Cao, Ying Shan, Xiaohu Qie, Lin Wang

PDF

On the Audio-Visual Synchronization for Lip-to-Speech Synthesis Zhe Niu, Brian Mak

PDF

On the Effectiveness of Spectral Discriminators for Perceptual Quality Improvement Xin Luo, Yunan Zhu, Shunxin Xu, Dong Liu

PDF

On the Robustness of Normalizing Flows for Inverse Problems in Imaging Seongmin Hong, Inbum Park, Se Young Chun

PDF

On the Robustness of Open-World Test-Time Training: Self-Training with Dynamic Prototype Expansion Yushu Li, Xun Xu, Yongyi Su, Kui Jia

PDF

Once Detected, Never Lost: Surpassing Human Performance in Offline LiDAR Based 3D Object Detection Lue Fan, Yuxue Yang, Yiming Mao, Feng Wang, Yuntao Chen, Naiyan Wang, Zhaoxiang Zhang

PDF

One-Bit Flip Is All You Need: When Bit-Flip Attack Meets Model Training Jianshuo Dong, Han Qiu, Yiming Li, Tianwei Zhang, Yuanjie Li, Zeqi Lai, Chao Zhang, Shu-Tao Xia

PDF

One-Shot Generative Domain Adaptation Ceyuan Yang, Yujun Shen, Zhiyi Zhang, Yinghao Xu, Jiapeng Zhu, Zhirong Wu, Bolei Zhou

PDF

One-Shot Implicit Animatable Avatars with Model-Based Priors Yangyi Huang, Hongwei Yi, Weiyang Liu, Haofan Wang, Boxi Wu, Wenxiao Wang, Binbin Lin, Debing Zhang, Deng Cai

PDF

One-Shot Recognition of Any Material Anywhere Using Contrastive Learning with Physics-Based Rendering Manuel S. Drehwald, Sagi Eppel, Jolina Li, Han Hao, Alan Aspuru-Guzik

PDF

Online Class Incremental Learning on Stochastic Blurry Task Boundary via Mask and Visual Prompt Tuning Jun-Yeong Moon, Keon-Hee Park, Jung Uk Kim, Gyeong-Moon Park

PDF

Online Clustered Codebook Chuanxia Zheng, Andrea Vedaldi

PDF

Online Continual Learning on Hierarchical Label Expansion Byung Hyun Lee, Okchul Jung, Jonghyun Choi, Se Young Chun

PDF

Online Prototype Learning for Online Continual Learning Yujie Wei, Jiaxin Ye, Zhizhong Huang, Junping Zhang, Hongming Shan

PDF

OnlineRefer: A Simple Online Baseline for Referring Video Object Segmentation Dongming Wu, Tiancai Wang, Yuang Zhang, Xiangyu Zhang, Jianbing Shen

PDF

Open Set Video HOI Detection from Action-Centric Chain-of-Look Prompting Nan Xi, Jingjing Meng, Junsong Yuan

PDF

Open-Domain Visual Entity Recognition: Towards Recognizing Millions of Wikipedia Entities Hexiang Hu, Yi Luan, Yang Chen, Urvashi Khandelwal, Mandar Joshi, Kenton Lee, Kristina Toutanova, Ming-Wei Chang

PDF

Open-Vocabulary Object Detection with an Open Corpus Jiong Wang, Huiming Zhang, Haiwen Hong, Xuan Jin, Yuan He, Hui Xue, Zhou Zhao

PDF

Open-Vocabulary Object Segmentation with Diffusion Models Ziyi Li, Qinye Zhou, Xiaoyun Zhang, Ya Zhang, Yanfeng Wang, Weidi Xie

PDF

Open-Vocabulary Panoptic Segmentation with Embedding Modulation Xi Chen, Shuang Li, Ser-Nam Lim, Antonio Torralba, Hengshuang Zhao

PDF

Open-Vocabulary Semantic Segmentation with Decoupled One-Pass Network Cong Han, Yujie Zhong, Dengjie Li, Kai Han, Lin Ma

PDF

Open-Vocabulary Video Question Answering: A New Benchmark for Evaluating the Generalizability of Video Question Answering Models Dohwan Ko, Ji Soo Lee, Miso Choi, Jaewon Chu, Jihwan Park, Hyunwoo J. Kim

PDF

OpenOccupancy: A Large Scale Benchmark for Surrounding Semantic Occupancy Perception Xiaofeng Wang, Zheng Zhu, Wenbo Xu, Yunpeng Zhang, Yi Wei, Xu Chi, Yun Ye, Dalong Du, Jiwen Lu, Xingang Wang

PDF

OPERA: Omni-Supervised Representation Learning with Hierarchical Supervisions Chengkun Wang, Wenzhao Zheng, Zheng Zhu, Jie Zhou, Jiwen Lu

PDF

Optimizing the Placement of Roadside LiDARs for Autonomous Driving Wentao Jiang, Hao Xiang, Xinyu Cai, Runsheng Xu, Jiaqi Ma, Yikang Li, Gim Hee Lee, Si Liu

PDF

ORC: Network Group-Based Knowledge Distillation Using Online Role Change Junyong Choi, Hyeon Cho, Seokhwa Cheung, Wonjun Hwang

PDF

Ord2Seq: Regarding Ordinal Regression as Label Sequence Prediction Jinhong Wang, Yi Cheng, Jintai Chen, TingTing Chen, Danny Chen, Jian Wu

PDF

Order-Preserving Consistency Regularization for Domain Adaptation and Generalization Mengmeng Jing, Xiantong Zhen, Jingjing Li, Cees G. M. Snoek

PDF

Order-Prompted Tag Sequence Generation for Video Tagging Zongyang Ma, Ziqi Zhang, Yuxin Chen, Zhongang Qi, Yingmin Luo, Zekun Li, Chunfeng Yuan, Bing Li, Xiaohu Qie, Ying Shan, Weiming Hu

PDF

Ordered Atomic Activity for Fine-Grained Interactive Traffic Scenario Understanding Nakul Agarwal, Yi-Ting Chen

PDF

Ordinal Label Distribution Learning Changsong Wen, Xin Zhang, Xingxu Yao, Jufeng Yang

PDF

OrthoPlanes: A Novel Representation for Better 3D-Awareness of GANs Honglin He, Zhuoqian Yang, Shikai Li, Bo Dai, Wayne Wu

PDF

Out-of-Distribution Detection for Monocular Depth Estimation Julia Hornauer, Adrian Holzbock, Vasileios Belagiannis

PDF

Out-of-Domain GAN Inversion via Invertibility Decomposition for Photo-Realistic Human Face Manipulation Xin Yang, Xiaogang Xu, Yingcong Chen

PDF

Overcoming Forgetting Catastrophe in Quantization-Aware Training Ting-An Chen, De-Nian Yang, Ming-Syan Chen

PDF

Overwriting Pretrained Bias with Finetuning Data Angelina Wang, Olga Russakovsky

PDF

OxfordTVG-HIC: Can Machine Make Humorous Captions from Images? Runjia Li, Shuyang Sun, Mohamed Elhoseiny, Philip Torr

PDF

P1AC: Revisiting Absolute Pose from a Single Affine Correspondence Jonathan Ventura, Zuzana Kukelova, Torsten Sattler, Dániel Baráth

PDF

P2C: Self-Supervised Point Cloud Completion from Single Partial Clouds Ruikai Cui, Shi Qiu, Saeed Anwar, Jiawei Liu, Chaoyue Xing, Jing Zhang, Nick Barnes

PDF

PADCLIP: Pseudo-Labeling with Adaptive Debiasing in CLIP for Unsupervised Domain Adaptation Zhengfeng Lai, Noranart Vesdapunt, Ning Zhou, Jun Wu, Cong Phuoc Huynh, Xuelu Li, Kah Kuen Fu, Chen-Nee Chuah

PDF

PADDLES: Phase-Amplitude Spectrum Disentangled Early Stopping for Learning with Noisy Labels Huaxi Huang, Hui Kang, Sheng Liu, Olivier Salvado, Thierry Rakotoarivelo, Dadong Wang, Tongliang Liu

PDF

Pairwise Similarity Learning Is SimPLE Yandong Wen, Weiyang Liu, Yao Feng, Bhiksha Raj, Rita Singh, Adrian Weller, Michael J. Black, Bernhard Schölkopf

PDF

PanFlowNet: A Flow-Based Deep Network for Pan-Sharpening Gang Yang, Xiangyong Cao, Wenzhe Xiao, Man Zhou, Aiping Liu, Xun Chen, Deyu Meng

PDF

Panoramas from Photons Sacha Jungerman, Atul Ingle, Mohit Gupta

PDF

Parallax-Tolerant Unsupervised Deep Image Stitching Lang Nie, Chunyu Lin, Kang Liao, Shuaicheng Liu, Yao Zhao

PDF

Parallel Attention Interaction Network for Few-Shot Skeleton-Based Action Recognition Xingyu Liu, Sanping Zhou, Le Wang, Gang Hua

PDF

Parameterized Cost Volume for Stereo Matching Jiaxi Zeng, Chengtang Yao, Lidong Yu, Yuwei Wu, Yunde Jia

PDF

Parametric Classification for Generalized Category Discovery: A Baseline Study Xin Wen, Bingchen Zhao, Xiaojuan Qi

PDF

Parametric Depth Based Feature Representation Learning for Object Detection and Segmentation in Bird's-Eye View Jiayu Yang, Enze Xie, Miaomiao Liu, Jose M. Alvarez

PDF

Parametric Information Maximization for Generalized Category Discovery Florent Chiaroni, Jose Dolz, Ziko Imtiaz Masud, Amar Mitiche, Ismail Ben Ayed

PDF

ParCNetV2: Oversized Kernel with Enhanced Attention Ruihan Xu, Haokui Zhang, Wenze Hu, Shiliang Zhang, Xiaoyu Wang

PDF

PARF: Primitive-Aware Radiance Fusion for Indoor Scene Novel View Synthesis Haiyang Ying, Baowei Jiang, Jinzhi Zhang, Di Xu, Tao Yu, Qionghai Dai, Lu Fang

PDF

PARIS: Part-Level Reconstruction and Motion Analysis for Articulated Objects Jiayi Liu, Ali Mahdavi-Amiri, Manolis Savva

PDF

Part-Aware Transformer for Generalizable Person Re-Identification Hao Ni, Yuke Li, Lianli Gao, Heng Tao Shen, Jingkuan Song

PDF

Partition Speeds up Learning Implicit Neural Representations Based on Exponential-Increase Hypothesis Ke Liu, Feng Liu, Haishuai Wang, Ning Ma, Jiajun Bu, Bo Han

PDF

Partition-and-Debias: Agnostic Biases Mitigation via a Mixture of Biases-Specific Experts Jiaxuan Li, Duc Minh Vo, Hideki Nakayama

PDF

PARTNER: Level up the Polar Representation for LiDAR 3D Object Detection Ming Nie, Yujing Xue, Chunwei Wang, Chaoqiang Ye, Hang Xu, Xinge Zhu, Qingqiu Huang, Michael Bi Mi, Xinchao Wang, Li Zhang

PDF

Passive Ultra-Wideband Single-Photon Imaging Mian Wei, Sotiris Nousias, Rahul Gulve, David B. Lindell, Kiriakos N. Kutulakos

PDF

PASTA: Proportional Amplitude Spectrum Training Augmentation for Syn-to-Real Domain Generalization Prithvijit Chattopadhyay, Kartik Sarangmath, Vivek Vijaykumar, Judy Hoffman

PDF

PatchCT: Aligning Patch Set and Label Set with Conditional Transport for Multi-Label Image Classification Miaoge Li, Dongsheng Wang, Xinyang Liu, Zequn Zeng, Ruiying Lu, Bo Chen, Mingyuan Zhou

PDF

PATMAT: Person Aware Tuning of Mask-Aware Transformer for Face Inpainting Saman Motamed, Jianjin Xu, Chen Henry Wu, Christian Häne, Jean-Charles Bazin, Fernando De la Torre

PDF

PC-Adapter: Topology-Aware Adapter for Efficient Domain Adaption on Point Clouds with Rectified Pseudo-Label Joonhyung Park, Hyunjin Seo, Eunho Yang

PDF

PDiscoNet: Semantically Consistent Part Discovery for Fine-Grained Recognition Robert van der Klis, Stephan Alaniz, Massimiliano Mancini, Cassio F. Dantas, Dino Ienco, Zeynep Akata, Diego Marcos

PDF

PEANUT: Predicting and Navigating to Unseen Targets Albert J. Zhai, Shenlong Wang

PDF

Perceptual Artifacts Localization for Image Synthesis Tasks Lingzhi Zhang, Zhengjie Xu, Connelly Barnes, Yuqian Zhou, Qing Liu, He Zhang, Sohrab Amirghodsi, Zhe Lin, Eli Shechtman, Jianbo Shi

PDF

Perceptual Grouping in Contrastive Vision-Language Models Kanchana Ranasinghe, Brandon McKinzie, Sachin Ravi, Yinfei Yang, Alexander Toshev, Jonathon Shlens

PDF

Periodically Exchange Teacher-Student for Source-Free Object Detection Qipeng Liu, Luojun Lin, Zhifeng Shen, Zhifeng Yang

PDF

Perpetual Humanoid Control for Real-Time Simulated Avatars Zhengyi Luo, Jinkun Cao, AlexanderWinkler, Kris Kitani, Weipeng Xu

PDF

Persistent-Transient Duality: A Multi-Mechanism Approach for Modeling Human-Object Interaction Hung Tran, Vuong Le, Svetha Venkatesh, Truyen Tran

PDF

Person Re-Identification Without Identification via Event Anonymization Shafiq Ahmad, Pietro Morerio, Alessio Del Bue

PDF

Personalized Image Generation for Color Vision Deficiency Population Shuyi Jiang, Daochang Liu, Dingquan Li, Chang Xu

PDF

Personalized Semantics Excitation for Federated Image Classification Haifeng Xia, Kai Li, Zhengming Ding

PDF

PETRv2: A Unified Framework for 3D Perception from Multi-Camera Images Yingfei Liu, Junjie Yan, Fan Jia, Shuailin Li, Aqi Gao, Tiancai Wang, Xiangyu Zhang

PDF

PG-RCNN: Semantic Surface Point Generation for 3D Object Detection Inyong Koo, Inyoung Lee, Se-Ho Kim, Hee-Seon Kim, Woo-jin Jeon, Changick Kim

PDF

PGFed: Personalize Each Client's Global Objective for Federated Learning Jun Luo, Matias Mendieta, Chen Chen, Shandong Wu

PDF

PhaseMP: Robust 3D Pose Estimation via Phase-Conditioned Human Motion Prior Mingyi Shi, Sebastian Starke, Yuting Ye, Taku Komura, Jungdam Won

PDF

Phasic Content Fusing Diffusion Model with Directional Distribution Consistency for Few-Shot Model Adaption Teng Hu, Jiangning Zhang, Liang Liu, Ran Yi, Siqi Kou, Haokun Zhu, Xu Chen, Yabiao Wang, Chengjie Wang, Lizhuang Ma

PDF

PHRIT: Parametric Hand Representation with Implicit Template Zhisheng Huang, Yujin Chen, Di Kang, Jinlu Zhang, Zhigang Tu

PDF

PhysDiff: Physics-Guided Human Motion Diffusion Model Ye Yuan, Jiaming Song, Umar Iqbal, Arash Vahdat, Jan Kautz

PDF

Physically-Plausible Illumination Distribution Estimation Egor Ershov, Vasily Tesalin, Ivan Ermakov, Michael S. Brown

PDF

Physics-Augmented Autoencoder for 3D Skeleton-Based Gait Recognition Hongji Guo, Qiang Ji

PDF

Physics-Driven Turbulence Image Restoration with Stochastic Refinement Ajay Jaiswal, Xingguang Zhang, Stanley H. Chan, Zhangyang Wang

PDF

PIDRo: Parallel Isomeric Attention with Dynamic Routing for Text-Video Retrieval Peiyan Guan, Renjing Pei, Bin Shao, Jianzhuang Liu, Weimian Li, Jiaxi Gu, Hang Xu, Songcen Xu, Youliang Yan, Edmund Y. Lam

PDF

PIRNet: Privacy-Preserving Image Restoration Network via Wavelet Lifting Xin Deng, Chao Gao, Mai Xu

PDF

PivotNet: Vectorized Pivot Learning for End-to-End HD mAP Construction Wenjie Ding, Limeng Qiao, Xi Qiu, Chi Zhang

PDF

Pix2Video: Video Editing Using Image Diffusion Duygu Ceylan, Chun-Hao P. Huang, Niloy J. Mitra

PDF

Pixel Adaptive Deep Unfolding Transformer for Hyperspectral Image Reconstruction Miaoyu Li, Ying Fu, Ji Liu, Yulun Zhang

PDF

Pixel-Aligned Recurrent Queries for Multi-View 3D Object Detection Yiming Xie, Huaizu Jiang, Georgia Gkioxari, Julian Straub

PDF

Pixel-Wise Contrastive Distillation Junqiang Huang, Zichao Guo

PDF

PlanarTrack: A Large-Scale Challenging Benchmark for Planar Object Tracking Xinran Liu, Xiaoqiong Liu, Ziruo Yi, Xin Zhou, Thanh Le, Libo Zhang, Yan Huang, Qing Yang, Heng Fan

PDF

PlaneRecTR: Unified Query Learning for 3D Plane Recovery from a Single View Jingjia Shi, Shuaifeng Zhi, Kai Xu

PDF

PlankAssembly: Robust 3D Reconstruction from Three Orthographic Views with Learnt Shape Programs Wentao Hu, Jia Zheng, Zixin Zhang, Xiaojun Yuan, Jian Yin, Zihan Zhou

PDF

Plausible Uncertainties for Human Pose Regression Lennart Bramlage, Michelle Karg, Cristóbal Curio

PDF

Pluralistic Aging Diffusion Autoencoder Peipei Li, Rui Wang, Huaibo Huang, Ran He, Zhaofeng He

PDF

PNI : Industrial Anomaly Detection Using Position and Neighborhood Information Jaehyeok Bae, Jae-Han Lee, Seyun Kim

PDF

PODA: Prompt-Driven Zero-Shot Domain Adaptation Mohammad Fahes, Tuan-Hung Vu, Andrei Bursuc, Patrick Pérez, Raoul de Charette

PDF

PODIA-3D: Domain Adaptation of 3D Generative Model Across Large Domain Gap Using Pose-Preserved Text-to-Image Diffusion Gwanghyun Kim, Ji Ha Jang, Se Young Chun

PDF

Poincare ResNet Max van Spengler, Erwin Berkhout, Pascal Mettes

PDF

Point Contrastive Prediction with Semantic Clustering for Self-Supervised Learning on Point Cloud Videos Xiaoxiao Sheng, Zhiqiang Shen, Gang Xiao, Longguang Wang, Yulan Guo, Hehe Fan

PDF

Point-Query Quadtree for Crowd Counting, Localization, and More Chengxin Liu, Hao Lu, Zhiguo Cao, Tongliang Liu

PDF

Point-SLAM: Dense Neural Point Cloud-Based SLAM Erik Sandström, Yue Li, Luc Van Gool, Martin R. Oswald

PDF

Point-TTA: Test-Time Adaptation for Point Cloud Registration Using Multitask Meta-Auxiliary Learning Ahmed Hatem, Yiming Qian, Yang Wang

PDF

Point2Mask: Point-Supervised Panoptic Segmentation via Optimal Transport Wentong Li, Yuqian Yuan, Song Wang, Jianke Zhu, Jianshu Li, Jian Liu, Lei Zhang

PDF

PointCLIP V2: Prompting CLIP and GPT for Powerful 3D Open-World Learning Xiangyang Zhu, Renrui Zhang, Bowei He, Ziyu Guo, Ziyao Zeng, Zipeng Qin, Shanghang Zhang, Peng Gao

PDF

PointDC: Unsupervised Semantic Segmentation of 3D Point Clouds via Cross-Modal Distillation and Super-Voxel Clustering Zisheng Chen, Hongbin Xu, Weitao Chen, Zhipeng Zhou, Haihong Xiao, Baigui Sun, Xuansong Xie, Wenxiong Kang

PDF

PointMBF: A Multi-Scale Bidirectional Fusion Network for Unsupervised RGB-D Point Cloud Registration Mingzhi Yuan, Kexue Fu, Zhihao Li, Yucong Meng, Manning Wang

PDF

PointOdyssey: A Large-Scale Synthetic Dataset for Long-Term Point Tracking Yang Zheng, Adam W. Harley, Bokui Shen, Gordon Wetzstein, Leonidas J. Guibas

PDF

PolicyCleanse: Backdoor Detection and Mitigation for Competitive Reinforcement Learning Junfeng Guo, Ang Li, Lixu Wang, Cong Liu

PDF

Ponder: Point Cloud Pre-Training via Neural Rendering Di Huang, Sida Peng, Tong He, Honghui Yang, Xiaowei Zhou, Wanli Ouyang

PDF

Pose-Free Neural Radiance Fields via Implicit Pose Regularization Jiahui Zhang, Fangneng Zhan, Yingchen Yu, Kunhao Liu, Rongliang Wu, Xiaoqin Zhang, Ling Shao, Shijian Lu

PDF

PoseDiffusion: Solving Pose Estimation via Diffusion-Aided Bundle Adjustment Jianyuan Wang, Christian Rupprecht, David Novotny

PDF

PoseFix: Correcting 3D Human Poses with Natural Language Ginger Delmas, Philippe Weinzaepfel, Francesc Moreno-Noguer, Grégory Rogez

PDF

PourIt!: Weakly-Supervised Liquid Perception from a Single Image for Visual Closed-Loop Robotic Pouring Haitao Lin, Yanwei Fu, Xiangyang Xue

PDF

PPR: Physically Plausible Reconstruction from Monocular Videos Gengshan Yang, Shuo Yang, John Z. Zhang, Zachary Manchester, Deva Ramanan

PDF

Practical Membership Inference Attacks Against Large-Scale Multi-Modal Models: A Pilot Study Myeongseob Ko, Ming Jin, Chenguang Wang, Ruoxi Jia

PDF

PRANC: Pseudo RAndom Networks for Compacting Deep Models Parsa Nooralinejad, Ali Abbasi, Soroush Abbasi Koohpayegani, Kossar Pourahmadi Meibodi, Rana Muhammad Shahroz Khan, Soheil Kolouri, Hamed Pirsiavash

PDF

Pre-Training Vision Transformers with Very Limited Synthesized Images Ryo Nakamura, Hirokatsu Kataoka, Sora Takashima, Edgar Josafat Martinez Noriega, Rio Yokota, Nakamasa Inoue

PDF

Pre-Training-Free Image Manipulation Localization Through Non-Mutually Exclusive Contrastive Learning Jizhe Zhou, Xiaochen Ma, Xia Du, Ahmed Y. Alhammadi, Wentao Feng

PDF

Predict to Detect: Prediction-Guided 3D Object Detection Using Sequential Images Sanmin Kim, Youngseok Kim, In-Jae Lee, Dongsuk Kum

PDF

Preface: A Data-Driven Volumetric Prior for Few-Shot Ultra High-Resolution Face Synthesis Marcel C. Bühler, Kripasindhu Sarkar, Tanmay Shah, Gengyan Li, Daoye Wang, Leonhard Helminger, Sergio Orts-Escolano, Dmitry Lagun, Otmar Hilliges, Thabo Beeler, Abhimitra Meka

PDF

Preparing the Future for Continual Semantic Segmentation Zihan Lin, Zilei Wang, Yixin Zhang

PDF

Preserve Your Own Correlation: A Noise Prior for Video Diffusion Models Songwei Ge, Seungjun Nah, Guilin Liu, Tyler Poon, Andrew Tao, Bryan Catanzaro, David Jacobs, Jia-Bin Huang, Ming-Yu Liu, Yogesh Balaji

PDF

Preserving Modality Structure Improves Multi-Modal Learning Sirnam Swetha, Mamshad Nayeem Rizve, Nina Shvetsova, Hilde Kuehne, Mubarak Shah

PDF

Preserving Tumor Volumes for Unsupervised Medical Image Registration Qihua Dong, Hao Du, Ying Song, Yan Xu, Jing Liao

PDF

PreSTU: Pre-Training for Scene-Text Understanding Jihyung Kil, Soravit Changpinyo, Xi Chen, Hexiang Hu, Sebastian Goodman, Wei-Lun Chao, Radu Soricut

PDF

Pretrained Language Models as Visual Planners for Human Assistance Dhruvesh Patel, Hamid Eghbalzadeh, Nitin Kamra, Michael Louis Iuzzolino, Unnat Jain, Ruta Desai

PDF

Preventing Zero-Shot Transfer Degradation in Continual Learning of Vision-Language Models Zangwei Zheng, Mingyuan Ma, Kai Wang, Ziheng Qin, Xiangyu Yue, Yang You

PDF

Prior-Guided Source-Free Domain Adaptation for Human Pose Estimation Dripta S. Raychaudhuri, Calvin-Khang Ta, Arindam Dutta, Rohit Lal, Amit K. Roy-Chowdhury

PDF

PRIOR: Prototype Representation Joint Learning from Medical Images and Reports Pujin Cheng, Li Lin, Junyan Lyu, Yijin Huang, Wenhan Luo, Xiaoying Tang

PDF

Priority-Centric Human Motion Generation in Discrete Latent Space Hanyang Kong, Kehong Gong, Dongze Lian, Michael Bi Mi, Xinchao Wang

PDF

Privacy Preserving Localization via Coordinate Permutations Linfei Pan, Johannes L. Schönberger, Viktor Larsson, Marc Pollefeys

PDF

Privacy-Preserving Face Recognition Using Random Frequency Components Yuxi Mi, Yuge Huang, Jiazhen Ji, Minyi Zhao, Jiaxiang Wu, Xingkun Xu, Shouhong Ding, Shuigeng Zhou

PDF

Probabilistic Human Mesh Recovery in 3D Scenes from Egocentric Views Siwei Zhang, Qianli Ma, Yan Zhang, Sadegh Aliakbarian, Darren Cosker, Siyu Tang

PDF

Probabilistic Modeling of Inter- and Intra-Observer Variability in Medical Image Segmentation Arne Schmidt, Pablo Morales-Álvarez, Rafael Molina

PDF

Probabilistic Precision and Recall Towards Reliable Evaluation of Generative Models Dogyun Park, Suhyun Kim

PDF

Probabilistic Triangulation for Uncalibrated Multi-View 3D Human Pose Estimation Boyuan Jiang, Lei Hu, Shihong Xia

PDF

ProbVLM: Probabilistic Adapter for Frozen Vison-Language Models Uddeshya Upadhyay, Shyamgopal Karthik, Massimiliano Mancini, Zeynep Akata

PDF

Progressive Spatio-Temporal Prototype Matching for Text-Video Retrieval Pandeng Li, Chen-Wei Xie, Liming Zhao, Hongtao Xie, Jiannan Ge, Yun Zheng, Deli Zhao, Yongdong Zhang

PDF

Prompt Switch: Efficient CLIP Adaptation for Text-Video Retrieval Chaorui Deng, Qi Chen, Pengda Qin, Da Chen, Qi Wu

PDF

Prompt Tuning Inversion for Text-Driven Image Editing Using Diffusion Models Wenkai Dong, Song Xue, Xiaoyue Duan, Shumin Han

PDF

Prompt-Aligned Gradient for Prompt Tuning Beier Zhu, Yulei Niu, Yucheng Han, Yue Wu, Hanwang Zhang

PDF

PromptCap: Prompt-Guided Image Captioning for VQA with GPT-3 Yushi Hu, Hang Hua, Zhengyuan Yang, Weijia Shi, Noah A. Smith, Jiebo Luo

PDF

PromptStyler: Prompt-Driven Style Generation for Source-Free Domain Generalization Junhyeong Cho, Gilhyun Nam, Sungyeon Kim, Hunmin Yang, Suha Kwak

PDF

ProPainter: Improving Propagation and Transformer for Video Inpainting Shangchen Zhou, Chongyi Li, Kelvin C.K. Chan, Chen Change Loy

PDF

ProtoFL: Unsupervised Federated Learning via Prototypical Distillation Hansol Kim, Youngjun Kwak, Minyoung Jung, Jinho Shin, Youngsung Kim, Changick Kim

PDF

ProtoTransfer: Cross-Modal Prototype Transfer for Point Cloud Segmentation Pin Tang, Hai-Ming Xu, Chao Ma

PDF

Prototype Reminiscence and Augmented Asymmetric Knowledge Aggregation for Non-Exemplar Class-Incremental Learning Wuxuan Shi, Mang Ye

PDF

Prototype-Based Dataset Comparison Nanne van Noord

PDF

Prototypes-Oriented Transductive Few-Shot Learning with Conditional Transport Long Tian, Jingyi Feng, Xiaoqiang Chai, Wenchao Chen, Liming Wang, Xiyang Liu, Bo Chen

PDF

Prototypical Kernel Learning and Open-Set Foreground Perception for Generalized Few-Shot Semantic Segmentation Kai Huang, Feigege Wang, Ye Xi, Yutao Gao

PDF

Prototypical Mixing and Retrieval-Based Refinement for Label Noise-Resistant Image Retrieval Xinlong Yang, Haixin Wang, Jinan Sun, Shikun Zhang, Chong Chen, Xian-Sheng Hua, Xiao Luo

PDF

Proxy Anchor-Based Unsupervised Learning for Continuous Generalized Category Discovery Hyungmin Kim, Sungho Suh, Daehwan Kim, Daun Jeong, Hansang Cho, Junmo Kim

PDF

Prune Spatio-Temporal Tokens by Semantic-Aware Temporal Accumulation Shuangrui Ding, Peisen Zhao, Xiaopeng Zhang, Rui Qian, Hongkai Xiong, Qi Tian

PDF

Pseudo Flow Consistency for Self-Supervised 6d Object Pose Estimation Yang Hai, Rui Song, Jiaojiao Li, David Ferstl, Yinlin Hu

PDF

Pseudo-Label Alignment for Semi-Supervised Instance Segmentation Jie Hu, Chen Chen, Liujuan Cao, Shengchuan Zhang, Annan Shu, Guannan Jiang, Rongrong Ji

PDF

PVT++: A Simple End-to-End Latency-Aware Visual Tracking Framework Bowen Li, Ziyuan Huang, Junjie Ye, Yiming Li, Sebastian Scherer, Hang Zhao, Changhong Fu

PDF

Pyramid Dual Domain Injection Network for Pan-Sharpening Xuanhua He, Keyu Yan, Rui Li, Chengjun Xie, Jie Zhang, Man Zhou

PDF

Q-Diffusion: Quantizing Diffusion Models Xiuyu Li, Yijiang Liu, Long Lian, Huanrui Yang, Zhen Dong, Daniel Kang, Shanghang Zhang, Kurt Keutzer

PDF

QD-BEV : Quantization-Aware View-Guided Distillation for Multi-View 3D Object Detection Yifan Zhang, Zhen Dong, Huanrui Yang, Ming Lu, Cheng-Ching Tseng, Yuan Du, Kurt Keutzer, Li Du, Shanghang Zhang

PDF

Quality Diversity for Visual Pre-Training Ruchika Chavhan, Henry Gouk, Da Li, Timothy Hospedales

PDF

Quality-Agnostic Deepfake Detection with Intra-Model Collaborative Learning Binh M. Le, Simon S. Woo

PDF

Query Refinement Transformer for 3D Instance Segmentation Jiahao Lu, Jiacheng Deng, Chuxin Wang, Jianfeng He, Tianzhu Zhang

PDF

Query6DoF: Learning Sparse Queries as Implicit Shape Prior for Category-Level 6DoF Pose Estimation Ruiqi Wang, Xinggang Wang, Te Li, Rong Yang, Minhong Wan, Wenyu Liu

PDF

R-Pred: Two-Stage Motion Prediction via Tube-Query Attention-Based Trajectory Refinement Sehwan Choi, Jungho Kim, Junyong Yun, Jun Won Choi

PDF

R3D3: Dense 3D Reconstruction of Dynamic Scenes from Multiple Cameras Aron Schmied, Tobias Fischer, Martin Danelljan, Marc Pollefeys, Fisher Yu

PDF

RANA: Relightable Articulated Neural Avatars Umar Iqbal, Akin Caliskan, Koki Nagano, Sameh Khamis, Pavlo Molchanov, Jan Kautz

PDF

Random Boxes Are Open-World Object Detectors Yanghao Wang, Zhongqi Yue, Xian-Sheng Hua, Hanwang Zhang

PDF

Random Sub-Samples Generation for Self-Supervised Real Image Denoising Yizhong Pan, Xiao Liu, Xiangyu Liao, Yuanzhouhan Cao, Chao Ren

PDF

Randomized Quantization: A Generic Augmentation for Data Agnostic Self-Supervised Learning Huimin Wu, Chenyang Lei, Xiao Sun, Peng-Shuai Wang, Qifeng Chen, Kwang-Ting Cheng, Stephen Lin, Zhirong Wu

PDF

RankMatch: Fostering Confidence and Consistency in Learning with Noisy Labels Ziyi Zhang, Weikai Chen, Chaowei Fang, Zhen Li, Lechao Chen, Liang Lin, Guanbin Li

PDF

RankMixup: Ranking-Based Mixup Training for Network Calibration Jongyoun Noh, Hyekang Park, Junghyup Lee, Bumsub Ham

PDF

Rapid Adaptation in Online Continual Learning: Are We Evaluating It Right? Hasan Abed Al Kader Hammoud, Ameya Prabhu, Ser-Nam Lim, Philip H.S. Torr, Adel Bibi, Bernard Ghanem

PDF

Rapid Network Adaptation: Learning to Adapt Neural Networks Using Test-Time Feedback Teresa Yeo, Oğuzhan Fatih Kar, Zahra Sodagar, Amir Zamir

PDF

RawHDR: High Dynamic Range Image Reconstruction from a Single Raw Image Yunhao Zou, Chenggang Yan, Ying Fu

PDF

Ray Conditioning: Trading Photo-Consistency for Photo-Realism in Multi-View Image Generation Eric Ming Chen, Sidhanth Holalkere, Ruyu Yan, Kai Zhang, Abe Davis

PDF

RbA: Segmenting Unknown Regions Rejected by All Nazir Nayal, Misra Yavuz, João F. Henriques, Fatma Güney

PDF

RCA-NOC: Relative Contrastive Alignment for Novel Object Captioning Jiashuo Fan, Yaoyuan Liang, Leyao Liu, Shaolun Huang, Lei Zhang

PDF

Re-Mine, Learn and Reason: Exploring the Cross-Modal Semantic Correlations for Language-Guided HOI Detection Yichao Cao, Qingfei Tang, Feng Yang, Xiu Su, Shan You, Xiaobo Lu, Chang Xu

PDF

Re-ReND: Real-Time Rendering of NeRFs Across Devices Sara Rojas, Jesus Zarzar, Juan C. Pérez, Artsiom Sanakoyeu, Ali Thabet, Albert Pumarola, Bernard Ghanem

PDF

Re:PolyWorld - A Graph Neural Network for Polygonal Scene Parsing Stefano Zorzi, Friedrich Fraundorfer

PDF

ReactioNet: Learning High-Order Facial Behavior from Universal Stimulus-Reaction by Dyadic Relation Reasoning Xiaotian Li, Taoyue Wang, Geran Zhao, Xiang Zhang, Xi Kang, Lijun Yin

PDF

Read-Only Prompt Optimization for Vision-Language Few-Shot Learning Dongjun Lee, Seokwon Song, Jihee Suh, Joonmyeong Choi, Sanghyeok Lee, Hyunwoo J. Kim

PDF

Real-Time Neural Rasterization for Large Scenes Jeffrey Yunfan Liu, Yun Chen, Ze Yang, Jingkang Wang, Sivabalan Manivasagam, Raquel Urtasun

PDF

RealGraph: A Multiview Dataset for 4D Real-World Context Graph Generation Haozhe Lin, Zequn Chen, Jinzhi Zhang, Bing Bai, Yu Wang, Ruqi Huang, Lu Fang

PDF

Realistic Full-Body Tracking from Sparse Observations via Joint-Level Modeling Xiaozheng Zheng, Zhuo Su, Chao Wen, Zhou Xue, Xiaojie Jin

PDF

REAP: A Large-Scale Realistic Adversarial Patch Benchmark Nabeel Hingun, Chawin Sitawarin, Jerry Li, David Wagner

PDF

Reconciling Object-Level and Global-Level Objectives for Long-Tail Detection Shaoyu Zhang, Chen Chen, Silong Peng

PDF

Reconstructed Convolution Module Based Look-up Tables for Efficient Image Super-Resolution Guandu Liu, Yukang Ding, Mading Li, Ming Sun, Xing Wen, Bin Wang

PDF

Reconstructing Groups of People with Hypergraph Relational Reasoning Buzhen Huang, Jingyi Ju, Zhihao Li, Yangang Wang

PDF

Reconstructing Interacting Hands with Interaction Prior from Monocular Images Binghui Zuo, Zimeng Zhao, Wenqian Sun, Wei Xie, Zhou Xue, Yangang Wang

PDF

Recovering a Molecule's 3D Dynamics from Liquid-Phase Electron Microscopy Movies Enze Ye, Yuhang Wang, Hong Zhang, Yiqin Gao, Huan Wang, He Sun

PDF

RecRecNet: Rectangling Rectified Wide-Angle Images by Thin-Plate Spline Model and DoF-Based Curriculum Learning Kang Liao, Lang Nie, Chunyu Lin, Zishuo Zheng, Yao Zhao

PDF

Recursive Video Lane Detection Dongkwon Jin, Dahyun Kim, Chang-Su Kim

PDF

RecursiveDet: End-to-End Region-Based Recursive Object Detection Jing Zhao, Li Sun, Qingli Li

PDF

RED-PSM: Regularization by Denoising of Partially Separable Models for Dynamic Imaging Berk Iskender, Marc L. Klasky, Yoram Bresler

PDF

Reducing Training Time in Cross-Silo Federated Learning Using Multigraph Topology Tuong Do, Binh X. Nguyen, Vuong Pham, Toan Tran, Erman Tjiputra, Quang D. Tran, Anh Nguyen

PDF

Ref-NeuS: Ambiguity-Reduced Neural Implicit Surface Learning for Multi-View Reconstruction with Reflection Wenhang Ge, Tao Hu, Haoyu Zhao, Shu Liu, Ying-Cong Chen

PDF

RefEgo: Referring Expression Comprehension Dataset from First-Person Perception of Ego4D Shuhei Kurita, Naoki Katsura, Eri Onami

PDF

Reference-Guided Controllable Inpainting of Neural Radiance Fields Ashkan Mirzaei, Tristan Aumentado-Armstrong, Marcus A. Brubaker, Jonathan Kelly, Alex Levinshtein, Konstantinos G. Derpanis, Igor Gilitschenski

PDF

Referring Image Segmentation Using Text Supervision Fang Liu, Yuhao Liu, Yuqiu Kong, Ke Xu, Lihe Zhang, Baocai Yin, Gerhard Hancke, Rynson Lau

PDF

ReFit: Recurrent Fitting Network for 3D Human Recovery Yufu Wang, Kostas Daniilidis

PDF

ReGen: A Good Generative Zero-Shot Video Classifier Should Be Rewarded Adrian Bulat, Enrique Sanchez, Brais Martinez, Georgios Tzimiropoulos

PDF

RegFormer: An Efficient Projection-Aware Transformer Network for Large-Scale Point Cloud Registration Jiuming Liu, Guangming Wang, Zhe Liu, Chaokang Jiang, Marc Pollefeys, Hesheng Wang

PDF

Regularized Mask Tuning: Uncovering Hidden Knowledge in Pre-Trained Vision-Language Models Kecheng Zheng, Wei Wu, Ruili Feng, Kai Zhu, Jiawei Liu, Deli Zhao, Zheng-Jun Zha, Wei Chen, Yujun Shen

PDF

Regularized Primitive Graph Learning for Unified Vector Mapping Lei Wang, Min Dai, Jianan He, Jingwei Huang

PDF

Rehearsal-Free Domain Continual Face Anti-Spoofing: Generalize More and Forget Less Rizhao Cai, Yawen Cui, Zhi Li, Zitong Yu, Haoliang Li, Yongjian Hu, Alex Kot

PDF

Reinforce Data, Multiply Impact: Improved Model Accuracy and Robustness with Dataset Reinforcement Fartash Faghri, Hadi Pouransari, Sachin Mehta, Mehrdad Farajtabar, Ali Farhadi, Mohammad Rastegari, Oncel Tuzel

PDF

Reinforced Disentanglement for Face Swapping Without Skip Connection Xiaohang Ren, Xingyu Chen, Pengfei Yao, Heung-Yeung Shum, Baoyuan Wang

PDF

ReLeaPS : Reinforcement Learning-Based Illumination Planning for Generalized Photometric Stereo Jun Hoong Chan, Bohan Yu, Heng Guo, Jieji Ren, Zongqing Lu, Boxin Shi

PDF

Relightify: Relightable 3D Faces from a Single Image via Diffusion Models Foivos Paraperas Papantoniou, Alexandros Lattas, Stylianos Moschoglou, Stefanos Zafeiriou

PDF

Remembering Normality: Memory-Guided Knowledge Distillation for Unsupervised Anomaly Detection Zhihao Gu, Liang Liu, Xu Chen, Ran Yi, Jiangning Zhang, Yabiao Wang, Chengjie Wang, Annan Shu, Guannan Jiang, Lizhuang Ma

PDF

ReMoDiffuse: Retrieval-Augmented Motion Diffusion Model Mingyuan Zhang, Xinying Guo, Liang Pan, Zhongang Cai, Fangzhou Hong, Huirong Li, Lei Yang, Ziwei Liu

PDF

Removing Anomalies as Noises for Industrial Defect Localization Fanbin Lu, Xufeng Yao, Chi-Wing Fu, Jiaya Jia

PDF

RenderIH: A Large-Scale Synthetic Dataset for 3D Interacting Hand Pose Estimation Lijun Li, Linrui Tian, Xindi Zhang, Qi Wang, Bang Zhang, Liefeng Bo, Mengyuan Liu, Chen Chen

PDF

Rendering Humans from Object-Occluded Monocular Videos Tiange Xiang, Adam Sun, Jiajun Wu, Ehsan Adeli, Li Fei-Fei

PDF

ReNeRF: Relightable Neural Radiance Fields with Nearfield Lighting Yingyan Xu, Gaspard Zoss, Prashanth Chandran, Markus Gross, Derek Bradley, Paulo Gotardo

PDF

Replay: Multi-Modal Multi-View Acted Videos for Casual Holography Roman Shapovalov, Yanir Kleiman, Ignacio Rocco, David Novotny, Andrea Vedaldi, Changan Chen, Filippos Kokkinos, Ben Graham, Natalia Neverova

PDF

RepQ-ViT: Scale Reparameterization for Post-Training Quantization of Vision Transformers Zhikai Li, Junrui Xiao, Lianwei Yang, Qingyi Gu

PDF

Representation Disparity-Aware Distillation for 3D Object Detection Yanjing Li, Sheng Xu, Mingbao Lin, Jihao Yin, Baochang Zhang, Xianbin Cao

PDF

Representation Uncertainty in Self-Supervised Learning as Variational Inference Hiroki Nakamura, Masashi Okada, Tadahiro Taniguchi

PDF

Residual Pattern Learning for Pixel-Wise Out-of-Distribution Detection in Semantic Segmentation Yuyuan Liu, Choubo Ding, Yu Tian, Guansong Pang, Vasileios Belagiannis, Ian Reid, Gustavo Carneiro

PDF

ResQ: Residual Quantization for Video Perception Davide Abati, Haitam Ben Yahia, Markus Nagel, Amirhossein Habibian

PDF

REST: A Reconfigurable Spatial-Temporal Graph Model for Multi-Camera Multi-Object Tracking Cheng-Che Cheng, Min-Xuan Qiu, Chen-Kuo Chiang, Shang-Hong Lai

PDF

Rethinking Amodal Video Segmentation from Learning Supervised Signals with Object-Centric Representation Ke Fan, Jingshi Lei, Xuelin Qian, Miaopeng Yu, Tianjun Xiao, Tong He, Zheng Zhang, Yanwei Fu

PDF

Rethinking Data Distillation: Do Not Overlook Calibration Dongyao Zhu, Bowen Lei, Jie Zhang, Yanbo Fang, Yiqun Xie, Ruqi Zhang, Dongkuan Xu

PDF

Rethinking Fast Fourier Convolution in Image Inpainting Tianyi Chu, Jiafu Chen, Jiakai Sun, Shuobin Lian, Zhizhong Wang, Zhiwen Zuo, Lei Zhao, Wei Xing, Dongming Lu

PDF

Rethinking Mobile Block for Efficient Attention-Based Models Jiangning Zhang, Xiangtai Li, Jian Li, Liang Liu, Zhucun Xue, Boshen Zhang, Zhengkai Jiang, Tianxin Huang, Yabiao Wang, Chengjie Wang

PDF

Rethinking Multi-Contrast MRI Super-Resolution: Rectangle-Window Cross-Attention Transformer and Arbitrary-Scale Upsampling Guangyuan Li, Lei Zhao, Jiakai Sun, Zehua Lan, Zhanjie Zhang, Jiafu Chen, Zhijie Lin, Huaizhong Lin, Wei Xing

PDF

Rethinking Point Cloud Registration as Masking and Reconstruction Guangyan Chen, Meiling Wang, Li Yuan, Yi Yang, Yufeng Yue

PDF

Rethinking Pose Estimation in Crowds: Overcoming the Detection Information Bottleneck and Ambiguity Mu Zhou, Lucas Stoffl, Mackenzie Weygandt Mathis, Alexander Mathis

PDF

Rethinking Range View Representation for LiDAR Segmentation Lingdong Kong, Youquan Liu, Runnan Chen, Yuexin Ma, Xinge Zhu, Yikang Li, Yuenan Hou, Yu Qiao, Ziwei Liu

PDF

Rethinking Safe Semi-Supervised Learning: Transferring the Open-Set Problem to a Close-Set One Qiankun Ma, Jiyao Gao, Bo Zhan, Yunpeng Guo, Jiliu Zhou, Yan Wang

PDF

Rethinking the Role of Pre-Trained Networks in Source-Free Domain Adaptation Wenyu Zhang, Li Shen, Chuan-Sheng Foo

PDF

Rethinking Video Frame Interpolation from Shutter Mode Induced Degradation Xiang Ji, Zhixiang Wang, Zhihang Zhong, Yinqiang Zheng

PDF

Rethinking Vision Transformers for MobileNet Size and Speed Yanyu Li, Ju Hu, Yang Wen, Georgios Evangelidis, Kamyar Salahi, Yanzhi Wang, Sergey Tulyakov, Jian Ren

PDF

Retinexformer: One-Stage Retinex-Based Transformer for Low-Light Image Enhancement Yuanhao Cai, Hao Bian, Jing Lin, Haoqian Wang, Radu Timofte, Yulun Zhang

PDF

Retro-FPN: Retrospective Feature Pyramid Network for Point Cloud Semantic Segmentation Peng Xiang, Xin Wen, Yu-Shen Liu, Hui Zhang, Yi Fang, Zhizhong Han

PDF

Revisit PCA-Based Technique for Out-of-Distribution Detection Xiaoyuan Guan, Zhouwu Liu, Wei-Shi Zheng, Yuren Zhou, Ruixuan Wang

PDF

Revisiting Domain-Adaptive 3D Object Detection by Reliable, Diverse and Class-Balanced Pseudo-Labeling Zhuoxiao Chen, Yadan Luo, Zheng Wang, Mahsa Baktashmotlagh, Zi Huang

PDF

Revisiting Foreground and Background Separation in Weakly-Supervised Temporal Action Localization: A Clustering-Based Approach Qinying Liu, Zilei Wang, Shenghai Rong, Junjie Li, Yixin Zhang

PDF

Revisiting Scene Text Recognition: A Data Perspective Qing Jiang, Jiapeng Wang, Dezhi Peng, Chongyu Liu, Lianwen Jin

PDF

Revisiting the Parameter Efficiency of Adapters from the Perspective of Precision Redundancy Shibo Jie, Haoqing Wang, Zhi-Hong Deng

PDF

Revisiting Vision Transformer from the View of Path Ensemble Shuning Chang, Pichao Wang, Hao Luo, Fan Wang, Mike Zheng Shou

PDF

RFD-ECNet: Extreme Underwater Image Compression with Reference to Feature Dictionary Mengyao Li, Liquan Shen, Peng Ye, Guorui Feng, Zheyin Wang

PDF

RFLA: A Stealthy Reflected Light Adversarial Attack in the Physical World Donghua Wang, Wen Yao, Tingsong Jiang, Chao Li, Xiaoqian Chen

PDF

Rickrolling the Artist: Injecting Backdoors into Text Encoders for Text-to-Image Synthesis Lukas Struppek, Dominik Hintersdorf, Kristian Kersting

PDF

RICO: Regularizing the Unobservable for Indoor Compositional Reconstruction Zizhang Li, Xiaoyang Lyu, Yuanyuan Ding, Mengmeng Wang, Yiyi Liao, Yong Liu

PDF

RIGID: Recurrent GAN Inversion and Editing of Real Face Videos Yangyang Xu, Shengfeng He, Kwan-Yee K. Wong, Ping Luo

PDF

RLIPv2: Fast Scaling of Relational Language-Image Pre-Training Hangjie Yuan, Shiwei Zhang, Xiang Wang, Samuel Albanie, Yining Pan, Tao Feng, Jianwen Jiang, Dong Ni, Yingya Zhang, Deli Zhao

PDF

RLSAC: Reinforcement Learning Enhanced Sample Consensus for End-to-End Robust Estimation Chang Nie, Guangming Wang, Zhe Liu, Luca Cavalli, Marc Pollefeys, Hesheng Wang

PDF

RMP-Loss: Regularizing Membrane Potential Distribution for Spiking Neural Networks Yufei Guo, Xiaode Liu, Yuanpei Chen, Liwen Zhang, Weihang Peng, Yuhan Zhang, Xuhui Huang, Zhe Ma

PDF

Robo3D: Towards Robust and Reliable 3D Perception Against Corruptions Lingdong Kong, Youquan Liu, Xin Li, Runnan Chen, Wenwei Zhang, Jiawei Ren, Liang Pan, Kai Chen, Ziwei Liu

PDF

Robust E-NeRF: NeRF from Sparse & Noisy Events Under Non-Uniform Motion Weng Fei Low, Gim Hee Lee

PDF

Robust Evaluation of Diffusion-Based Adversarial Purification Minjong Lee, Dongwoo Kim

PDF

Robust Frame-to-Frame Camera Rotation Estimation in Crowded Scenes Fabien Delattre, David Dirnfeld, Phat Nguyen, Stephen K Scarano, Michael J Jones, Pedro Miraldo, Erik Learned-Miller

PDF

Robust Geometry-Preserving Depth Estimation Using Differentiable Rendering Chi Zhang, Wei Yin, Gang Yu, Zhibin Wang, Tao Chen, Bin Fu, Joey Tianyi Zhou, Chunhua Shen

PDF

Robust Heterogeneous Federated Learning Under Data Corruption Xiuwen Fang, Mang Ye, Xiyuan Yang

PDF

Robust Mixture-of-Expert Training for Convolutional Neural Networks Yihua Zhang, Ruisi Cai, Tianlong Chen, Guanhua Zhang, Huan Zhang, Pin-Yu Chen, Shiyu Chang, Zhangyang Wang, Sijia Liu

PDF

Robust Monocular Depth Estimation Under Challenging Conditions Stefano Gasperini, Nils Morbitzer, HyunJun Jung, Nassir Navab, Federico Tombari

PDF

Robust Object Modeling for Visual Tracking Yidong Cai, Jie Liu, Jie Tang, Gangshan Wu

PDF

Robust One-Shot Face Video Re-Enactment Using Hybrid Latent Spaces of StyleGAN2 Trevine Oorloff, Yaser Yacoob

PDF

Robust Referring Video Object Segmentation with Cyclic Structural Consensus Xiang Li, Jinglu Wang, Xiaohao Xu, Xiao Li, Bhiksha Raj, Yan Lu

PDF

Robustifying Token Attention for Vision Transformers Yong Guo, David Stutz, Bernt Schiele

PDF

Role-Aware Interaction Generation from Textual Description Mikihiro Tanaka, Kent Fujiwara

PDF

ROME: Robustifying Memory-Efficient NAS via Topology Disentanglement and Gradient Accumulation Xiaoxing Wang, Xiangxiang Chu, Yuda Fan, Zhexi Zhang, Bo Zhang, Xiaokang Yang, Junchi Yan

PDF

Root Pose Decomposition Towards Generic Non-Rigid 3D Reconstruction with Monocular Videos Yikai Wang, Yinpeng Dong, Fuchun Sun, Xiao Yang

PDF

Rosetta Neurons: Mining the Common Units in a Model Zoo Amil Dravid, Yossi Gandelsman, Alexei A. Efros, Assaf Shocher

PDF

RPEFlow: Multimodal Fusion of RGB-PointCloud-Event for Joint Optical Flow and Scene Flow Estimation Zhexiong Wan, Yuxin Mao, Jing Zhang, Yuchao Dai

PDF

RPG-PaLM: Realistic Pseudo-Data Generation for Palmprint Recognition Lei Shen, Jianlong Jin, Ruixin Zhang, Huaen Li, Kai Zhao, Yingyi Zhang, Jingyun Zhang, Shouhong Ding, Yang Zhao, Wei Jia

PDF

RSFNet: A White-Box Image Retouching Approach Using Region-Specific Color Filters Wenqi Ouyang, Yi Dong, Xiaoyang Kang, Peiran Ren, Xin Xu, Xuansong Xie

PDF

S-Adaptive Decoupled Prototype for Few-Shot Object Detection Jinhao Du, Shan Zhang, Qiang Chen, Haifeng Le, Yanpeng Sun, Yao Ni, Jian Wang, Bin He, Jingdong Wang

PDF

S-TREK: Sequential Translation and Rotation Equivariant Keypoints for Local Feature Extraction Emanuele Santellani, Christian Sormann, Mattia Rossi, Andreas Kuhn, Friedrich Fraundorfer

PDF

S-VolSDF: Sparse Multi-View Stereo Regularization of Neural Implicit Surfaces Haoyu Wu, Alexandros Graikos, Dimitris Samaras

PDF

S3IM: Stochastic Structural SIMilarity and Its Unreasonable Effectiveness for Neural Fields Zeke Xie, Xindi Yang, Yujie Yang, Qi Sun, Yixiang Jiang, Haoran Wang, Yunfeng Cai, Mingming Sun

PDF

SA-BEV: Generating Semantic-Aware Bird's-Eye-View Feature for Multi-View 3D Object Detection Jinqing Zhang, Yanan Zhang, Qingjie Liu, Yunhong Wang

PDF

SAFARI: Versatile and Efficient Evaluations for Robustness of Interpretability Wei Huang, Xingyu Zhao, Gaojie Jin, Xiaowei Huang

PDF

SAFE: Machine Unlearning with Shard Graphs Yonatan Dukler, Benjamin Bowman, Alessandro Achille, Aditya Golatkar, Ashwin Swaminathan, Stefano Soatto

PDF

SAFE: Sensitivity-Aware Features for Out-of-Distribution Object Detection Samuel Wilson, Tobias Fischer, Feras Dayoub, Dimity Miller, Niko Sünderhauf

PDF

SAFL-Net: Semantic-Agnostic Feature Learning Network with Auxiliary Plugins for Image Manipulation Detection Zhihao Sun, Haoran Jiang, Danding Wang, Xirong Li, Juan Cao

PDF

SAGA: Spectral Adversarial Geometric Attack on 3D Meshes Tomer Stolik, Itai Lang, Shai Avidan

PDF

SAL-ViT: Towards Latency Efficient Private Inference on ViT Using Selective Attention Search with a Learnable SoftMax Approximation Yuke Zhang, Dake Chen, Souvik Kundu, Chenghao Li, Peter A. Beerel

PDF

SALAD: Part-Level Latent Diffusion for 3D Shape Generation and Manipulation Juil Koo, Seungwoo Yoo, Minh Hieu Nguyen, Minhyuk Sung

PDF

Saliency Regularization for Self-Training with Partial Annotations Shouwen Wang, Qian Wan, Xiang Xiang, Zhigang Zeng

PDF

Sample-Adaptive Augmentation for Point Cloud Recognition Against Real-World Corruptions Jie Wang, Lihe Ding, Tingfa Xu, Shaocong Dong, Xinli Xu, Long Bai, Jianan Li

PDF

Sample-Wise Label Confidence Incorporation for Learning with Noisy Labels Chanho Ahn, Kikyung Kim, Ji-won Baek, Jongin Lim, Seungju Han

PDF

Sample4Geo: Hard Negative Sampling for Cross-View Geo-Localisation Fabian Deuser, Konrad Habel, Norbert Oswald

PDF

SAMPLING: Scene-Adaptive Hierarchical Multiplane Images Representation for Novel View Synthesis from a Single Image Xiaoyu Zhou, Zhiwei Lin, Xiaojun Shan, Yongtao Wang, Deqing Sun, Ming-Hsuan Yang

PDF

Sat2Density: Faithful Density Learning from Satellite-Ground Image Pairs Ming Qian, Jincheng Xiong, Gui-Song Xia, Nan Xue

PDF

SatlasPretrain: A Large-Scale Dataset for Remote Sensing Image Understanding Favyen Bastani, Piper Wolters, Ritwik Gupta, Joe Ferdinando, Aniruddha Kembhavi

PDF

SATR: Zero-Shot Semantic Segmentation of 3D Shapes Ahmed Abdelreheem, Ivan Skorokhodov, Maks Ovsjanikov, Peter Wonka

PDF

SC3K: Self-Supervised and Coherent 3D Keypoints Estimation from Rotated, Noisy, and Decimated Point Cloud Data Mohammad Zohaib, Alessio Del Bue

PDF

Scalable Diffusion Models with Transformers William Peebles, Saining Xie

PDF

Scalable Multi-Temporal Remote Sensing Change Data Generation via Simulating Stochastic Change Process Zhuo Zheng, Shiqi Tian, Ailong Ma, Liangpei Zhang, Yanfei Zhong

PDF

Scalable Video Object Segmentation with Simplified Framework Qiangqiang Wu, Tianyu Yang, Wei Wu, Antoni B. Chan

PDF

Scale-Aware Modulation Meet Transformer Weifeng Lin, Ziheng Wu, Jiayu Chen, Jun Huang, Lianwen Jin

PDF

Scale-MAE: A Scale-Aware Masked Autoencoder for Multiscale Geospatial Representation Learning Colorado J Reed, Ritwik Gupta, Shufan Li, Sarah Brockman, Christopher Funk, Brian Clipp, Kurt Keutzer, Salvatore Candido, Matt Uyttendaele, Trevor Darrell

PDF

Scaling Data Generation in Vision-and-Language Navigation Zun Wang, Jialu Li, Yicong Hong, Yi Wang, Qi Wu, Mohit Bansal, Stephen Gould, Hao Tan, Yu Qiao

PDF

SCANet: Scene Complexity Aware Network for Weakly-Supervised Video Moment Retrieval Sunjae Yoon, Gwanhyeong Koo, Dahyun Kim, Chang D. Yoo

PDF

ScanNet++: A High-Fidelity Dataset of 3D Indoor Scenes Chandan Yeshwanth, Yueh-Cheng Liu, Matthias Nießner, Angela Dai

PDF

Scanning Only Once: An End-to-End Framework for Fast Temporal Grounding in Long Videos Yulin Pan, Xiangteng He, Biao Gong, Yiliang Lv, Yujun Shen, Yuxin Peng, Deli Zhao

PDF

ScatterNeRF: Seeing Through Fog with Physically-Based Inverse Neural Rendering Andrea Ramazzina, Mario Bijelic, Stefanie Walz, Alessandro Sanvito, Dominik Scheuble, Felix Heide

PDF

Scene as Occupancy Wenwen Tong, Chonghao Sima, Tai Wang, Li Chen, Silei Wu, Hanming Deng, Yi Gu, Lewei Lu, Ping Luo, Dahua Lin, Hongyang Li

PDF

Scene Graph Contrastive Learning for Embodied Navigation Kunal Pratap Singh, Jordi Salvador, Luca Weihs, Aniruddha Kembhavi

PDF

Scene Matters: Model-Based Deep Video Compression Lv Tang, Xinfeng Zhang, Gai Zhang, Xiaoqi Ma

PDF

Scene-Aware Feature Matching Xiaoyong Lu, Yaping Yan, Tong Wei, Songlin Du

PDF

Scene-Aware Label Graph Learning for Multi-Label Image Classification Xuelin Zhu, Jian Liu, Weijia Liu, Jiawei Ge, Bo Liu, Jiuxin Cao

PDF

SceneRF: Self-Supervised Monocular 3D Scene Reconstruction with Radiance Fields Anh-Quan Cao, Raoul de Charette

PDF

Scenimefy: Learning to Craft Anime Scene via Semi-Supervised Image-to-Image Translation Yuxin Jiang, Liming Jiang, Shuai Yang, Chen Change Loy

PDF

SCOB: Universal Text Understanding via Character-Wise Supervised Contrastive Learning with Online Text Rendering for Bridging Domain Gap Daehee Kim, Yoonsik Kim, DongHyun Kim, Yumin Lim, Geewook Kim, Taeho Kil

PDF

Score Priors Guided Deep Variational Inference for Unsupervised Real-World Single Image Denoising Jun Cheng, Tao Liu, Shan Tan

PDF

Score-Based Diffusion Models as Principled Priors for Inverse Imaging Berthy T. Feng, Jamie Smith, Michael Rubinstein, Huiwen Chang, Katherine L. Bouman, William T. Freeman

PDF

Scratch Each Other's Back: Incomplete Multi-Modal Brain Tumor Segmentation via Category Aware Group Self-Support Learning Yansheng Qiu, Delin Chen, Hongdou Yao, Yongchao Xu, Zheng Wang

PDF

Scratching Visual Transformer's Back with Uniform Attention Nam Hyeon-Woo, Kim Yu-Ji, Byeongho Heo, Dongyoon Han, Seong Joon Oh, Tae-Hyun Oh

PDF

Seal-3D: Interactive Pixel-Level Editing for Neural Radiance Fields Xiangyu Wang, Jingsen Zhu, Qi Ye, Yuchi Huo, Yunlong Ran, Zhihua Zhong, Jiming Chen

PDF

Search for or Navigate to? Dual Adaptive Thinking for Object Navigation Ronghao Dang, Liuyi Wang, Zongtao He, Shuai Su, Jiagui Tang, Chengju Liu, Qijun Chen

PDF

See More and Know More: Zero-Shot Point Cloud Segmentation via Multi-Modal Visual Data Yuhang Lu, Qi Jiang, Runnan Chen, Yuenan Hou, Xinge Zhu, Yuexin Ma

PDF

SeeABLE: Soft Discrepancies and Bounded Contrastive Learning for Exposing Deepfakes Nicolas Larue, Ngoc-Son Vu, Vitomir Struc, Peter Peer, Vassilis Christophides

PDF

Seeing Beyond the Patch: Scale-Adaptive Semantic Segmentation of High-Resolution Remote Sensing Imagery Based on Reinforcement Learning Yinhe Liu, Sunan Shi, Junjue Wang, Yanfei Zhong

PDF

SEFD: Learning to Distill Complex Pose and Occlusion ChangHee Yang, Kyeongbo Kong, SungJun Min, Dongyoon Wee, Ho-Deok Jang, Geonho Cha, SukJu Kang

PDF

SegGPT: Towards Segmenting Everything in Context Xinlong Wang, Xiaosong Zhang, Yue Cao, Wen Wang, Chunhua Shen, Tiejun Huang

PDF

Segment Anything Alexander Kirillov, Eric Mintun, Nikhila Ravi, Hanzi Mao, Chloe Rolland, Laura Gustafson, Tete Xiao, Spencer Whitehead, Alexander C. Berg, Wan-Yen Lo, Piotr Dollar, Ross Girshick

PDF

Segment Every Reference Object in Spatial and Temporal Spaces Jiannan Wu, Yi Jiang, Bin Yan, Huchuan Lu, Zehuan Yuan, Ping Luo

PDF

Segmentation of Tubular Structures Using Iterative Training with Tailored Samples Wei Liao

PDF

Segmenting Known Objects and Unseen Unknowns Without Prior Knowledge Stefano Gasperini, Alvaro Marcos-Ramiro, Michael Schmidt, Nassir Navab, Benjamin Busam, Federico Tombari

PDF

SegPrompt: Boosting Open-World Segmentation via Category-Level Prompt Learning Muzhi Zhu, Hengtao Li, Hao Chen, Chengxiang Fan, Weian Mao, Chenchen Jing, Yifan Liu, Chunhua Shen

PDF

SegRCDB: Semantic Segmentation via Formula-Driven Supervised Learning Risa Shinoda, Ryo Hayamizu, Kodai Nakashima, Nakamasa Inoue, Rio Yokota, Hirokatsu Kataoka

PDF

SeiT: Storage-Efficient Vision Training with Tokens Using 1% of Pixel Storage Song Park, Sanghyuk Chun, Byeongho Heo, Wonjae Kim, Sangdoo Yun

PDF

Self-Calibrated Cross Attention Network for Few-Shot Segmentation Qianxiong Xu, Wenting Zhao, Guosheng Lin, Cheng Long

PDF

Self-Evolved Dynamic Expansion Model for Task-Free Continual Learning Fei Ye, Adrian G. Bors

PDF

Self-Feedback DETR for Temporal Action Detection Jihwan Kim, Miso Lee, Jae-Pil Heo

PDF

Self-Ordering Point Clouds Pengwan Yang, Cees G. M. Snoek, Yuki M. Asano

PDF

Self-Organizing Pathway Expansion for Non-Exemplar Class-Incremental Learning Kai Zhu, Kecheng Zheng, Ruili Feng, Deli Zhao, Yang Cao, Zheng-Jun Zha

PDF

Self-Regulating Prompts: Foundational Model Adaptation Without Forgetting Muhammad Uzair Khattak, Syed Talal Wasim, Muzammal Naseer, Salman Khan, Ming-Hsuan Yang, Fahad Shahbaz Khan

PDF

Self-Similarity Driven Scale-Invariant Learning for Weakly Supervised Person Search Benzhi Wang, Yang Yang, Jinlin Wu, Guo-jun Qi, Zhen Lei

PDF

Self-Supervised Burst Super-Resolution Goutam Bhat, Michaël Gharbi, Jiawen Chen, Luc Van Gool, Zhihao Xia

PDF

Self-Supervised Character-to-Character Distillation for Text Recognition Tongkun Guan, Wei Shen, Xue Yang, Qi Feng, Zekun Jiang, Xiaokang Yang

PDF

Self-Supervised Cross-View Representation Reconstruction for Change Captioning Yunbin Tu, Liang Li, Li Su, Zheng-Jun Zha, Chenggang Yan, Qingming Huang

PDF

Self-Supervised Image Denoising with Downsampled Invariance Loss and Conditional Blind-Spot Network Yeong Il Jang, Keuntek Lee, Gu Yong Park, Seyun Kim, Nam Ik Cho

PDF

Self-Supervised Learning of Implicit Shape Representation with Dense Correspondence for Deformable Objects Baowen Zhang, Jiahe Li, Xiaoming Deng, Yinda Zhang, Cuixia Ma, Hongan Wang

PDF

Self-Supervised Learning to Bring Dual Reversed Rolling Shutter Images Alive Wei Shang, Dongwei Ren, Chaoyu Feng, Xiaotao Wang, Lei Lei, Wangmeng Zuo

PDF

Self-Supervised Monocular Depth Estimation by Direction-Aware Cumulative Convolution Network Wencheng Han, Junbo Yin, Jianbing Shen

PDF

Self-Supervised Monocular Depth Estimation: Let's Talk About the Weather Kieran Saunders, George Vogiatzis, Luis J. Manso

PDF

Self-Supervised Monocular Underwater Depth Recovery, Image Restoration, and a Real-Sea Video Dataset Nisha Varghese, Ashish Kumar, A. N. Rajagopalan

PDF

Self-Supervised Object Detection from Egocentric Videos Peri Akiva, Jing Huang, Kevin J Liang, Rama Kovvuri, Xingyu Chen, Matt Feiszli, Kristin Dana, Tal Hassner

PDF

Self-Supervised Pre-Training for Mirror Detection Jiaying Lin, Rynson W.H. Lau

PDF

Semantic Attention Flow Fields for Monocular Dynamic Scene Decomposition Yiqing Liang, Eliot Laidlaw, Alexander Meyerowitz, Srinath Sridhar, James Tompkin

PDF

Semantic Information in Contrastive Learning Shengjiang Quan, Masahiro Hirano, Yuji Yamakawa

PDF

Semantic-Aware Dynamic Parameter for Video Inpainting Transformer Eunhye Lee, Jinsu Yoo, Yunjeong Yang, Sungyong Baik, Tae Hyun Kim

PDF

Semantic-Aware Implicit Template Learning via Part Deformation Consistency Sihyeon Kim, Minseok Joo, Jaewon Lee, Juyeon Ko, Juhan Cha, Hyunwoo J. Kim

PDF

Semantically Structured Image Compression via Irregular Group-Based Decoupling Ruoyu Feng, Yixin Gao, Xin Jin, Runsen Feng, Zhibo Chen

PDF

Semantics Meets Temporal Correspondence: Self-Supervised Object-Centric Learning in Videos Rui Qian, Shuangrui Ding, Xian Liu, Dahua Lin

PDF

Semantics-Consistent Feature Search for Self-Supervised Visual Representation Learning Kaiyou Song, Shan Zhang, Zimeng Luo, Tong Wang, Jin Xie

PDF

Semantify: Simplifying the Control of 3D Morphable Models Using CLIP Omer Gralnik, Guy Gafni, Ariel Shamir

PDF

SemARFlow: Injecting Semantics into Unsupervised Optical Flow Estimation for Autonomous Driving Shuai Yuan, Shuzhi Yu, Hannah Kim, Carlo Tomasi

PDF

Semi-Supervised Learning via Weight-Aware Distillation Under Class Distribution Mismatch Pan Du, Suyun Zhao, Zisen Sheng, Cuiping Li, Hong Chen

PDF

Semi-Supervised Semantic Segmentation Under Label Noise via Diverse Learning Groups Peixia Li, Pulak Purkait, Thalaiyasingam Ajanthan, Majid Abdolshah, Ravi Garg, Hisham Husain, Chenchen Xu, Stephen Gould, Wanli Ouyang, Anton van den Hengel

PDF

Semi-Supervised Semantics-Guided Adversarial Training for Robust Trajectory Prediction Ruochen Jiao, Xiangguo Liu, Takami Sato, Qi Alfred Chen, Qi Zhu

PDF

Semi-Supervised Speech-Driven 3D Facial Animation via Cross-Modal Encoding Peiji Yang, Huawei Wei, Yicheng Zhong, Zhisheng Wang

PDF

SEMPART: Self-Supervised Multi-Resolution Partitioning of Image Semantics Sriram Ravindran, Debraj Basu

PDF

Sensitivity-Aware Visual Parameter-Efficient Fine-Tuning Haoyu He, Jianfei Cai, Jing Zhang, Dacheng Tao, Bohan Zhuang

PDF

Sentence Attention Blocks for Answer Grounding Seyedalireza Khoshsirat, Chandra Kambhamettu

PDF

Sequential Texts Driven Cohesive Motions Synthesis with Natural Transitions Shuai Li, Sisi Zhuang, Wenfeng Song, Xinyu Zhang, Hejia Chen, Aimin Hao

PDF

Set-Level Guidance Attack: Boosting Adversarial Transferability of Vision-Language Pre-Training Models Dong Lu, Zhiqiang Wang, Teng Wang, Weili Guan, Hongchang Gao, Feng Zheng

PDF

SFHarmony: Source Free Domain Adaptation for Distributed Neuroimaging Analysis Nicola K Dinsdale, Mark Jenkinson, Ana IL Namburete

PDF

SG-Former: Self-Guided Transformer with Evolving Token Reallocation Sucheng Ren, Xingyi Yang, Songhua Liu, Xinchao Wang

PDF

SGAligner: 3D Scene Alignment with Scene Graphs Sayan Deb Sarkar, Ondrej Miksik, Marc Pollefeys, Daniel Barath, Iro Armeni

PDF

SHACIRA: Scalable HAsh-Grid Compression for Implicit Neural Representations Sharath Girish, Abhinav Shrivastava, Kamal Gupta

PDF

Shape Analysis of Euclidean Curves Under Frenet-Serret Framework Perrine Chassat, Juhyun Park, Nicolas Brunel

PDF

Shape Anchor Guided Holistic Indoor Scene Understanding Mingyue Dong, Linxi Huan, Hanjiang Xiong, Shuhan Shen, Xianwei Zheng

PDF

ShapeScaffolder: Structure-Aware 3D Shape Generation from Text Xi Tian, Yong-Liang Yang, Qi Wu

PDF

Shatter and Gather: Learning Referring Image Segmentation with Text Supervision Dongwon Kim, Namyup Kim, Cuiling Lan, Suha Kwak

PDF

SHERF: Generalizable Human NeRF from a Single Image Shoukang Hu, Fangzhou Hong, Liang Pan, Haiyi Mei, Lei Yang, Ziwei Liu

PDF

Shift from Texture-Bias to Shape-Bias: Edge Deformation-Based Augmentation for Robust Object Recognition Xilin He, Qinliang Lin, Cheng Luo, Weicheng Xie, Siyang Song, Feng Liu, Linlin Shen

PDF

SHIFT3D: Synthesizing Hard Inputs for Tricking 3D Detectors Hongge Chen, Zhao Chen, Gregory P. Meyer, Dennis Park, Carl Vondrick, Ashish Shrivastava, Yuning Chai

PDF

ShiftNAS: Improving One-Shot NAS via Probability Shift Mingyang Zhang, Xinyi Yu, Haodong Zhao, Linlin Ou

PDF

Shortcut-V2V: Compression Framework for Video-to-Video Translation Based on Temporal Redundancy Reduction Chaeyeon Chung, Yeojeong Park, Seunghwan Choi, Munkhsoyol Ganbat, Jaegul Choo

PDF

Shrinking Class Space for Enhanced Certainty in Semi-Supervised Learning Lihe Yang, Zhen Zhao, Lei Qi, Yu Qiao, Yinghuan Shi, Hengshuang Zhao

PDF

SIDGAN: High-Resolution Dubbed Video Generation via Shift-Invariant Learning Urwa Muaz, Wondong Jang, Rohun Tripathi, Santhosh Mani, Wenbin Ouyang, Ravi Teja Gadde, Baris Gecer, Sergio Elizondo, Reza Madad, Naveen Nair

PDF

SIGMA: Scale-Invariant Global Sparse Shape Matching Maolin Gao, Paul Roetzer, Marvin Eisenberger, Zorah Lähner, Michael Moeller, Daniel Cremers, Florian Bernard

PDF

Sigmoid Loss for Language Image Pre-Training Xiaohua Zhai, Basil Mustafa, Alexander Kolesnikov, Lucas Beyer

PDF

Sign Language Translation with Iterative Prototype Huijie Yao, Wengang Zhou, Hao Feng, Hezhen Hu, Hao Zhou, Houqiang Li

PDF

SiLK: Simple Learned Keypoints Pierre Gleize, Weiyao Wang, Matt Feiszli

PDF

SILT: Shadow-Aware Iterative Label Tuning for Learning to Detect Shadows from Noisy Labels Han Yang, Tianyu Wang, Xiaowei Hu, Chi-Wing Fu

PDF

SimFIR: A Simple Framework for Fisheye Image Rectification with Self-Supervised Representation Learning Hao Feng, Wendi Wang, Jiajun Deng, Wengang Zhou, Li Li, Houqiang Li

PDF

Similarity Min-Max: Zero-Shot Day-Night Domain Adaptation Rundong Luo, Wenjing Wang, Wenhan Yang, Jiaying Liu

PDF

SimMatchV2: Semi-Supervised Learning with Graph Consistency Mingkai Zheng, Shan You, Lang Huang, Chen Luo, Fei Wang, Chen Qian, Chang Xu

PDF

SimNP: Learning Self-Similarity Priors Between Neural Points Christopher Wewer, Eddy Ilg, Bernt Schiele, Jan Eric Lenssen

PDF

Simoun: Synergizing Interactive Motion-Appearance Understanding for Vision-Based Reinforcement Learning Yangru Huang, Peixi Peng, Yifan Zhao, Yunpeng Zhai, Haoran Xu, Yonghong Tian

PDF

Simple and Effective Out-of-Distribution Detection via Cosine-Based SoftMax Loss SoonCheol Noh, DongEon Jeong, Jee-Hyong Lee

PDF

Simple Baselines for Interactive Video Retrieval with Questions and Answers Kaiqu Liang, Samuel Albanie

PDF

SimpleClick: Interactive Image Segmentation with Simple Vision Transformers Qin Liu, Zhenlin Xu, Gedas Bertasius, Marc Niethammer

PDF

Simulating Fluids in Real-World Still Images Siming Fan, Jingtan Piao, Chen Qian, Hongsheng Li, Kwan-Yee Lin

PDF

SINC: Self-Supervised In-Context Learning for Vision-Language Tasks Yi-Syuan Chen, Yun-Zhu Song, Cheng Yu Yeo, Bei Liu, Jianlong Fu, Hong-Han Shuai

PDF

SINC: Spatial Composition of 3D Human Motions for Simultaneous Action Generation Nikos Athanasiou, Mathis Petrovich, Michael J. Black, Gül Varol

PDF

Single Depth-Image 3D Reflection Symmetry and Shape Prediction Zhaoxuan Zhang, Bo Dong, Tong Li, Felix Heide, Pieter Peers, Baocai Yin, Xin Yang

PDF

Single Image Deblurring with Row-Dependent Blur Magnitude Xiang Ji, Zhixiang Wang, Shin'ichi Satoh, Yinqiang Zheng

PDF

Single Image Defocus Deblurring via Implicit Neural Inverse Kernels Yuhui Quan, Xin Yao, Hui Ji

PDF

Single Image Reflection Separation via Component Synergy Qiming Hu, Xiaojie Guo

PDF

Single-Stage Diffusion NeRF: A Unified Approach to 3D Generation and Reconstruction Hansheng Chen, Jiatao Gu, Anpei Chen, Wei Tian, Zhuowen Tu, Lingjie Liu, Hao Su

PDF

SIRA-PCR: Sim-to-Real Adaptation for 3D Point Cloud Registration Suyi Chen, Hao Xu, Ru Li, Guanghui Liu, Chi-Wing Fu, Shuaicheng Liu

PDF

Size Does Matter: Size-Aware Virtual Try-on via Clothing-Oriented Transformation Try-on Network Chieh-Yun Chen, Yi-Chung Chen, Hong-Han Shuai, Wen-Huang Cheng

PDF

SKED: Sketch-Guided Text-Based 3D Editing Aryan Mikaeili, Or Perel, Mehdi Safaee, Daniel Cohen-Or, Ali Mahdavi-Amiri

PDF

SkeletonMAE: Graph-Based Masked Autoencoder for Skeleton Sequence Pre-Training Hong Yan, Yang Liu, Yushen Wei, Zhen Li, Guanbin Li, Liang Lin

PDF

SkeleTR: Towards Skeleton-Based Action Recognition in the Wild Haodong Duan, Mingze Xu, Bing Shuai, Davide Modolo, Zhuowen Tu, Joseph Tighe, Alessandro Bergamo

PDF

Sketch and Text Guided Diffusion Model for Colored Point Cloud Generation Zijie Wu, Yaonan Wang, Mingtao Feng, He Xie, Ajmal Mian

PDF

Skill Transformer: A Monolithic Policy for Mobile Manipulation Xiaoyu Huang, Dhruv Batra, Akshara Rai, Andrew Szot

PDF

Skip-Plan: Procedure Planning in Instructional Videos via Condensed Action Space Learning Zhiheng Li, Wenjia Geng, Muheng Li, Lei Chen, Yansong Tang, Jiwen Lu, Jie Zhou

PDF

SKiT: A Fast Key Information Video Transformer for Online Surgical Phase Recognition Yang Liu, Jiayu Huo, Jingjing Peng, Rachel Sparks, Prokar Dasgupta, Alejandro Granados, Sebastien Ourselin

PDF

SlaBins: Fisheye Depth Estimation Using Slanted Bins on Road Environments Jongsung Lee, Gyeongsu Cho, Jeongin Park, Kyongjun Kim, Seongoh Lee, Jung-Hee Kim, Seong-Gyun Jeong, Kyungdon Joo

PDF

SLAN: Self-Locator Aided Network for Vision-Language Understanding Jiang-Tian Zhai, Qi Zhang, Tong Wu, Xing-Yu Chen, Jiang-Jiang Liu, Ming-Ming Cheng

PDF

SLCA: Slow Learner with Classifier Alignment for Continual Learning on a Pre-Trained Model Gengwei Zhang, Liyuan Wang, Guoliang Kang, Ling Chen, Yunchao Wei

PDF

Small Object Detection via Coarse-to-Fine Proposal Generation and Imitation Learning Xiang Yuan, Gong Cheng, Kebing Yan, Qinghua Zeng, Junwei Han

PDF

SMAUG: Sparse Masked Autoencoder for Efficient Video-Language Pre-Training Yuanze Lin, Chen Wei, Huiyu Wang, Alan Yuille, Cihang Xie

PDF

SMMix: Self-Motivated Image Mixing for Vision Transformers Mengzhao Chen, Mingbao Lin, Zhihang Lin, Yuxin Zhang, Fei Chao, Rongrong Ji

PDF

Smoothness Similarity Regularization for Few-Shot GAN Adaptation Vadim Sushko, Ruyu Wang, Juergen Gall

PDF

Snow Removal in Video: A New Dataset and a Novel Method Haoyu Chen, Jingjing Ren, Jinjin Gu, Hongtao Wu, Xuequan Lu, Haoming Cai, Lei Zhu

PDF

SOAR: Scene-Debiasing Open-Set Action Recognition Yuanhao Zhai, Ziyi Liu, Zhenyu Wu, Yi Wu, Chunluan Zhou, David Doermann, Junsong Yuan, Gang Hua

PDF

Social Diffusion: Long-Term Multiple Human Motion Anticipation Julian Tanke, Linguang Zhang, Amy Zhao, Chengcheng Tang, Yujun Cai, Lezi Wang, Po-Chen Wu, Juergen Gall, Cem Keskin

PDF

SOCS: Semantically-Aware Object Coordinate Space for Category-Level 6d Object Pose Estimation Under Large Shape Variations Boyan Wan, Yifei Shi, Kai Xu

PDF

SoDaCam: Software-Defined Cameras via Single-Photon Imaging Varun Sundar, Andrei Ardelean, Tristan Swedish, Claudio Bruschini, Edoardo Charbon, Mohit Gupta

PDF

Sound Localization from Motion: Jointly Learning Sound Direction and Camera Rotation Ziyang Chen, Shengyi Qian, Andrew Owens

PDF

Sound Source Localization Is All About Cross-Modal Alignment Arda Senocak, Hyeonggon Ryu, Junsik Kim, Tae-Hyun Oh, Hanspeter Pfister, Joon Son Chung

PDF

Source-Free Depth for Object Pop-Out Zongwei Wu, Danda Pani Paudel, Deng-Ping Fan, Jingjing Wang, Shuo Wang, Cédric Demonceaux, Radu Timofte, Luc Van Gool

PDF

Source-Free Domain Adaptive Human Pose Estimation Qucheng Peng, Ce Zheng, Chen Chen

PDF

Space Engage: Collaborative Space Supervision for Contrastive-Based Semi-Supervised Semantic Segmentation Changqi Wang, Haoyu Xie, Yuhui Yuan, Chong Fu, Xiangyu Yue

PDF

Space-Time Prompting for Video Class-Incremental Learning Yixuan Pei, Zhiwu Qing, Shiwei Zhang, Xiang Wang, Yingya Zhang, Deli Zhao, Xueming Qian

PDF

SPACE: Speech-Driven Portrait Animation with Controllable Expression Siddharth Gururani, Arun Mallya, Ting-Chun Wang, Rafael Valle, Ming-Yu Liu

PDF

SpaceEvo: Hardware-Friendly Search Space Design for Efficient INT8 Inference Xudong Wang, Li Lyna Zhang, Jiahang Xu, Quanlu Zhang, Yujing Wang, Yuqing Yang, Ningxin Zheng, Ting Cao, Mao Yang

PDF

Spacetime Surface Regularization for Neural Dynamic Scene Reconstruction Jaesung Choe, Christopher Choy, Jaesik Park, In So Kweon, Anima Anandkumar

PDF

SPANet: Frequency-Balancing Token Mixer Using Spectral Pooling Aggregation Modulation Guhnoo Yun, Juhan Yoo, Kijung Kim, Jeongho Lee, Dong Hwan Kim

PDF

Sparse Instance Conditioned Multimodal Trajectory Prediction Yonghao Dong, Le Wang, Sanping Zhou, Gang Hua

PDF

Sparse Point Guided 3D Lane Detection Chengtang Yao, Lidong Yu, Yuwei Wu, Yunde Jia

PDF

Sparse Sampling Transformer with Uncertainty-Driven Ranking for Unified Removal of Raindrops and Rain Streaks Sixiang Chen, Tian Ye, Jinbin Bai, Erkang Chen, Jun Shi, Lei Zhu

PDF

SparseBEV: High-Performance Sparse 3D Object Detection from Multi-Camera Videos Haisong Liu, Yao Teng, Tao Lu, Haiguang Wang, Limin Wang

PDF

SparseDet: Improving Sparsely Annotated Object Detection with Pseudo-Positive Mining Saksham Suri, Saketh Rambhatla, Rama Chellappa, Abhinav Shrivastava

PDF

SparseFusion: Fusing Multi-Modal Sparse Representations for Multi-Sensor 3D Object Detection Yichen Xie, Chenfeng Xu, Marie-Julie Rakotosaona, Patrick Rim, Federico Tombari, Kurt Keutzer, Masayoshi Tomizuka, Wei Zhan

PDF

SparseMAE: Sparse Training Meets Masked Autoencoders Aojun Zhou, Yang Li, Zipeng Qin, Jianbo Liu, Junting Pan, Renrui Zhang, Rui Zhao, Peng Gao, Hongsheng Li

PDF

SparseNeRF: Distilling Depth Ranking for Few-Shot Novel View Synthesis Guangcong Wang, Zhaoxi Chen, Chen Change Loy, Ziwei Liu

PDF

Spatial Self-Distillation for Object Detection with Inaccurate Bounding Boxes Di Wu, Pengfei Chen, Xuehui Yu, Guorong Li, Zhenjun Han, Jianbin Jiao

PDF

Spatial-Aware Token for Weakly Supervised Object Localization Pingyu Wu, Wei Zhai, Yang Cao, Jiebo Luo, Zheng-Jun Zha

PDF

Spatially and Spectrally Consistent Deep Functional Maps Mingze Sun, Shiwei Mao, Puhua Jiang, Maks Ovsjanikov, Ruqi Huang

PDF

Spatially-Adaptive Feature Modulation for Efficient Image Super-Resolution Long Sun, Jiangxin Dong, Jinhui Tang, Jinshan Pan

PDF

Spatio-Temporal Crop Aggregation for Video Representation Learning Sepehr Sameni, Simon Jenni, Paolo Favaro

PDF

Spatio-Temporal Domain Awareness for Multi-Agent Collaborative Perception Kun Yang, Dingkang Yang, Jingyu Zhang, Mingcheng Li, Yang Liu, Jing Liu, Hanqi Wang, Peng Sun, Liang Song

PDF

Spatio-Temporal Prompting Network for Robust Video Feature Extraction Guanxiong Sun, Chi Wang, Zhaoyu Zhang, Jiankang Deng, Stefanos Zafeiriou, Yang Hua

PDF

Spectral Graphormer: Spectral Graph-Based Transformer for Egocentric Two-Hand Reconstruction Using Multi-View Color Images Tze Ho Elden Tse, Franziska Mueller, Zhengyang Shen, Danhang Tang, Thabo Beeler, Mingsong Dou, Yinda Zhang, Sasa Petrovic, Hyung Jin Chang, Jonathan Taylor, Bardia Doosti

PDF

Spectrum-Guided Multi-Granularity Referring Video Object Segmentation Bo Miao, Mohammed Bennamoun, Yongsheng Gao, Ajmal Mian

PDF

Speech2Lip: High-Fidelity Speech to Lip Generation by Learning from a Short Video Xiuzhe Wu, Pengfei Hu, Yang Wu, Xiaoyang Lyu, Yan-Pei Cao, Ying Shan, Wenming Yang, Zhongqian Sun, Xiaojuan Qi

PDF

Speech4Mesh: Speech-Assisted Monocular 3D Facial Reconstruction for Speech-Driven 3D Facial Animation Shan He, Haonan He, Shuo Yang, Xiaoyan Wu, Pengcheng Xia, Bing Yin, Cong Liu, Lirong Dai, Chang Xu

PDF

Spherical Space Feature Decomposition for Guided Depth mAP Super-Resolution Zixiang Zhao, Jiangshe Zhang, Xiang Gu, Chengli Tan, Shuang Xu, Yulun Zhang, Radu Timofte, Luc Van Gool

PDF

SpinCam: High-Speed Imaging via a Rotating Point-Spread Function Dorian Chan, Mark Sheinin, Matthew O'Toole

PDF

SportsMOT: A Large Multi-Object Tracking Dataset in Multiple Sports Scenes Yutao Cui, Chenkai Zeng, Xiaoyu Zhao, Yichun Yang, Gangshan Wu, Limin Wang

PDF

Spurious Features Everywhere - Large-Scale Detection of Harmful Spurious Features in ImageNet Yannic Neuhaus, Maximilian Augustin, Valentyn Boreiko, Matthias Hein

PDF

SQAD: Automatic Smartphone Camera Quality Assessment and Benchmarking Zilin Fang, Andrey Ignatov, Eduard Zamfir, Radu Timofte

PDF

SRFormer: Permuted Self-Attention for Single Image Super-Resolution Yupeng Zhou, Zhen Li, Chun-Le Guo, Song Bai, Ming-Ming Cheng, Qibin Hou

PDF

SSB: Simple but Strong Baseline for Boosting Performance of Open-Set Semi-Supervised Learning Yue Fan, Anna Kukleva, Dengxin Dai, Bernt Schiele

PDF

SSDA: Secure Source-Free Domain Adaptation Sabbir Ahmed, Abdullah Al Arafat, Mamshad Nayeem Rizve, Rahim Hossain, Zhishan Guo, Adnan Siraj Rakin

PDF

SSF: Accelerating Training of Spiking Neural Networks with Stabilized Spiking Flow Jingtao Wang, Zengjie Song, Yuxi Wang, Jun Xiao, Yuran Yang, Shuqi Mei, Zhaoxiang Zhang

PDF

Stabilizing Visual Reinforcement Learning via Asymmetric Interactive Cooperation Yunpeng Zhai, Peixi Peng, Yifan Zhao, Yangru Huang, Yonghong Tian

PDF

Stable and Causal Inference for Discriminative Self-Supervised Deep Visual Representations Yuewei Yang, Hai Li, Yiran Chen

PDF

Stable Cluster Discrimination for Deep Clustering Qi Qian

PDF

StableVideo: Text-Driven Consistency-Aware Diffusion Video Editing Wenhao Chai, Xun Guo, Gaoang Wang, Yan Lu

PDF

StageInteractor: Query-Based Object Detector with Cross-Stage Interaction Yao Teng, Haisong Liu, Sheng Guo, Limin Wang

PDF

Steered Diffusion: A Generalized Framework for Plug-and-Play Conditional Image Synthesis Nithin Gopalakrishnan Nair, Anoop Cherian, Suhas Lohit, Ye Wang, Toshiaki Koike-Akino, Vishal M. Patel, Tim K. Marks

PDF

STEERER: Resolving Scale Variations for Counting and Localization via Selective Inheritance Learning Tao Han, Lei Bai, Lingbo Liu, Wanli Ouyang

PDF

StegaNeRF: Embedding Invisible Information Within Neural Radiance Fields Chenxin Li, Brandon Y. Feng, Zhiwen Fan, Panwang Pan, Zhangyang Wang

PDF

STEPs: Self-Supervised Key Step Extraction and Localization from Unlabeled Procedural Videos Anshul Shah, Benjamin Lundell, Harpreet Sawhney, Rama Chellappa

PDF

Stochastic Segmentation with Conditional Categorical Diffusion Models Lukas Zbinden, Lars Doorenbos, Theodoros Pissas, Adrian Thomas Huber, Raphael Sznitman, Pablo Márquez-Neila

PDF

Story Visualization by Online Text Augmentation with Context Memory Daechul Ahn, Daneul Kim, Gwangmo Song, Seung Hwan Kim, Honglak Lee, Dongyeop Kang, Jonghyun Choi

PDF

STPrivacy: Spatio-Temporal Privacy-Preserving Action Recognition Ming Li, Xiangyu Xu, Hehe Fan, Pan Zhou, Jun Liu, Jia-Wei Liu, Jiahe Li, Jussi Keppo, Mike Zheng Shou, Shuicheng Yan

PDF

Strata-NeRF : Neural Radiance Fields for Stratified Scenes Ankit Dhiman, R Srinath, Harsh Rangwani, Rishubh Parihar, Lokesh R Boregowda, Srinath Sridhar, R Venkatesh Babu

PDF

Strip-MLP: Efficient Token Interaction for Vision MLP Guiping Cao, Shengda Luo, Wenjian Huang, Xiangyuan Lan, Dongmei Jiang, Yaowei Wang, Jianguo Zhang

PDF

Strivec: Sparse Tri-Vector Radiance Fields Quankai Gao, Qiangeng Xu, Hao Su, Ulrich Neumann, Zexiang Xu

PDF

Structural Alignment for Network Pruning Through Partial Regularization Shangqian Gao, Zeyu Zhang, Yanfu Zhang, Feihu Huang, Heng Huang

PDF

Structure and Content-Guided Video Synthesis with Diffusion Models Patrick Esser, Johnathan Chiu, Parmida Atighehchian, Jonathan Granskog, Anastasis Germanidis

PDF

Structure Invariant Transformation for Better Adversarial Transferability Xiaosen Wang, Zeliang Zhang, Jianping Zhang

PDF

Structure-Aware Surface Reconstruction via Primitive Assembly Jingen Jiang, Mingyang Zhao, Shiqing Xin, Yanchao Yang, Hanxiao Wang, Xiaohong Jia, Dong-Ming Yan

PDF

Studying How to Efficiently and Effectively Guide Models with Explanations Sukrut Rao, Moritz Böhle, Amin Parchami-Araghi, Bernt Schiele

PDF

StyleDiffusion: Controllable Disentangled Style Transfer via Diffusion Models Zhizhong Wang, Lei Zhao, Wei Xing

PDF

StyleDomain: Efficient and Lightweight Parameterizations of StyleGAN for One-Shot and Few-Shot Domain Adaptation Aibek Alanov, Vadim Titov, Maksim Nakhodnov, Dmitry Vetrov

PDF

StyleGANEX: StyleGAN-Based Manipulation Beyond Cropped Aligned Faces Shuai Yang, Liming Jiang, Ziwei Liu, Chen Change Loy

PDF

StyleInV: A Temporal Style Modulated Inversion Network for Unconditional Video Generation Yuhan Wang, Liming Jiang, Chen Change Loy

PDF

StyleLipSync: Style-Based Personalized Lip-Sync Video Generation Taekyung Ki, Dongchan Min

PDF

StylerDALLE: Language-Guided Style Transfer Using a Vector-Quantized Tokenizer of a Large-Scale Generative Model Zipeng Xu, Enver Sangineto, Nicu Sebe

PDF

Subclass-Balancing Contrastive Learning for Long-Tailed Recognition Chengkai Hou, Jieyu Zhang, Haonan Wang, Tianyi Zhou

PDF

SUMMIT: Source-Free Adaptation of Uni-Modal Models to Multi-Modal Targets Cody Simons, Dripta S. Raychaudhuri, Sk Miraj Ahmed, Suya You, Konstantinos Karydis, Amit K. Roy-Chowdhury

PDF

Supervised Homography Learning with Realistic Dataset Generation Hai Jiang, Haipeng Li, Songchen Han, Haoqiang Fan, Bing Zeng, Shuaicheng Liu

PDF

SupFusion: Supervised LiDAR-Camera Fusion for 3D Object Detection Yiran Qin, Chaoqun Wang, Zijian Kang, Ningning Ma, Zhen Li, Ruimao Zhang

PDF

Surface Extraction from Neural Unsigned Distance Fields Congyi Zhang, Guying Lin, Lei Yang, Xin Li, Taku Komura, Scott Schaefer, John Keyser, Wenping Wang

PDF

Surface Normal Clustering for Implicit Representation of Manhattan Scenes Nikola Popovic, Danda Pani Paudel, Luc Van Gool

PDF

SurfsUP: Learning Fluid Simulation for Novel Surfaces Arjun Mani, Ishaan Preetam Chandratreya, Elliot Creager, Carl Vondrick, Richard Zemel

PDF

SurroundOcc: Multi-Camera 3D Occupancy Prediction for Autonomous Driving Yi Wei, Linqing Zhao, Wenzhao Zheng, Zheng Zhu, Jie Zhou, Jiwen Lu

PDF

SuS-X: Training-Free Name-Only Transfer of Vision-Language Models Vishaal Udandarao, Ankush Gupta, Samuel Albanie

PDF

SVDFormer: Complementing Point Cloud via Self-View Augmentation and Self-Structure Dual-Generator Zhe Zhu, Honghua Chen, Xing He, Weiming Wang, Jing Qin, Mingqiang Wei

PDF

SVDiff: Compact Parameter Space for Diffusion Fine-Tuning Ligong Han, Yinxiao Li, Han Zhang, Peyman Milanfar, Dimitris Metaxas, Feng Yang

PDF

SVQNet: Sparse Voxel-Adjacent Query Network for 4D Spatio-Temporal LiDAR Semantic Segmentation Xuechao Chen, Shuangjie Xu, Xiaoyi Zou, Tongyi Cao, Dit-Yan Yeung, Lu Fang

PDF

SwiftFormer: Efficient Additive Attention for Transformer-Based Real-Time Mobile Vision Applications Abdelrahman Shaker, Muhammad Maaz, Hanoona Rasheed, Salman Khan, Ming-Hsuan Yang, Fahad Shahbaz Khan

PDF

SwinLSTM: Improving Spatiotemporal Prediction Accuracy Using Swin Transformer and LSTM Song Tang, Chuang Li, Pu Zhang, RongNian Tang

PDF

SYENet: A Simple yet Effective Network for Multiple Low-Level Vision Tasks with Real-Time Performance on Mobile Device Weiran Gou, Ziyao Yi, Yan Xiang, Shaoqing Li, Zibin Liu, Dehui Kong, Ke Xu

PDF

SynBody: Synthetic Dataset with Layered Human Models for 3D Human Perception and Modeling Zhitao Yang, Zhongang Cai, Haiyi Mei, Shuai Liu, Zhaoxi Chen, Weiye Xiao, Yukun Wei, Zhongfei Qing, Chen Wei, Bo Dai, Wayne Wu, Chen Qian, Dahua Lin, Ziwei Liu, Lei Yang

PDF

Synchronize Feature Extracting and Matching: A Single Branch Framework for 3D Object Tracking Teli Ma, Mengmeng Wang, Jimin Xiao, Huifeng Wu, Yong Liu

PDF

Synthesizing Diverse Human Motions in 3D Indoor Scenes Kaifeng Zhao, Yan Zhang, Shaofei Wang, Thabo Beeler, Siyu Tang

PDF

Take-a-Photo: 3D-to-2D Generative Pre-Training of Point Cloud Models Ziyi Wang, Xumin Yu, Yongming Rao, Jie Zhou, Jiwen Lu

PDF

Talking Head Generation with Probabilistic Audio-to-Visual Diffusion Priors Zhentao Yu, Zixin Yin, Deyu Zhou, Duomin Wang, Finn Wong, Baoyuan Wang

PDF

TALL: Thumbnail Layout for Deepfake Video Detection Yuting Xu, Jian Liang, Gengyun Jia, Ziming Yang, Yanhao Zhang, Ran He

PDF

Taming Contrast Maximization for Learning Sequential, Low-Latency, Event-Based Optical Flow Federico Paredes-Vallés, Kirk Y. W. Scheper, Christophe De Wagter, Guido C. H. E. de Croon

PDF

Tangent Model Composition for Ensembling and Continual Fine-Tuning Tian Yu Liu, Stefano Soatto

PDF

Tangent Sampson Error: Fast Approximate Two-View Reprojection Error for Central Camera Models Mikhail Terekhov, Viktor Larsson

PDF

TAPIR: Tracking Any Point with Per-Frame Initialization and Temporal Refinement Carl Doersch, Yi Yang, Mel Vecerik, Dilara Gokay, Ankush Gupta, Yusuf Aytar, Joao Carreira, Andrew Zisserman

PDF

TARGET: Federated Class-Continual Learning via Exemplar-Free Distillation Jie Zhang, Chen Chen, Weiming Zhuang, Lingjuan Lyu

PDF

Task Agnostic Restoration of Natural Video Dynamics Muhammad Kashif Ali, Dongjin Kim, Tae Hyun Kim

PDF

Task-Aware Adaptive Learning for Cross-Domain Few-Shot Learning Yurong Guo, Ruoyi Du, Yuan Dong, Timothy Hospedales, Yi-Zhe Song, Zhanyu Ma

PDF

Task-Oriented Multi-Modal Mutual Leaning for Vision-Language Models Sifan Long, Zhen Zhao, Junkun Yuan, Zichang Tan, Jiangjiang Liu, Luping Zhou, Shengsheng Wang, Jingdong Wang

PDF

TaskExpert: Dynamically Assembling Multi-Task Representations with Memorial Mixture-of-Experts Hanrong Ye, Dan Xu

PDF

Taxonomy Adaptive Cross-Domain Adaptation in Medical Imaging via Optimization Trajectory Distillation Jianan Fan, Dongnan Liu, Hang Chang, Heng Huang, Mei Chen, Weidong Cai

PDF

TCOVIS: Temporally Consistent Online Video Instance Segmentation Junlong Li, Bingyao Yu, Yongming Rao, Jie Zhou, Jiwen Lu

PDF

Teaching CLIP to Count to Ten Roni Paiss, Ariel Ephrat, Omer Tov, Shiran Zada, Inbar Mosseri, Michal Irani, Tali Dekel

PDF

TeD-SPAD: Temporal Distinctiveness for Self-Supervised Privacy-Preservation for Video Anomaly Detection Joseph Fioresi, Ishan Rajendrakumar Dave, Mubarak Shah

PDF

Tem-Adapter: Adapting Image-Text Pretraining for Video Question Answer Guangyi Chen, Xiao Liu, Guangrun Wang, Kun Zhang, Philip H.S. Torr, Xiao-Ping Zhang, Yansong Tang

PDF

Template Inversion Attack Against Face Recognition Systems Using 3D Face Reconstruction Hatef Otroshi Shahreza, Sébastien Marcel

PDF

Template-Guided Hierarchical Feature Restoration for Anomaly Detection Hewei Guo, Liping Ren, Jingjing Fu, Yuwang Wang, Zhizheng Zhang, Cuiling Lan, Haoqian Wang, Xinwen Hou

PDF

TEMPO: Efficient Multi-View Pose Estimation, Tracking, and Forecasting Rohan Choudhury, Kris M. Kitani, László A. Jeni

PDF

Temporal Collection and Distribution for Referring Video Object Segmentation Jiajin Tang, Ge Zheng, Sibei Yang

PDF

Temporal Enhanced Training of Multi-View 3D Object Detector via Historical Object Prediction Zhuofan Zong, Dongzhi Jiang, Guanglu Song, Zeyue Xue, Jingyong Su, Hongsheng Li, Yu Liu

PDF

Temporal-Coded Spiking Neural Networks with Dynamic Firing Threshold: Learning with Event-Driven Backpropagation Wenjie Wei, Malu Zhang, Hong Qu, Ammar Belatreche, Jian Zhang, Hong Chen

PDF

Test Time Adaptation for Blind Image Quality Assessment Subhadeep Roy, Shankhanil Mitra, Soma Biswas, Rajiv Soundararajan

PDF

Test-Time Personalizable Forecasting of 3D Human Poses Qiongjie Cui, Huaijiang Sun, Jianfeng Lu, Weiqing Li, Bin Li, Hongwei Yi, Haofan Wang

PDF

Tetra-NeRF: Representing Neural Radiance Fields Using Tetrahedra Jonas Kulhanek, Torsten Sattler

PDF

TexFusion: Synthesizing 3D Textures with Text-Guided Image Diffusion Models Tianshi Cao, Karsten Kreis, Sanja Fidler, Nicholas Sharp, Kangxue Yin

PDF

Text-Conditioned Sampling Framework for Text-to-Image Generation with Masked Generative Models Jaewoong Lee, Sangwon Jang, Jaehyeong Jo, Jaehong Yoon, Yunji Kim, Jin-Hwa Kim, Jung-Woo Ha, Sung Ju Hwang

PDF

Text-Driven Generative Domain Adaptation with Spectral Consistency Regularization Zhenhuan Liu, Liang Li, Jiayu Xiao, Zheng-Jun Zha, Qingming Huang

PDF

Text2Performer: Text-Driven Human Video Generation Yuming Jiang, Shuai Yang, Tong Liang Koh, Wayne Wu, Chen Change Loy, Ziwei Liu

PDF

Text2Room: Extracting Textured 3D Meshes from 2D Text-to-Image Models Lukas Höllein, Ang Cao, Andrew Owens, Justin Johnson, Matthias Nießner

PDF

Text2Tex: Text-Driven Texture Synthesis via Diffusion Models Dave Zhenyu Chen, Yawar Siddiqui, Hsin-Ying Lee, Sergey Tulyakov, Matthias Nießner

PDF

Text2Video-Zero: Text-to-Image Diffusion Models Are Zero-Shot Video Generators Levon Khachatryan, Andranik Movsisyan, Vahram Tadevosyan, Roberto Henschel, Zhangyang Wang, Shant Navasardyan, Humphrey Shi

PDF

TextManiA: Enriching Visual Feature by Text-Driven Manifold Augmentation Moon Ye-Bin, Jisoo Kim, Hongyeob Kim, Kilho Son, Tae-Hyun Oh

PDF

TextPSG: Panoptic Scene Graph Generation from Textual Descriptions Chengyang Zhao, Yikang Shen, Zhenfang Chen, Mingyu Ding, Chuang Gan

PDF

Texture Generation on 3D Meshes with Point-UV Diffusion Xin Yu, Peng Dai, Wenbo Li, Lan Ma, Zhengzhe Liu, Xiaojuan Qi

PDF

Texture Learning Domain Randomization for Domain Generalized Segmentation Sunghwan Kim, Dae-hwan Kim, Hoseong Kim

PDF

TF-ICON: Diffusion-Based Training-Free Cross-Domain Image Composition Shilin Lu, Yanzhu Liu, Adams Wai-Kin Kong

PDF

The Devil Is in the Crack Orientation: A New Perspective for Crack Detection Zhuangzhuang Chen, Jin Zhang, Zhuonan Lai, Guanming Zhu, Zun Liu, Jie Chen, Jianqiang Li

PDF

The Devil Is in the Upsampling: Architectural Decisions Made Simpler for Denoising with Deep Image Prior Yilin Liu, Jiang Li, Yunkui Pang, Dong Nie, Pew-Thian Yap

PDF

The Effectiveness of MAE Pre-Pretraining for Billion-Scale Pretraining Mannat Singh, Quentin Duval, Kalyan Vasudev Alwala, Haoqi Fan, Vaibhav Aggarwal, Aaron Adcock, Armand Joulin, Piotr Dollar, Christoph Feichtenhofer, Ross Girshick, Rohit Girdhar, Ishan Misra

PDF

The Euclidean Space Is Evil: Hyperbolic Attribute Editing for Few-Shot Image Generation Lingxiao Li, Yi Zhang, Shuhui Wang

PDF

The Making and Breaking of Camouflage Hala Lamdouar, Weidi Xie, Andrew Zisserman

PDF

The Perils of Learning from Unlabeled Data: Backdoor Attacks on Semi-Supervised Learning Virat Shejwalkar, Lingjuan Lyu, Amir Houmansadr

PDF

The Power of Sound (TPoS): Audio Reactive Video Generation with Stable Diffusion Yujin Jeong, Wonjeong Ryoo, Seunghyun Lee, Dabin Seo, Wonmin Byeon, Sangpil Kim, Jinkyu Kim

PDF

The Stable Signature: Rooting Watermarks in Latent Diffusion Models Pierre Fernandez, Guillaume Couairon, Hervé Jégou, Matthijs Douze, Teddy Furon

PDF

The Unreasonable Effectiveness of Large Language-Vision Models for Source-Free Video Domain Adaptation Giacomo Zara, Alessandro Conti, Subhankar Roy, Stéphane Lathuilière, Paolo Rota, Elisa Ricci

PDF

The Victim and the Beneficiary: Exploiting a Poisoned Model to Train a Clean Model on Poisoned Data Zixuan Zhu, Rui Wang, Cong Zou, Lihua Jing

PDF

Theoretical and Numerical Analysis of 3D Reconstruction Using Point and Line Incidences Felix Rydell, Elima Shehu, Angélica Torres

PDF

Thinking Image Color Aesthetics Assessment: Models, Datasets and Benchmarks Shuai He, Anlong Ming, Yaqi Li, Jinyuan Sun, ShunTian Zheng, Huadong Ma

PDF

TiDAL: Learning Training Dynamics for Active Learning Seong Min Kye, Kwanghee Choi, Hyeongmin Byun, Buru Chang

PDF

TiDy-PSFs: Computational Imaging with Time-Averaged Dynamic Point-Spread-Functions Sachin Shah, Sakshum Kulshrestha, Christopher A. Metzler

PDF

TIFA: Accurate and Interpretable Text-to-Image Faithfulness Evaluation with Question Answering Yushi Hu, Benlin Liu, Jungo Kasai, Yizhong Wang, Mari Ostendorf, Ranjay Krishna, Noah A. Smith

PDF

TIJO: Trigger Inversion with Joint Optimization for Defending Multimodal Backdoored Models Indranil Sur, Karan Sikka, Matthew Walmer, Kaushik Koneripalli, Anirban Roy, Xiao Lin, Ajay Divakaran, Susmit Jha

PDF

Tiled Multiplane Images for Practical 3D Photography Numair Khan, Lei Xiao, Douglas Lanman

PDF

Time Does Tell: Self-Supervised Time-Tuning of Dense Image Representations Mohammadreza Salehi, Efstratios Gavves, Cees G.M. Snoek, Yuki M. Asano

PDF

Time-to-Contact mAP by Joint Estimation of Up-to-Scale Inverse Depth and Global Motion Using a Single Event Camera Urbano Miguel Nunes, Laurent Udo Perrinet, Sio-Hoi Ieng

PDF

Tiny Updater: Towards Efficient Neural Network-Driven Software Updating Linfeng Zhang, Kaisheng Ma

PDF

TinyCLIP: CLIP Distillation via Affinity Mimicking and Weight Inheritance Kan Wu, Houwen Peng, Zhenghong Zhou, Bin Xiao, Mengchen Liu, Lu Yuan, Hong Xuan, Michael Valenzuela, Xi Chen, Xinggang Wang, Hongyang Chao, Han Hu

PDF

TM2D: Bimodality Driven 3D Dance Generation via Music-Text Integration Kehong Gong, Dongze Lian, Heng Chang, Chuan Guo, Zihang Jiang, Xinxin Zuo, Michael Bi Mi, Xinchao Wang

PDF

TMA: Temporal Motion Aggregation for Event-Based Optical Flow Haotian Liu, Guang Chen, Sanqing Qu, Yanping Zhang, Zhijun Li, Alois Knoll, Changjun Jiang

PDF

TMR: Text-to-Motion Retrieval Using Contrastive 3D Human Motion Synthesis Mathis Petrovich, Michael J. Black, Gül Varol

PDF

To Adapt or Not to Adapt? Real-Time Adaptation for Semantic Segmentation Marc Botet Colomer, Pier Luigi Dovesi, Theodoros Panagiotakopoulos, Joao Frederico Carvalho, Linus Härenstam-Nielsen, Hossein Azizpour, Hedvig Kjellström, Daniel Cremers, Matteo Poggi

PDF

Token-Label Alignment for Vision Transformers Han Xiao, Wenzhao Zheng, Zheng Zhu, Jie Zhou, Jiwen Lu

PDF

Too Large; Data Reduction for Vision-Language Pre-Training Alex Jinpeng Wang, Kevin Qinghong Lin, David Junhao Zhang, Stan Weixian Lei, Mike Zheng Shou

PDF

ToonTalker: Cross-Domain Face Reenactment Yuan Gong, Yong Zhang, Xiaodong Cun, Fei Yin, Yanbo Fan, Xuan Wang, Baoyuan Wu, Yujiu Yang

PDF

TopoSeg: Topology-Aware Nuclear Instance Segmentation Hongliang He, Jun Wang, Pengxu Wei, Fan Xu, Xiangyang Ji, Chang Liu, Jie Chen

PDF

TORE: Token Reduction for Efficient Human Mesh Recovery with Transformer Zhiyang Dou, Qingxuan Wu, Cheng Lin, Zeyu Cao, Qiangqiang Wu, Weilin Wan, Taku Komura, Wenping Wang

PDF

Total-Recon: Deformable Scene Reconstruction for Embodied View Synthesis Chonghyuk Song, Gengshan Yang, Kangle Deng, Jun-Yan Zhu, Deva Ramanan

PDF

Toward Multi-Granularity Decision-Making: Explicit Visual Reasoning with Hierarchical Knowledge Yifeng Zhang, Shi Chen, Qi Zhao

PDF

Toward Unsupervised Realistic Visual Question Answering Yuwei Zhang, Chih-Hui Ho, Nuno Vasconcelos

PDF

Towards Attack-Tolerant Federated Learning via Critical Parameter Analysis Sungwon Han, Sungwon Park, Fangzhao Wu, Sundong Kim, Bin Zhu, Xing Xie, Meeyoung Cha

PDF

Towards Authentic Face Restoration with Iterative Diffusion Models and Beyond Yang Zhao, Tingbo Hou, Yu-Chuan Su, Xuhui Jia, Yandong Li, Matthias Grundmann

PDF

Towards Better Robustness Against Common Corruptions for Unsupervised Domain Adaptation Zhiqiang Gao, Kaizhu Huang, Rui Zhang, Dawei Liu, Jieming Ma

PDF

Towards Building More Robust Models with Frequency Bias Qingwen Bu, Dong Huang, Heming Cui

PDF

Towards Content-Based Pixel Retrieval in Revisited Oxford and Paris Guoyuan An, Woo Jae Kim, Saelyne Yang, Rong Li, Yuchi Huo, Sun-Eui Yoon

PDF

Towards Deeply Unified Depth-Aware Panoptic Segmentation with Bi-Directional Guidance Learning Junwen He, Yifan Wang, Lijun Wang, Huchuan Lu, Bin Luo, Jun-Yan He, Jin-Peng Lan, Yifeng Geng, Xuansong Xie

PDF

Towards Effective Instance Discrimination Contrastive Loss for Unsupervised Domain Adaptation Yixin Zhang, Zilei Wang, Junjie Li, Jiafan Zhuang, Zihan Lin

PDF

Towards Fair and Comprehensive Comparisons for Image-Based 3D Object Detection Xinzhu Ma, Yongtao Wang, Yinmin Zhang, Zhiyi Xia, Yuan Meng, Zhihui Wang, Haojie Li, Wanli Ouyang

PDF

Towards Fairness-Aware Adversarial Network Pruning Lei Zhang, Zhibo Wang, Xiaowei Dong, Yunhe Feng, Xiaoyi Pang, Zhifei Zhang, Kui Ren

PDF

Towards General Low-Light Raw Noise Synthesis and Modeling Feng Zhang, Bin Xu, Zhiqiang Li, Xinran Liu, Qingbo Lu, Changxin Gao, Nong Sang

PDF

Towards Generic Image Manipulation Detection with Weakly-Supervised Self-Consistency Learning Yuanhao Zhai, Tianyu Luan, David Doermann, Junsong Yuan

PDF

Towards Geospatial Foundation Models via Continual Pretraining Matías Mendieta, Boran Han, Xingjian Shi, Yi Zhu, Chen Chen

PDF

Towards Grand Unified Representation Learning for Unsupervised Visible-Infrared Person Re-Identification Bin Yang, Jun Chen, Mang Ye

PDF

Towards High-Fidelity Text-Guided 3D Face Generation and Manipulation Using Only Images Cuican Yu, Guansong Lu, Yihan Zeng, Jian Sun, Xiaodan Liang, Huibin Li, Zongben Xu, Songcen Xu, Wei Zhang, Hang Xu

PDF

Towards High-Quality Specular Highlight Removal by Leveraging Large-Scale Synthetic Data Gang Fu, Qing Zhang, Lei Zhu, Chunxia Xiao, Ping Li

PDF

Towards Improved Input Masking for Convolutional Neural Networks Sriram Balasubramanian, Soheil Feizi

PDF

Towards Inadequately Pre-Trained Models in Transfer Learning Andong Deng, Xingjian Li, Di Hu, Tianyang Wang, Haoyi Xiong, Cheng-Zhong Xu

PDF

Towards Instance-Adaptive Inference for Federated Learning Chun-Mei Feng, Kai Yu, Nian Liu, Xinxing Xu, Salman Khan, Wangmeng Zuo

PDF

Towards Memory- and Time-Efficient Backpropagation for Training Spiking Neural Networks Qingyan Meng, Mingqing Xiao, Shen Yan, Yisen Wang, Zhouchen Lin, Zhi-Quan Luo

PDF

Towards Models That Can See and Read Roy Ganz, Oren Nuriel, Aviad Aberdam, Yair Kittenplon, Shai Mazor, Ron Litman

PDF

Towards Multi-Layered 3D Garments Animation Yidi Shao, Chen Change Loy, Bo Dai

PDF

Towards Nonlinear-Motion-Aware and Occlusion-Robust Rolling Shutter Correction Delin Qu, Yizhen Lao, Zhigang Wang, Dong Wang, Bin Zhao, Xuelong Li

PDF

Towards Open-Set Test-Time Adaptation Utilizing the Wisdom of Crowds in Entropy Minimization Jungsoo Lee, Debasmit Das, Jaegul Choo, Sungha Choi

PDF

Towards Open-Vocabulary Video Instance Segmentation Haochen Wang, Cilin Yan, Shuai Wang, Xiaolong Jiang, Xu Tang, Yao Hu, Weidi Xie, Efstratios Gavves

PDF

Towards Real-World Burst Image Super-Resolution: Benchmark and Method Pengxu Wei, Yujing Sun, Xingbei Guo, Chang Liu, Guanbin Li, Jie Chen, Xiangyang Ji, Liang Lin

PDF

Towards Realistic Evaluation of Industrial Continual Learning Scenarios with an Emphasis on Energy Consumption and Computational Footprint Vivek Chavan, Paul Koch, Marian Schlüter, Clemens Briese

PDF

Towards Robust and Smooth 3D Multi-Person Pose Estimation from Monocular Videos in the Wild Sungchan Park, Eunyi You, Inhoe Lee, Joonseok Lee

PDF

Towards Robust Model Watermark via Reducing Parametric Vulnerability Guanhao Gan, Yiming Li, Dongxian Wu, Shu-Tao Xia

PDF

Towards Saner Deep Image Registration Bin Duan, Ming Zhong, Yan Yan

PDF

Towards Semi-Supervised Learning with Non-Random Missing Labels Yue Duan, Zhen Zhao, Lei Qi, Luping Zhou, Lei Wang, Yinghuan Shi

PDF

Towards Understanding the Generalization of Deepfake Detectors from a Game-Theoretical View Kelu Yao, Jin Wang, Boyu Diao, Chao Li

PDF

Towards Unifying Medical Vision-and-Language Pre-Training via Soft Prompts Zhihong Chen, Shizhe Diao, Benyou Wang, Guanbin Li, Xiang Wan

PDF

Towards Universal Image Embeddings: A Large-Scale Dataset and Challenge for Generic Image Representations Nikolaos-Antonios Ypsilantis, Kaifeng Chen, Bingyi Cao, Mário Lipovský, Pelin Dogan-Schönberger, Grzegorz Makosa, Boris Bluntschli, Mojtaba Seyedhosseini, Ondřej Chum, André Araujo

PDF

Towards Universal LiDAR-Based 3D Object Detection by Multi-Domain Knowledge Transfer Guile Wu, Tongtong Cao, Bingbing Liu, Xingxin Chen, Yuan Ren

PDF

Towards Unsupervised Domain Generalization for Face Anti-Spoofing Yuchen Liu, Yabo Chen, Mengran Gou, Chun-Ting Huang, Yaoming Wang, Wenrui Dai, Hongkai Xiong

PDF

Towards Viewpoint Robustness in Bird's Eye View Segmentation Tzofi Klinghoffer, Jonah Philion, Wenzheng Chen, Or Litany, Zan Gojcic, Jungseock Joo, Ramesh Raskar, Sanja Fidler, Jose M. Alvarez

PDF

Towards Viewpoint-Invariant Visual Recognition via Adversarial Training Shouwei Ruan, Yinpeng Dong, Hang Su, Jianteng Peng, Ning Chen, Xingxing Wei

PDF

Towards Zero Domain Gap: A Comprehensive Study of Realistic LiDAR Simulation for Autonomy Testing Sivabalan Manivasagam, Ioan Andrei Bârsan, Jingkang Wang, Ze Yang, Raquel Urtasun

PDF

Towards Zero-Shot Scale-Aware Monocular Depth Estimation Vitor Guizilini, Igor Vasiljevic, Dian Chen, Rareș Ambruș, Adrien Gaidon

PDF

Tracing the Origin of Adversarial Attack for Forensic Investigation and Deterrence Han Fang, Jiyi Zhang, Yupeng Qiu, Jiayang Liu, Ke Xu, Chengfang Fang, Ee-Chien Chang

PDF

TrackFlow: Multi-Object Tracking with Normalizing Flows Gianluca Mancusi, Aniello Panariello, Angelo Porrello, Matteo Fabbri, Simone Calderara, Rita Cucchiara

PDF

Tracking Anything with Decoupled Video Segmentation Ho Kei Cheng, Seoung Wug Oh, Brian Price, Alexander Schwing, Joon-Young Lee

PDF

Tracking by 3D Model Estimation of Unknown Objects in Videos Denys Rozumnyi, Jiří Matas, Marc Pollefeys, Vittorio Ferrari, Martin R. Oswald

PDF

Tracking by Natural Language Specification with Long Short-Term Context Decoupling Ding Ma, Xiangqian Wu

PDF

Tracking Everything Everywhere All at Once Qianqian Wang, Yen-Yu Chang, Ruojin Cai, Zhengqi Li, Bharath Hariharan, Aleksander Holynski, Noah Snavely

PDF

Tracking Without Label: Unsupervised Multiple Object Tracking via Contrastive Similarity Learning Sha Meng, Dian Shao, Jiacheng Guo, Shan Gao

PDF

Traj-MAE: Masked Autoencoders for Trajectory Prediction Hao Chen, Jiaze Wang, Kun Shao, Furui Liu, Jianye Hao, Chenyong Guan, Guangyong Chen, Pheng-Ann Heng

PDF

Trajectory Unified Transformer for Pedestrian Trajectory Prediction Liushuai Shi, Le Wang, Sanping Zhou, Gang Hua

PDF

TrajectoryFormer: 3D Object Tracking Transformer with Predictive Trajectory Hypotheses Xuesong Chen, Shaoshuai Shi, Chao Zhang, Benjin Zhu, Qiang Wang, Ka Chun Cheung, Simon See, Hongsheng Li

PDF

TrajPAC: Towards Robustness Verification of Pedestrian Trajectory Prediction Models Liang Zhang, Nathaniel Xu, Pengfei Yang, Gaojie Jin, Cheng-Chao Huang, Lijun Zhang

PDF

TransFace: Calibrating Transformer Training for Face Recognition from a Data-Centric Perspective Jun Dan, Yang Liu, Haoyu Xie, Jiankang Deng, Haoran Xie, Xuansong Xie, Baigui Sun

PDF

Transferable Adversarial Attack for Both Vision Transformers and Convolutional Networks via Momentum Integrated Gradients Wenshuo Ma, Yidong Li, Xiaofeng Jia, Wei Xu

PDF

Transferable Decoding with Visual Entities for Zero-Shot Image Captioning Junjie Fei, Teng Wang, Jinrui Zhang, Zhenyu He, Chengjie Wang, Feng Zheng

PDF

TransHuman: A Transformer-Based Human Representation for Generalizable Neural Human Rendering Xiao Pan, Zongxin Yang, Jianxin Ma, Chang Zhou, Yi Yang

PDF

TransIFF: An Instance-Level Feature Fusion Framework for Vehicle-Infrastructure Cooperative 3D Detection with Transformers Ziming Chen, Yifeng Shi, Jinrang Jia

PDF

Translating Images to Road Network: A Non-Autoregressive Sequence-to-Sequence Approach Jiachen Lu, Renyuan Peng, Xinyue Cai, Hang Xu, Hongyang Li, Feng Wen, Wei Zhang, Li Zhang

PDF

Transparent Shape from a Single View Polarization Image Mingqi Shao, Chongkun Xia, Zhendong Yang, Junnan Huang, Xueqian Wang

PDF

TransTIC: Transferring Transformer-Based Image Compression from Human Perception to Machine Perception Yi-Hsin Chen, Ying-Chieh Weng, Chia-Hao Kao, Cheng Chien, Wei-Chen Chiu, Wen-Hsiao Peng

PDF

Treating Pseudo-Labels Generation as Image Matting for Weakly Supervised Semantic Segmentation Changwei Wang, Rongtao Xu, Shibiao Xu, Weiliang Meng, Xiaopeng Zhang

PDF

Tree-Structured Shading Decomposition Chen Geng, Hong-Xing Yu, Sharon Zhang, Maneesh Agrawala, Jiajun Wu

PDF

Tri-MipRF: Tri-Mip Representation for Efficient Anti-Aliasing Neural Radiance Fields Wenbo Hu, Yuling Wang, Lin Ma, Bangbang Yang, Lin Gao, Xiao Liu, Yuewen Ma

PDF

TripLe: Revisiting Pretrained Model Reuse and Progressive Learning for Efficient Vision Transformer Scaling and Searching Cheng Fu, Hanxian Huang, Zixuan Jiang, Yun Ni, Lifeng Nai, Gang Wu, Liqun Cheng, Yanqi Zhou, Sheng Li, Andrew Li, Jishen Zhao

PDF

TRM-UAP: Enhancing the Transferability of Data-Free Universal Adversarial Perturbation via Truncated Ratio Maximization Yiran Liu, Xin Feng, Yunlong Wang, Wu Yang, Di Ming

PDF

Troubleshooting Ethnic Quality Bias with Curriculum Domain Adaptation for Face Image Quality Assessment Fu-Zhao Ou, Baoliang Chen, Chongyi Li, Shiqi Wang, Sam Kwong

PDF

Tube-Link: A Flexible Cross Tube Framework for Universal Video Segmentation Xiangtai Li, Haobo Yuan, Wenwei Zhang, Guangliang Cheng, Jiangmiao Pang, Chen Change Loy

PDF

Tubelet-Contrastive Self-Supervision for Video-Efficient Generalization Fida Mohammad Thoker, Hazel Doughty, Cees G. M. Snoek

PDF

Tune-a-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video Generation Jay Zhangjie Wu, Yixiao Ge, Xintao Wang, Stan Weixian Lei, Yuchao Gu, Yufei Shi, Wynne Hsu, Ying Shan, Xiaohu Qie, Mike Zheng Shou

PDF

Tuning Pre-Trained Model via Moment Probing Mingze Gao, Qilong Wang, Zhenyi Lin, Pengfei Zhu, Qinghua Hu, Jingbo Zhou

PDF

Two Birds, One Stone: A Unified Framework for Joint Learning of Image and Video Style Transfers Bohai Gu, Heng Fan, Libo Zhang

PDF

Two-in-One Depth: Bridging the Gap Between Monocular and Binocular Self-Supervised Depth Estimation Zhengming Zhou, Qiulei Dong

PDF

U-RED: Unsupervised 3D Shape Retrieval and Deformation for Partial Point Clouds Yan Di, Chenyangguang Zhang, Ruida Zhang, Fabian Manhardt, Yongzhi Su, Jason Rambach, Didier Stricker, Xiangyang Ji, Federico Tombari

PDF

UATVR: Uncertainty-Adaptive Text-Video Retrieval Bo Fang, Wenhao Wu, Chang Liu, Yu Zhou, Yuxin Song, Weiping Wang, Xiangbo Shu, Xiangyang Ji, Jingdong Wang

PDF

UCF: Uncovering Common Features for Generalizable Deepfake Detection Zhiyuan Yan, Yong Zhang, Yanbo Fan, Baoyuan Wu

PDF

UGC: Unified GAN Compression for Efficient Image-to-Image Translation Yuxi Ren, Jie Wu, Peng Zhang, Manlin Zhang, Xuefeng Xiao, Qian He, Rui Wang, Min Zheng, Xin Pan

PDF

UHDNeRF: Ultra-High-Definition Neural Radiance Fields Quewei Li, Feichao Li, Jie Guo, Yanwen Guo

PDF

UMC: A Unified Bandwidth-Efficient and Multi-Resolution Based Collaborative Perception Framework Tianhang Wang, Guang Chen, Kai Chen, Zhengfa Liu, Bo Zhang, Alois Knoll, Changjun Jiang

PDF

UMFuse: Unified Multi View Fusion for Human Editing Applications Rishabh Jain, Mayur Hemani, Duygu Ceylan, Krishna Kumar Singh, Jingwan Lu, Mausoom Sarkar, Balaji Krishnamurthy

PDF

UMIFormer: Mining the Correlations Between Similar Tokens for Multi-View 3D Reconstruction Zhenwei Zhu, Liying Yang, Ning Li, Chaohao Jiang, Yanyan Liang

PDF

Unaligned 2D to 3D Translation with Conditional Vector-Quantized Code Diffusion Using Transformers Abril Corona-Figueroa, Sam Bond-Taylor, Neelanjan Bhowmik, Yona Falinie A. Gaus, Toby P. Breckon, Hubert P. H. Shum, Chris G. Willcocks

PDF

Uncertainty Guided Adaptive Warping for Robust and Efficient Stereo Matching Junpeng Jing, Jiankun Li, Pengfei Xiong, Jiangyu Liu, Shuaicheng Liu, Yichen Guo, Xin Deng, Mai Xu, Lai Jiang, Leonid Sigal

PDF

Uncertainty-Aware State Space Transformer for Egocentric 3D Hand Trajectory Forecasting Wentao Bao, Lele Chen, Libing Zeng, Zhong Li, Yi Xu, Junsong Yuan, Yu Kong

PDF

Uncertainty-Aware Unsupervised Multi-Object Tracking Kai Liu, Sheng Jin, Zhihang Fu, Ze Chen, Rongxin Jiang, Jieping Ye

PDF

Uncertainty-Guided Learning for Improving Image Manipulation Detection Kaixiang Ji, Feng Chen, Xin Guo, Yadong Xu, Jian Wang, Jingdong Chen

PDF

Under-Display Camera Image Restoration with Scattering Effect Binbin Song, Xiangyu Chen, Shuning Xu, Jiantao Zhou

PDF

Understanding 3D Object Interaction from a Single Image Shengyi Qian, David F. Fouhey

PDF

Understanding Hessian Alignment for Domain Generalization Sobhan Hemati, Guojun Zhang, Amir Estiri, Xi Chen

PDF

Understanding Self-Attention Mechanism via Dynamical System Perspective Zhongzhan Huang, Mingfu Liang, Jinghui Qin, Shanshan Zhong, Liang Lin

PDF

Understanding the Feature Norm for Out-of-Distribution Detection Jaewoo Park, Jacky Chen Long Chai, Jaeho Yoon, Andrew Beng Jin Teoh

PDF

Unfolding Framework with Prior of Convolution-Transformer Mixture and Uncertainty Estimation for Video Snapshot Compressive Imaging Siming Zheng, Xin Yuan

PDF

Uni-3D: A Universal Model for Panoptic 3D Scene Reconstruction Xiang Zhang, Zeyuan Chen, Fangyin Wei, Zhuowen Tu

PDF

UniDexGrasp++: Improving Dexterous Grasping Policy Learning via Geometry-Aware Curriculum and Iterative Generalist-Specialist Learning Weikang Wan, Haoran Geng, Yun Liu, Zikang Shan, Yaodong Yang, Li Yi, He Wang

PDF

UniFace: Unified Cross-Entropy Loss for Deep Face Recognition Jiancan Zhou, Xi Jia, Qiufu Li, Linlin Shen, Jinming Duan

PDF

Unified Adversarial Patch for Cross-Modal Attacks in the Physical World Xingxing Wei, Yao Huang, Yitong Sun, Jie Yu

PDF

Unified Coarse-to-Fine Alignment for Video-Text Retrieval Ziyang Wang, Yi-Lin Sung, Feng Cheng, Gedas Bertasius, Mohit Bansal

PDF

Unified Data-Free Compression: Pruning and Quantization Without Fine-Tuning Shipeng Bai, Jun Chen, Xintian Shen, Yixuan Qian, Yong Liu

PDF

Unified Out-of-Distribution Detection: A Model-Specific Perspective Reza Averly, Wei-Lun Chao

PDF

Unified Pre-Training with Pseudo Texts for Text-to-Image Person Re-Identification Zhiyin Shao, Xinyu Zhang, Changxing Ding, Jian Wang, Jingdong Wang

PDF

Unified Visual Relationship Detection with Vision and Language Models Long Zhao, Liangzhe Yuan, Boqing Gong, Yin Cui, Florian Schroff, Ming-Hsuan Yang, Hartwig Adam, Ting Liu

PDF

UniFormerV2: Unlocking the Potential of Image ViTs for Video Understanding Kunchang Li, Yali Wang, Yinan He, Yizhuo Li, Yi Wang, Limin Wang, Yu Qiao

PDF

UniFusion: Unified Multi-View Fusion Transformer for Spatial-Temporal Representation in Bird's-Eye-View Zequn Qin, Jingyu Chen, Chao Chen, Xiaozhi Chen, Xi Li

PDF

Unify, Align and Refine: Multi-Level Semantic Alignment for Radiology Report Generation Yaowei Li, Bang Yang, Xuxin Cheng, Zhihong Zhu, Hongxiang Li, Yuexian Zou

PDF

UniKD: Universal Knowledge Distillation for Mimicking Homogeneous or Heterogeneous Object Detectors Shanshan Lao, Guanglu Song, Boxiao Liu, Yu Liu, Yujiu Yang

PDF

Unilaterally Aggregated Contrastive Learning with Hierarchical Augmentation for Anomaly Detection Guodong Wang, Yunhong Wang, Jie Qin, Dongming Zhang, Xiuguo Bao, Di Huang

PDF

UniSeg: A Unified Multi-Modal LiDAR Segmentation Network and the OpenPCSeg Codebase Youquan Liu, Runnan Chen, Xin Li, Lingdong Kong, Yuchen Yang, Zhaoyang Xia, Yeqi Bai, Xinge Zhu, Yuexin Ma, Yikang Li, Yu Qiao, Yuenan Hou

PDF

UniT3D: A Unified Transformer for 3D Dense Captioning and Visual Grounding Zhenyu Chen, Ronghang Hu, Xinlei Chen, Matthias Nießner, Angel X. Chang

PDF

UnitedHuman: Harnessing Multi-Source Data for High-Resolution Human Generation Jianglin Fu, Shikai Li, Yuming Jiang, Kwan-Yee Lin, Wayne Wu, Ziwei Liu

PDF

UniTR: A Unified and Efficient Multi-Modal Transformer for Bird's-Eye-View Representation Haiyang Wang, Hao Tang, Shaoshuai Shi, Aoxue Li, Zhenguo Li, Bernt Schiele, Liwei Wang

PDF

Universal Domain Adaptation via Compressive Attention Matching Didi Zhu, Yinchuan Li, Junkun Yuan, Zexi Li, Kun Kuang, Chao Wu

PDF

UniverSeg: Universal Medical Image Segmentation Victor Ion Butoi, Jose Javier Gonzalez Ortiz, Tianyu Ma, Mert R. Sabuncu, John Guttag, Adrian V. Dalca

PDF

UniVTG: Towards Unified Video-Language Temporal Grounding Kevin Qinghong Lin, Pengchuan Zhang, Joya Chen, Shraman Pramanick, Difei Gao, Alex Jinpeng Wang, Rui Yan, Mike Zheng Shou

PDF

Unleashing Text-to-Image Diffusion Models for Visual Perception Wenliang Zhao, Yongming Rao, Zuyan Liu, Benlin Liu, Jie Zhou, Jiwen Lu

PDF

Unleashing the Potential of Spiking Neural Networks with Dynamic Confidence Chen Li, Edward G Jones, Steve Furber

PDF

Unleashing the Power of Gradient Signal-to-Noise Ratio for Zero-Shot NAS Zihao Sun, Yu Sun, Longxing Yang, Shun Lu, Jilin Mei, Wenxiao Zhao, Yu Hu

PDF

Unleashing Vanilla Vision Transformer with Masked Image Modeling for Object Detection Yuxin Fang, Shusheng Yang, Shijie Wang, Yixiao Ge, Ying Shan, Xinggang Wang

PDF

UnLoc: A Unified Framework for Video Localization Tasks Shen Yan, Xuehan Xiong, Arsha Nagrani, Anurag Arnab, Zhonghao Wang, Weina Ge, David Ross, Cordelia Schmid

PDF

Unmasked Teacher: Towards Training-Efficient Video Foundation Models Kunchang Li, Yali Wang, Yizhuo Li, Yi Wang, Yinan He, Limin Wang, Yu Qiao

PDF

Unmasking Anomalies in Road-Scene Segmentation Shyam Nandan Rai, Fabio Cermelli, Dario Fontanel, Carlo Masone, Barbara Caputo

PDF

Unpaired Multi-Domain Attribute Translation of 3D Facial Shapes with a Square and Symmetric Geometric mAP Zhenfeng Fan, Zhiheng Zhang, Shuang Yang, Chongyang Zhong, Min Cao, Shihong Xia

PDF

Unsupervised 3D Perception with 2D Vision-Language Distillation for Autonomous Driving Mahyar Najibi, Jingwei Ji, Yin Zhou, Charles R. Qi, Xinchen Yan, Scott Ettinger, Dragomir Anguelov

PDF

Unsupervised Accuracy Estimation of Deep Visual Models Using Domain-Adaptive Adversarial Perturbation Without Source Samples JoonHo Lee, Jae Oh Woo, Hankyu Moon, Kwonho Lee

PDF

Unsupervised Compositional Concepts Discovery with Text-to-Image Generative Models Nan Liu, Yilun Du, Shuang Li, Joshua B. Tenenbaum, Antonio Torralba

PDF

Unsupervised Domain Adaptation for Training Event-Based Networks Using Contrastive Learning and Uncorrelated Conditioning Dayuan Jian, Mohammad Rostami

PDF

Unsupervised Domain Adaptive Detection with Network Stability Analysis Wenzhang Zhou, Heng Fan, Tiejian Luo, Libo Zhang

PDF

Unsupervised Facial Performance Editing via Vector-Quantized StyleGAN Representations Berkay Kicanaoglu, Pablo Garrido, Gaurav Bharaj

PDF

Unsupervised Feature Representation Learning for Domain-Generalized Cross-Domain Image Retrieval Conghui Hu, Can Zhang, Gim Hee Lee

PDF

Unsupervised Image Denoising in Real-World Scenarios via Self-Collaboration Parallel Generative Adversarial Branches Xin Lin, Chao Ren, Xiao Liu, Jie Huang, Yinjie Lei

PDF

Unsupervised Learning of Object-Centric Embeddings for Cell Instance Segmentation in Microscopy Images Steffen Wolf, Manan Lalit, Katie McDole, Jan Funke

PDF

Unsupervised Manifold Linearizing and Clustering Tianjiao Ding, Shengbang Tong, Kwan Ho Ryan Chan, Xili Dai, Yi Ma, Benjamin D. Haeffele

PDF

Unsupervised Object Localization with Representer Point Selection Yeonghwan Song, Seokwoo Jang, Dina Katabi, Jeany Son

PDF

Unsupervised Open-Vocabulary Object Localization in Videos Ke Fan, Zechen Bai, Tianjun Xiao, Dominik Zietlow, Max Horn, Zixu Zhao, Carl-Johann Simon-Gabriel, Mike Zheng Shou, Francesco Locatello, Bernt Schiele, Thomas Brox, Zheng Zhang, Yanwei Fu, Tong He

PDF

Unsupervised Prompt Tuning for Text-Driven Object Detection Weizhen He, Weijie Chen, Binbin Chen, Shicai Yang, Di Xie, Luojun Lin, Donglian Qi, Yueting Zhuang

PDF

Unsupervised Self-Driving Attention Prediction via Uncertainty Mining and Knowledge Embedding Pengfei Zhu, Mengshi Qi, Xia Li, Weijian Li, Huadong Ma

PDF

Unsupervised Surface Anomaly Detection with Diffusion Probabilistic Model Xinyi Zhang, Naiqi Li, Jiawei Li, Tao Dai, Yong Jiang, Shu-Tao Xia

PDF

Unsupervised Video Deraining with an Event Camera Jin Wang, Wenming Weng, Yueyi Zhang, Zhiwei Xiong

PDF

Unsupervised Video Object Segmentation with Online Adversarial Self-Tuning Tiankang Su, Huihui Song, Dong Liu, Bo Liu, Qingshan Liu

PDF

UpCycling: Semi-Supervised 3D Object Detection Without Sharing Raw-Level Unlabeled Scenes Sunwook Hwang, Youngseok Kim, Seongwon Kim, Saewoong Bahk, Hyung-Sin Kim

PDF

Urban Radiance Field Representation with Deformable Neural Mesh Primitives Fan Lu, Yan Xu, Guang Chen, Hongsheng Li, Kwan-Yee Lin, Changjun Jiang

PDF

UrbanGIRAFFE: Representing Urban Scenes as Compositional Generative Neural Feature Fields Yuanbo Yang, Yifei Yang, Hanlei Guo, Rong Xiong, Yue Wang, Yiyi Liao

PDF

USAGE: A Unified Seed Area Generation Paradigm for Weakly Supervised Semantic Segmentation Zelin Peng, Guanchun Wang, Lingxi Xie, Dongsheng Jiang, Wei Shen, Qi Tian

PDF

Using a Waffle Iron for Automotive Point Cloud Semantic Segmentation Gilles Puy, Alexandre Boulch, Renaud Marlet

PDF

uSplit: Image Decomposition for Fluorescence Microscopy Ashesh Ashesh, Alexander Krull, Moises Di Sante, Francesco Pasqualini, Florian Jug

PDF

V-FUSE: Volumetric Depth mAP Fusion with Long-Range Constraints Nathaniel Burgdorfer, Philippos Mordohai

PDF

V3Det: Vast Vocabulary Visual Detection Dataset Jiaqi Wang, Pan Zhang, Tao Chu, Yuhang Cao, Yujie Zhou, Tong Wu, Bin Wang, Conghui He, Dahua Lin

PDF

VAD: Vectorized Scene Representation for Efficient Autonomous Driving Bo Jiang, Shaoyu Chen, Qing Xu, Bencheng Liao, Jiajie Chen, Helong Zhou, Qian Zhang, Wenyu Liu, Chang Huang, Xinggang Wang

PDF

VADER: Video Alignment Differencing and Retrieval Alexander Black, Simon Jenni, Tu Bui, Md. Mehrab Tanjim, Stefano Petrangeli, Ritwik Sinha, Viswanathan Swaminathan, John Collomosse

PDF

Vanishing Point Estimation in Uncalibrated Images with Prior Gravity Direction Rémi Pautrat, Shaohui Liu, Petr Hruby, Marc Pollefeys, Daniel Barath

PDF

VAPCNet: Viewpoint-Aware 3D Point Cloud Completion Zhiheng Fu, Longguang Wang, Lian Xu, Zhiyong Wang, Hamid Laga, Yulan Guo, Farid Boussaid, Mohammed Bennamoun

PDF

Variational Causal Inference Network for Explanatory Visual Question Answering Dizhan Xue, Shengsheng Qian, Changsheng Xu

PDF

Variational Degeneration to Structural Refinement: A Unified Framework for Superimposed Image Decomposition Wenyu Li, Yan Xu, Yang Yang, Haoran Ji, Yue Lang

PDF

Verbs in Action: Improving Verb Understanding in Video-Language Models Liliane Momeni, Mathilde Caron, Arsha Nagrani, Andrew Zisserman, Cordelia Schmid

PDF

VeRi3D: Generative Vertex-Based Radiance Fields for 3D Controllable Human Image Synthesis Xinya Chen, Jiaxin Huang, Yanrui Bin, Lu Yu, Yiyi Liao

PDF

Versatile Diffusion: Text, Images and Variations All in One Diffusion Model Xingqian Xu, Zhangyang Wang, Gong Zhang, Kai Wang, Humphrey Shi

PDF

VertexSerum: Poisoning Graph Neural Networks for Link Inference Ruyi Ding, Shijin Duan, Xiaolin Xu, Yunsi Fei

PDF

VI-Net: Boosting Category-Level 6d Object Pose Estimation via Learning Decoupled Rotations on the Spherical Representations Jiehong Lin, Zewei Wei, Yabin Zhang, Kui Jia

PDF

Video Action Recognition with Attentive Semantic Units Yifei Chen, Dapeng Chen, Ruijin Liu, Hao Li, Wei Peng

PDF

Video Action Segmentation via Contextually Refined Temporal Keypoints Borui Jiang, Yang Jin, Zhentao Tan, Yadong Mu

PDF

Video Adverse-Weather-Component Suppression Network via Weather Messenger and Adversarial Backpropagation Yijun Yang, Angelica I. Aviles-Rivero, Huazhu Fu, Ye Liu, Weiming Wang, Lei Zhu

PDF

Video Anomaly Detection via Sequentially Learning Multiple Pretext Tasks Chenrui Shi, Che Sun, Yuwei Wu, Yunde Jia

PDF

Video Background Music Generation: Dataset, Method and Evaluation Le Zhuo, Zhaokai Wang, Baisen Wang, Yue Liao, Chenxi Bao, Stanley Peng, Songhao Han, Aixi Zhang, Fei Fang, Si Liu

PDF

Video Object Segmentation-Aware Video Frame Interpolation Jun-Sang Yoo, Hongjae Lee, Seung-Won Jung

PDF

Video OWL-ViT: Temporally-Consistent Open-World Localization in Video Georg Heigold, Matthias Minderer, Alexey Gritsenko, Alex Bewley, Daniel Keysers, Mario Lučić, Fisher Yu, Thomas Kipf

PDF

Video State-Changing Object Segmentation Jiangwei Yu, Xiang Li, Xinran Zhao, Hongming Zhang, Yu-Xiong Wang

PDF

Video Task Decathlon: Unifying Image and Video Tasks in Autonomous Driving Thomas E. Huang, Yifan Liu, Luc Van Gool, Fisher Yu

PDF

Video-FocalNets: Spatio-Temporal Focal Modulation for Video Action Recognition Syed Talal Wasim, Muhammad Uzair Khattak, Muzammal Naseer, Salman Khan, Mubarak Shah, Fahad Shahbaz Khan

PDF

VideoFlow: Exploiting Temporal Cues for Multi-Frame Optical Flow Estimation Xiaoyu Shi, Zhaoyang Huang, Weikang Bian, Dasong Li, Manyuan Zhang, Ka Chun Cheung, Simon See, Hongwei Qin, Jifeng Dai, Hongsheng Li

PDF

VidStyleODE: Disentangled Video Editing via StyleGAN and NeuralODEs Moayed Haji Ali, Andrew Bond, Tolga Birdal, Duygu Ceylan, Levent Karacan, Erkut Erdem, Aykut Erdem

PDF

View Consistent Purification for Accurate Cross-View Localization Shan Wang, Yanhao Zhang, Akhil Perincherry, Ankit Vora, Hongdong Li

PDF

Viewing Graph Solvability in Practice Federica Arrigoni, Tomas Pajdla, Andrea Fusiello

PDF

ViewRefer: Grasp the Multi-View Knowledge for 3D Visual Grounding Zoey Guo, Yiwen Tang, Ray Zhang, Dong Wang, Zhigang Wang, Bin Zhao, Xuelong Li

PDF

Viewset Diffusion: (0-)Image-Conditioned 3D Generative Models from 2D Data Stanislaw Szymanowicz, Christian Rupprecht, Andrea Vedaldi

PDF

ViLLA: Fine-Grained Vision-Language Representation Learning from Real-World Data Maya Varma, Jean-Benoit Delbrouck, Sarah Hooper, Akshay Chaudhari, Curtis Langlotz

PDF

ViLTA: Enhancing Vision-Language Pre-Training Through Textual Augmentation Weihan Wang, Zhen Yang, Bin Xu, Juanzi Li, Yankui Sun

PDF

ViM: Vision Middleware for Unified Downstream Transferring Yutong Feng, Biao Gong, Jianwen Jiang, Yiliang Lv, Yujun Shen, Deli Zhao, Jingren Zhou

PDF

ViperGPT: Visual Inference via Python Execution for Reasoning Dídac Surís, Sachit Menon, Carl Vondrick

PDF

Virtual Try-on with Pose-Garment Keypoints Guided Inpainting Zhi Li, Pengfei Wei, Xiang Yin, Zejun Ma, Alex C. Kot

PDF

Visible-Infrared Person Re-Identification via Semantic Alignment and Affinity Inference Xingye Fang, Yang Yang, Ying Fu

PDF

Vision Grid Transformer for Document Layout Analysis Cheng Da, Chuwei Luo, Qi Zheng, Cong Yao

PDF

Vision HGNN: An Image Is More than a Graph of Nodes Yan Han, Peihao Wang, Souvik Kundu, Ying Ding, Zhangyang Wang

PDF

Vision Relation Transformer for Unbiased Scene Graph Generation Gopika Sudhakaran, Devendra Singh Dhami, Kristian Kersting, Stefan Roth

PDF

Vision Transformer Adapters for Generalizable Multitask Learning Deblina Bhattacharjee, Sabine Süsstrunk, Mathieu Salzmann

PDF

Visual Explanations via Iterated Integrated Attributions Oren Barkan, ‪Yehonatan Elisha‬‏, Yuval Asher, Amit Eshel, Noam Koenigstein

PDF

Visual Traffic Knowledge Graph Generation from Scene Images Yunfei Guo, Fei Yin, Xiao-hui Li, Xudong Yan, Tao Xue, Shuqi Mei, Cheng-Lin Liu

PDF

Visually-Prompted Language Model for Fine-Grained Scene Graph Generation in an Open World Qifan Yu, Juncheng Li, Yu Wu, Siliang Tang, Wei Ji, Yueting Zhuang

PDF

VL-Match: Enhancing Vision-Language Pretraining with Token-Level and Instance-Level Matching Junyu Bi, Daixuan Cheng, Ping Yao, Bochen Pang, Yuefeng Zhan, Chuanguang Yang, Yujing Wang, Hao Sun, Weiwei Deng, Qi Zhang

PDF

VL-PET: Vision-and-Language Parameter-Efficient Tuning via Granularity Control Zi-Yuan Hu, Yanyang Li, Michael R. Lyu, Liwei Wang

PDF

VLN-PETL: Parameter-Efficient Transfer Learning for Vision-and-Language Navigation Yanyuan Qiao, Zheng Yu, Qi Wu

PDF

VLSlice: Interactive Vision-and-Language Slice Discovery Eric Slyman, Minsuk Kahng, Stefan Lee

PDF

VoroMesh: Learning Watertight Surface Meshes with Voronoi Diagrams Nissim Maruani, Roman Klokov, Maks Ovsjanikov, Pierre Alliez, Mathieu Desbrun

PDF

Vox-E: Text-Guided Voxel Editing of 3D Objects Etai Sella, Gal Fiebelman, Peter Hedman, Hadar Averbuch-Elor

PDF

VQ3D: Learning a 3D-Aware Generative Model on ImageNet Kyle Sargent, Jing Yu Koh, Han Zhang, Huiwen Chang, Charles Herrmann, Pratul Srinivasan, Jiajun Wu, Deqing Sun

PDF

VQA Therapy: Exploring Answer Differences by Visually Grounding Answers Chongyan Chen, Samreen Anjum, Danna Gurari

PDF

VQA-GNN: Reasoning with Multimodal Knowledge via Graph Neural Networks for Visual Question Answering Yanan Wang, Michihiro Yasunaga, Hongyu Ren, Shinya Wada, Jure Leskovec

PDF

Waffling Around for Performance: Visual Classification with Random Words and Broad Concepts Karsten Roth, Jae Myung Kim, A. Sophia Koepke, Oriol Vinyals, Cordelia Schmid, Zeynep Akata

PDF

WALDO: Future Video Synthesis Using Object Layer Decomposition and Parametric Flow Prediction Guillaume Le Moing, Jean Ponce, Cordelia Schmid

PDF

Walking Your LiDOG: A Journey Through Multiple Domains for LiDAR Semantic Segmentation Cristiano Saltori, Aljosa Osep, Elisa Ricci, Laura Leal-Taixé

PDF

Wasserstein Expansible Variational Autoencoder for Discriminative and Generative Continual Learning Fei Ye, Adrian G. Bors

PDF

WaterMask: Instance Segmentation for Underwater Imagery Shijie Lian, Hua Li, Runmin Cong, Suqi Li, Wei Zhang, Sam Kwong

PDF

WaveIPT: Joint Attention and Flow Alignment in the Wavelet Domain for Pose Transfer Liyuan Ma, Tingwei Gao, Haitian Jiang, Haibin Shen, Kejie Huang

PDF

WaveNeRF: Wavelet-Based Generalizable Neural Radiance Fields Muyu Xu, Fangneng Zhan, Jiahui Zhang, Yingchen Yu, Xiaoqin Zhang, Christian Theobalt, Ling Shao, Shijian Lu

PDF

WDiscOOD: Out-of-Distribution Detection via Whitened Linear Discriminant Analysis Yiye Chen, Yunzhi Lin, Ruinian Xu, Patricio A. Vela

PDF

Weakly Supervised Learning of Semantic Correspondence Through Cascaded Online Correspondence Refinement Yiwen Huang, Yixuan Sun, Chenghang Lai, Qing Xu, Xiaomei Wang, Xuli Shen, Weifeng Ge

PDF

Weakly Supervised Referring Image Segmentation with Intra-Chunk and Inter-Chunk Consistency Jungbeom Lee, Sungjin Lee, Jinseok Nam, Seunghak Yu, Jaeyoung Do, Tara Taghavi

PDF

Weakly-Supervised 3D Pose Transfer with Keypoints Jinnan Chen, Chen Li, Gim Hee Lee

PDF

Weakly-Supervised Action Localization by Hierarchically-Structured Latent Attention Modeling Guiqin Wang, Peng Zhao, Cong Zhao, Shusen Yang, Jie Cheng, Luziwei Leng, Jianxing Liao, Qinghai Guo

PDF

Weakly-Supervised Action Segmentation and Unseen Error Detection in Anomalous Instructional Videos Reza Ghoddoosian, Isht Dwivedi, Nakul Agarwal, Behzad Dariush

PDF

Weakly-Supervised Text-Driven Contrastive Learning for Facial Behavior Understanding Xiang Zhang, Taoyue Wang, Xiaotian Li, Huiyuan Yang, Lijun Yin

PDF

What Can a Cook in Italy Teach a Mechanic in India? Action Recognition Generalisation over Scenarios and Locations Chiara Plizzari, Toby Perrett, Barbara Caputo, Dima Damen

PDF

What Can Discriminator Do? Towards Box-Free Ownership Verification of Generative Adversarial Networks Ziheng Huang, Boheng Li, Yan Cai, Run Wang, Shangwei Guo, Liming Fang, Jing Chen, Lina Wang

PDF

What Can Simple Arithmetic Operations Do for Temporal Modeling? Wenhao Wu, Yuxin Song, Zhun Sun, Jingdong Wang, Chang Xu, Wanli Ouyang

PDF

What Do Neural Networks Learn in Image Classification? a Frequency Shortcut Perspective Shunxin Wang, Raymond Veldhuis, Christoph Brune, Nicola Strisciuglio

PDF

What Does a Platypus Look like? Generating Customized Prompts for Zero-Shot Image Classification Sarah Pratt, Ian Covert, Rosanne Liu, Ali Farhadi

PDF

What Does CLIP Know About a Red Circle? Visual Prompt Engineering for VLMs Aleksandar Shtedritski, Christian Rupprecht, Andrea Vedaldi

PDF

When Do Curricula Work in Federated Learning? Saeed Vahidian, Sreevatsank Kadaveru, Woonjoon Baek, Weijia Wang, Vyacheslav Kungurtsev, Chen Chen, Mubarak Shah, Bill Lin

PDF

When Epipolar Constraint Meets Non-Local Operators in Multi-View Stereo Tianqi Liu, Xinyi Ye, Weiyue Zhao, Zhiyu Pan, Min Shi, Zhiguo Cao

PDF

When Noisy Labels Meet Long Tail Dilemmas: A Representation Calibration Method Manyi Zhang, Xuyang Zhao, Jun Yao, Chun Yuan, Weiran Huang

PDF

When Prompt-Based Incremental Learning Does Not Meet Strong Pretraining Yu-Ming Tang, Yi-Xing Peng, Wei-Shi Zheng

PDF

When to Learn What: Model-Adaptive Data Augmentation Curriculum Chengkai Hou, Jieyu Zhang, Tianyi Zhou

PDF

Who Are You Referring to? Coreference Resolution in Image Narrations Arushi Goel, Basura Fernando, Frank Keller, Hakan Bilen

PDF

Why Do Networks Have Inhibitory/negative Connections? Qingyang Wang, Mike A. Powell, Ali Geisa, Eric Bridgeford, Carey E. Priebe, Joshua T. Vogelstein

PDF

Why Is Prompt Tuning for Vision-Language Models Robust to Noisy Labels? Cheng-En Wu, Yu Tian, Haichao Yu, Heng Wang, Pedro Morgado, Yu Hen Hu, Linjie Yang

PDF

Will Large-Scale Generative Models Corrupt Future Datasets? Ryuichiro Hataya, Han Bao, Hiromi Arai

PDF

Window-Based Early-Exit Cascades for Uncertainty Estimation: When Deep Ensembles Are More Efficient than Single Models Guoxuan Xia, Christos-Savvas Bouganis

PDF

With a Little Help from Your Own past: Prototypical Memory Networks for Image Captioning Manuele Barraco, Sara Sarto, Marcella Cornia, Lorenzo Baraldi, Rita Cucchiara

PDF

Workie-Talkie: Accelerating Federated Learning by Overlapping Computing and Communications via Contrastive Regularization Rui Chen, Qiyu Wan, Pavana Prakash, Lan Zhang, Xu Yuan, Yanmin Gong, Xin Fu, Miao Pan

PDF

X-Mesh: Towards Fast and Accurate Text-Driven 3D Stylization via Dynamic Textual Guidance Yiwei Ma, Xiaoqing Zhang, Xiaoshuai Sun, Jiayi Ji, Haowei Wang, Guannan Jiang, Weilin Zhuang, Rongrong Ji

PDF

X-VoE: Measuring eXplanatory Violation of Expectation in Physical Events Bo Dai, Linge Wang, Baoxiong Jia, Zeyu Zhang, Song-Chun Zhu, Chi Zhang, Yixin Zhu

PDF

XiNet: Efficient Neural Networks for tinyML Alberto Ancilotto, Francesco Paissan, Elisabetta Farella

PDF

XMem++: Production-Level Video Segmentation from Few Annotated Frames Maksym Bekuzarov, Ariana Bermudez, Joon-Young Lee, Hao Li

PDF

XNet: Wavelet-Based Low and High Frequency Fusion Networks for Fully- and Semi-Supervised Semantic Segmentation of Biomedical Images Yanfeng Zhou, Jiaxing Huang, Chenlong Wang, Le Song, Ge Yang

PDF

XVO: Generalized Visual Odometry via Cross-Modal Self-Training Lei Lai, Zhongkai Shangguan, Jimuyang Zhang, Eshed Ohn-Bar

PDF

Yes, We CANN: Constrained Approximate Nearest Neighbors for Local Feature-Based Visual Localization Dror Aiger, Andre Araujo, Simon Lynen

PDF

You Never Get a Second Chance to Make a Good First Impression: Seeding Active Learning for 3D Semantic Segmentation Nermin Samet, Oriane Siméoni, Gilles Puy, Georgy Ponimatkin, Renaud Marlet, Vincent Lepetit

PDF

Your Diffusion Model Is Secretly a Zero-Shot Classifier Alexander C. Li, Mihir Prabhudesai, Shivam Duggal, Ellis Brown, Deepak Pathak

PDF

Zenseact Open Dataset: A Large-Scale and Diverse Multimodal Dataset for Autonomous Driving Mina Alibeigi, William Ljungbergh, Adam Tonderski, Georg Hess, Adam Lilja, Carl Lindström, Daria Motorniuk, Junsheng Fu, Jenny Widahl, Christoffer Petersson

PDF

Zero-1-to-3: Zero-Shot One Image to 3D Object Ruoshi Liu, Rundi Wu, Basile Van Hoorick, Pavel Tokmakov, Sergey Zakharov, Carl Vondrick

PDF

Zero-Guidance Segmentation Using Zero Segment Labels Pitchaporn Rewatbowornwong, Nattanat Chatthee, Ekapol Chuangsuwanich, Supasorn Suwajanakorn

PDF

Zero-Shot Composed Image Retrieval with Textual Inversion Alberto Baldrati, Lorenzo Agnolucci, Marco Bertini, Alberto Del Bimbo

PDF

Zero-Shot Contrastive Loss for Text-Guided Diffusion Image Style Transfer Serin Yang, Hyunmin Hwang, Jong Chul Ye

PDF

Zero-Shot Point Cloud Segmentation by Semantic-Visual Aware Synthesis Yuwei Yang, Munawar Hayat, Zhao Jin, Hongyuan Zhu, Yinjie Lei

PDF

Zero-Shot Spatial Layout Conditioning for Text-to-Image Diffusion Models Guillaume Couairon, Marlène Careil, Matthieu Cord, Stéphane Lathuilière, Jakob Verbeek

PDF

Zip-NeRF: Anti-Aliased Grid-Based Neural Radiance Fields Jonathan T. Barron, Ben Mildenhall, Dor Verbin, Pratul P. Srinivasan, Peter Hedman

PDF

Zolly: Zoom Focal Length Correctly for Perspective-Distorted Human Mesh Reconstruction Wenjia Wang, Yongtao Ge, Haiyi Mei, Zhongang Cai, Qingping Sun, Yanjun Wang, Chunhua Shen, Lei Yang, Taku Komura

PDF

zPROBE: Zero Peek Robustness Checks for Federated Learning Zahra Ghodsi, Mojan Javaheripi, Nojan Sheybani, Xinqiao Zhang, Ke Huang, Farinaz Koushanfar

PDF