Qiao, Yu

298 publications

CVPR 2025 All-Day Multi-Camera Multi-Target Tracking Huijie Fan, Yu Qiao, Yihao Zhen, Tinghui Zhao, Baojie Fan, Qiang Wang

IJCAI 2025 An Empirical Study of Federated Prompt Learning for Vision Language Model Zhihao Wang, Wenke Huang, Tian Chen, Zekun Shi, Guancheng Wan, Yu Qiao, Bin Yang, Jian Wang, Bing Li, Mang Ye

ICLR 2025 An Intelligent Agentic System for Complex Image Restoration Problems Kaiwen Zhu, Jinjin Gu, Zhiyuan You, Yu Qiao, Chao Dong

NeurIPS 2025 ArchCAD-400k: A Large-Scale CAD Drawings Dataset and New Baseline for Panoptic Symbol Spotting Ruifeng Luo, Zhengjie Liu, Tianxiao Cheng, Jie Wang, Tongjie Wang, Fei Cheng, Fu Chai, Yanpeng Li, Xingguang Wei, Haomin Wang, Shenglong Ye, Wenhai Wang, Yanting Zhang, Yu Qiao, Hongjie Zhang, Xianzhong Zhao

ICLR 2025 Bootstrapping Language-Guided Navigation Learning with Self-Refining Data Flywheel Zun Wang, Jialu Li, Yicong Hong, Songze Li, Kunchang Li, Shoubin Yu, Yi Wang, Yu Qiao, Yali Wang, Mohit Bansal, Limin Wang

ICCV 2025 DiffVSR: Revealing an Effective Recipe for Taming Robust Video Super-Resolution Against Complex Degradations Xiaohui Li, Yihao Liu, Shuo Cao, Ziyan Chen, Shaobin Zhuang, Xiangyu Chen, Yinan He, Yi Wang, Yu Qiao

ICCV 2025 Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy Zhi Hou, Tianyi Zhang, Yuwen Xiong, Haonan Duan, Hengjun Pu, Ronglei Tong, Chengyang Zhao, Xizhou Zhu, Yu Qiao, Jifeng Dai, Yuntao Chen

ICCV 2025 DriveArena: A Closed-Loop Generative Simulation Platform for Autonomous Driving Xuemeng Yang, Licheng Wen, Tiantian Wei, Yukai Ma, Jianbiao Mei, Xin Li, Wenjie Lei, Daocheng Fu, Pinlong Cai, Min Dou, Liang He, Yong Liu, Botian Shi, Yu Qiao

ICCV 2025 Dual-Expert Consistency Model for Efficient and High-Quality Video Generation Zhengyao Lv, Chenyang Si, Tianlin Pan, Zhaoxi Chen, Kwan-Yee K. Wong, Yu Qiao, Ziwei Liu

ICLR 2025 DynamicCity: Large-Scale 4D Occupancy Generation from Dynamic Scenes Hengwei Bian, Lingdong Kong, Haozhe Xie, Liang Pan, Yu Qiao, Ziwei Liu

NeurIPS 2025 EgoThinker: Unveiling Egocentric Reasoning with Spatio-Temporal CoT Baoqi Pei, Yifei Huang, Jilan Xu, Yuping He, Guo Chen, Fei Wu, Jiangmiao Pang, Yu Qiao

ICLR 2025 FasterCache: Training-Free Video Diffusion Model Acceleration with High Quality Zhengyao Lv, Chenyang Si, Junhao Song, Zhenyu Yang, Yu Qiao, Ziwei Liu, Kwan-Yee K. Wong

AAAI 2025 GigaGS: 3D Gaussian Based Planar Representation for Large-Scene Surface Reconstruction Junyi Chen, Weicai Ye, Yifan Wang, Danpeng Chen, Di Huang, Wanli Ouyang, Guofeng Zhang, Yu Qiao, Tong He

AAAI 2025 H-MBA: Hierarchical MamBa Adaptation for Multi-Modal Video Understanding in Autonomous Driving Siran Chen, Yuxiao Luo, Yue Ma, Yu Qiao, Yali Wang

CVPR 2025 HoVLE: Unleashing the Power of Monolithic Vision-Language Models with Holistic Vision-Language Embedding Chenxin Tao, Shiqian Su, Xizhou Zhu, Chenyu Zhang, Zhe Chen, Jiawen Liu, Wenhai Wang, Lewei Lu, Gao Huang, Yu Qiao, Jifeng Dai

TMLR 2025 LASP: Linear Attention Sequence Parallelism Weigao Sun, Zhen Qin, Dong Li, Xuyang Shen, Yu Qiao, Yiran Zhong

TMLR 2025 Latte: Latent Diffusion Transformer for Video Generation Xin Ma, Yaohui Wang, Xinyuan Chen, Gengyun Jia, Ziwei Liu, Yuan-Fang Li, Cunjian Chen, Yu Qiao

ICLR 2025 Learning Causal Alignment for Reliable Disease Diagnosis Mingzhou Liu, Ching-Wen Lee, Xinwei Sun, Xueqing Yu, Yu Qiao, Yizhou Wang

ICCV 2025 Lumina-Image 2.0: A Unified and Efficient Image Generative Framework Qi Qin, Le Zhuo, Yi Xin, Ruoyi Du, Zhen Li, Bin Fu, Yiting Lu, Xinyue Li, Dongyang Liu, Xiangyang Zhu, Will Beddow, Erwann Millon, Victor Perez, Wenhai Wang, Yu Qiao, Bo Zhang, Xiaohong Liu, Hongsheng Li, Chang Xu, Peng Gao

ICLR 2025 Lumina-T2X: Scalable Flow-Based Large Diffusion Transformer for Flexible Resolution Generation Peng Gao, Le Zhuo, Dongyang Liu, Ruoyi Du, Xu Luo, Longtian Qiu, Yuhang Zhang, Rongjie Huang, Shijie Geng, Renrui Zhang, Junlin Xie, Wenqi Shao, Zhengkai Jiang, Tianshuo Yang, Weicai Ye, Tong He, Jingwen He, Junjun He, Yu Qiao, Hongsheng Li

ICLR 2025 MMIU: Multimodal Multi-Image Understanding for Evaluating Large Vision-Language Models Fanqing Meng, Jin Wang, Chuanhao Li, Quanfeng Lu, Hao Tian, Tianshuo Yang, Jiaqi Liao, Xizhou Zhu, Jifeng Dai, Yu Qiao, Ping Luo, Kaipeng Zhang, Wenqi Shao

ICLR 2025 Maintaining Structural Integrity in Parameter Spaces for Parameter Efficient Fine-Tuning Chongjie Si, Xuehui Wang, Xue Yang, Zhengqin Xu, Qingyun Li, Jifeng Dai, Yu Qiao, Xiaokang Yang, Wei Shen

ICLR 2025 Modeling Fine-Grained Hand-Object Dynamics for Egocentric Video Representation Learning Baoqi Pei, Yifei Huang, Jilan Xu, Guo Chen, Yuping He, Lijin Yang, Yali Wang, Weidi Xie, Yu Qiao, Fei Wu, Limin Wang

CVPR 2025 Mono-InternVL: Pushing the Boundaries of Monolithic Multimodal Large Language Models with Endogenous Visual Pre-Training Gen Luo, Xue Yang, Wenhan Dou, Zhaokai Wang, Jiawen Liu, Jifeng Dai, Yu Qiao, Xizhou Zhu

AAAI 2025 Muses: 3D-Controllable Image Generation via Multi-Modal Agent Collaboration Yanbo Ding, Shaobin Zhuang, Kunchang Li, Zhengrong Yue, Yu Qiao, Yali Wang

ICLR 2025 OS-ATLAS: Foundation Action Model for Generalist GUI Agents Zhiyong Wu, Zhenyu Wu, Fangzhi Xu, Yian Wang, Qiushi Sun, Chengyou Jia, Kanzhi Cheng, Zichen Ding, Liheng Chen, Paul Pu Liang, Yu Qiao

ICLR 2025 OmniCorpus: A Unified Multimodal Corpus of 10 Billion-Level Images Interleaved with Text Qingyun Li, Zhe Chen, Weiyun Wang, Wenhai Wang, Shenglong Ye, Zhenjiang Jin, Guanzhou Chen, Yinan He, Zhangwei Gao, Erfei Cui, Jiashuo Yu, Hao Tian, Jiasheng Zhou, Chao Xu, Bin Wang, Xingjian Wei, Wei Li, Wenjian Zhang, Bo Zhang, Pinlong Cai, Licheng Wen, Xiangchao Yan, Pei Chu, Yi Wang, Min Dou, Changyao Tian, Xizhou Zhu, Lewei Lu, Yushi Chen, Junjun He, Tong Lu, Yali Wang, Limin Wang, Dahua Lin, Yu Qiao, Botian Shi, Conghui He, Jifeng Dai

CVPR 2025 OpenING: A Comprehensive Benchmark for Judging Open-Ended Interleaved Image-Text Generation Pengfei Zhou, Xiaopeng Peng, Jiajun Song, Chuanhao Li, Zhaopan Xu, Yue Yang, Ziyao Guo, Hao Zhang, Yuqi Lin, Yefei He, Lirui Zhao, Shuo Liu, Tianhua Li, Yuxuan Xie, Xiaojun Chang, Yu Qiao, Wenqi Shao, Kaipeng Zhang

NeurIPS 2025 Point or Line? Using Line-Based Representation for Panoptic Symbol Spotting in CAD Drawings Xingguang Wei, Haomin Wang, Shenglong Ye, Ruifeng Luo, Yanting Zhang, Lixin Gu, Jifeng Dai, Yu Qiao, Wenhai Wang, Hongjie Zhang

ICLR 2025 REEF: Representation Encoding Fingerprints for Large Language Models Jie Zhang, Dongrui Liu, Chen Qian, Linfeng Zhang, Yong Liu, Yu Qiao, Jing Shao

CVPR 2025 SPA-VL: A Comprehensive Safety Preference Alignment Dataset for Vision Language Models Yongting Zhang, Lu Chen, Guodong Zheng, Yifeng Gao, Rui Zheng, Jinlan Fu, Zhenfei Yin, Senjie Jin, Yu Qiao, Xuanjing Huang, Feng Zhao, Tao Gui, Jing Shao

NeurIPS 2025 ShotBench: Expert-Level Cinematic Understanding in Vision-Language Models Hongbo Liu, Jingwen He, Yi Jinn, Dian Zheng, Yuhao Dong, Fan Zhang, Ziqi Huang, Yinan He, Weichao Chen, Yu Qiao, Wanli Ouyang, Shengjie Zhao, Ziwei Liu

CVPR 2025 SlideChat: A Large Vision-Language Assistant for Whole-Slide Pathology Image Understanding Ying Chen, Guoan Wang, Yuanfeng Ji, Yanjun Li, Jin Ye, Tianbin Li, Ming Hu, Rongshan Yu, Yu Qiao, Junjun He

CVPR 2025 Task Preference Optimization: Improving Multimodal Large Language Models with Vision Task Alignment Ziang Yan, Zhilin Li, Yinan He, Chenting Wang, Kunchang Li, Xinhao Li, Xiangyu Zeng, Zilei Wang, Yali Wang, Yu Qiao, Limin Wang, Yi Wang

CVPR 2025 The Devil Is in the Prompts: Retrieval-Augmented Prompt Optimization for Text-to-Video Generation Bingjie Gao, Xinyu Gao, Xiaoxue Wu, Yujie Zhou, Yu Qiao, Li Niu, Xinyuan Chen, Yaohui Wang

ICLR 2025 TimeSuite: Improving MLLMs for Long Video Understanding via Grounded Tuning Xiangyu Zeng, Kunchang Li, Chenting Wang, Xinhao Li, Tianxiang Jiang, Ziang Yan, Songze Li, Yansong Shi, Zhengrong Yue, Yi Wang, Yali Wang, Yu Qiao, Limin Wang

ICCV 2025 Towards Explicit Exoskeleton for the Reconstruction of Complicated 3D Human Avatars Yifan Zhan, Qingtian Zhu, Muyao Niu, Mingze Ma, Jiancheng Zhao, Zhihang Zhong, Xiao Sun, Yu Qiao, Yinqiang Zheng

ICCV 2025 VRBench: A Benchmark for Multi-Step Reasoning in Long Narrative Videos Jiashuo Yu, Yue Wu, Meng Chu, Zhifei Ren, Zizheng Huang, Pei Chu, Ruijie Zhang, Yinan He, Qirui Li, Songze Li, Zhenxiang Li, Zhongying Tu, Conghui He, Yu Qiao, Yali Wang, Yi Wang, Limin Wang

NeurIPS 2025 VideoChat-R1.5: Visual Test-Time Scaling to Reinforce Multimodal Reasoning by Iterative Perception Ziang Yan, Yinan He, Xinhao Li, Zhengrong Yue, Xiangyu Zeng, Yali Wang, Yu Qiao, Limin Wang, Yi Wang

ICLR 2025 Vision-RWKV: Efficient and Scalable Visual Perception with RWKV-like Architectures Yuchen Duan, Weiyun Wang, Zhe Chen, Xizhou Zhu, Lewei Lu, Tong Lu, Yu Qiao, Hongsheng Li, Jifeng Dai, Wenhai Wang

NeurIPS 2024 4Diffusion: Multi-View Video Diffusion Model for 4D Generation Haiyu Zhang, Xinyuan Chen, Yaohui Wang, Xihui Liu, Yunhong Wang, Yu Qiao

ECCV 2024 A Comparative Study of Image Restoration Networks for General Backbone Network Design Xiangyu Chen, Zheyuan Li, Yuandong Pu, Yihao Liu, Jiantao Zhou, Yu Qiao, Chao Dong

AAAI 2024 Aleth-NeRF: Illumination Adaptive NeRF with Concealing Field Assumption Ziteng Cui, Lin Gu, Xiao Sun, Xianzheng Ma, Yu Qiao, Tatsuya Harada

ICLR 2024 AnimateDiff: Animate Your Personalized Text-to-Image Diffusion Models Without Specific Tuning Yuwei Guo, Ceyuan Yang, Anyi Rao, Zhengyang Liang, Yaohui Wang, Yu Qiao, Maneesh Agrawala, Dahua Lin, Bo Dai

NeurIPS 2024 Are We on the Right Way for Evaluating Large Vision-Language Models? Lin Chen, Jinsong Li, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Zehui Chen, Haodong Duan, Jiaqi Wang, Yu Qiao, Dahua Lin, Feng Zhao

CVPR 2024 Asymmetric Masked Distillation for Pre-Training Small Foundation Models Zhiyu Zhao, Bingkun Huang, Sen Xing, Gangshan Wu, Yu Qiao, Limin Wang

CVPR 2024 Auto MC-Reward: Automated Dense Reward Design with Large Language Models for Minecraft Hao Li, Xue Yang, Zhaokai Wang, Xizhou Zhu, Jie Zhou, Yu Qiao, Xiaogang Wang, Hongsheng Li, Lewei Lu, Jifeng Dai

ICLR 2024 BESA: Pruning Large Language Models with Blockwise Parameter-Efficient Sparsity Allocation Peng Xu, Wenqi Shao, Mengzhao Chen, Shitao Tang, Kaipeng Zhang, Peng Gao, Fengwei An, Yu Qiao, Ping Luo

ECCV 2024 Better Regression Makes Better Test-Time Adaptive 3D Object Detection Jiakang Yuan, Bo Zhang, Kaixiong Gong, Xiangyu Yue, Botian Shi, Yu Qiao, Tao Chen

AAAI 2024 Brush Your Text: Synthesize Any Scene Text on Images via Diffusion Model Lingjun Zhang, Xinyuan Chen, Yaohui Wang, Yue Lu, Yu Qiao

ICLR 2024 CO2: Efficient Distributed Training with Full Communication-Computation Overlap Weigao Sun, Zhen Qin, Weixuan Sun, Shidi Li, Dong Li, Xuyang Shen, Yu Qiao, Yiran Zhong

ICML 2024 Causal Discovery via Conditional Independence Testing with Proxy Variables Mingzhou Liu, Xinwei Sun, Yu Qiao, Yizhou Wang

NeurIPSW 2024 Chain-of-Imagination for Reliable Instruction Following in Decision Making Enshen Zhou, Yiran Qin, Zhenfei Yin, Yuzhou Huang, Ruimao Zhang, Lu Sheng, Yu Qiao, Jing Shao

ECCV 2024 Clearer Frames, Anytime: Resolving Velocity Ambiguity in Video Frame Interpolation Zhihang Zhong, Gurunandan Krishnan, Xiao Sun, Yu Qiao, Sizhuo Ma, Jian Wang

AAAI 2024 ConditionVideo: Training-Free Condition-Guided Video Generation Bo Peng, Xinyuan Chen, Yaohui Wang, Chaochao Lu, Yu Qiao

NeurIPS 2024 Continuously Learning, Adapting, and Improving: A Dual-Process Approach to Autonomous Driving Jianbiao Mei, Yukai Ma, Xuemeng Yang, Licheng Wen, Xinyu Cai, Xin Li, Daocheng Fu, Bo Zhang, Pinlong Cai, Min Dou, Botian Shi, Liang He, Yong Liu, Yu Qiao

ECCV 2024 ControlLLM: Augment Language Models with Tools by Searching on Graphs Zhaoyang Liu, Zeqiang Lai, Zhangwei Gao, Erfei Cui, Ziheng Li, Xizhou Zhu, Lewei Lu, Qifeng Chen, Yu Qiao, Jifeng Dai, Wenhai Wang

NeurIPS 2024 ConvBench: A Multi-Turn Conversation Evaluation Benchmark with Hierarchical Ablation Capability for Large Vision-Language Models Shuo Liu, Kaining Ying, Hao Zhang, Yue Yang, Yuqi Lin, Tianle Zhang, Chuanhao Li, Yu Qiao, Ping Luo, Wenqi Shao, Kaipeng Zhang

AAAI 2024 Critic-Guided Decision Transformer for Offline Reinforcement Learning Yuanfu Wang, Chao Yang, Ying Wen, Yu Liu, Yu Qiao

CVPR 2024 DIBS: Enhancing Dense Video Captioning with Unlabeled Videos via Pseudo Boundary Enrichment and Online Refinement Hao Wu, Huabin Liu, Yu Qiao, Xiao Sun

AAAI 2024 Data Adaptive Traceback for Vision-Language Foundation Models in Image Classification Wenshuo Peng, Kaipeng Zhang, Yue Yang, Hao Zhang, Yu Qiao

CVPR 2024 Desigen: A Pipeline for Controllable Design Template Generation Haohan Weng, Danqing Huang, Yu Qiao, Zheng Hu, Chin-Yew Lin, Tong Zhang, C. L. Philip Chen

ICLR 2024 DiLu: A Knowledge-Driven Approach to Autonomous Driving with Large Language Models Licheng Wen, Daocheng Fu, Xin Li, Xinyu Cai, Tao Ma, Pinlong Cai, Min Dou, Botian Shi, Liang He, Yu Qiao

CVPR 2024 DiffAgent: Fast and Accurate Text-to-Image API Selection with Large Language Model Lirui Zhao, Yue Yang, Kaipeng Zhang, Wenqi Shao, Yuxin Zhang, Yu Qiao, Ping Luo, Rongrong Ji

ECCV 2024 DiffBIR: Toward Blind Image Restoration with Generative Diffusion Prior Xinqi Lin, Jingwen He, Ziyan Chen, Zhaoyang Lyu, Bo Dai, Fanghua Yu, Yu Qiao, Wanli Ouyang, Chao Dong

CVPR 2024 DiffInDScene: Diffusion-Based High-Quality 3D Indoor Scene Generation Xiaoliang Ju, Zhaoyang Huang, Yijin Li, Guofeng Zhang, Yu Qiao, Hongsheng Li

ECCV 2024 Distilling Knowledge from Large-Scale Image Models for Object Detection Gang Li, Wenhai Wang, Xiang Li, Ziheng Li, Jian Yang, Jifeng Dai, Yu Qiao, Shanshan Zhang

NeurIPS 2024 Does Video-Text Pretraining Help Open-Vocabulary Online Action Detection? Qingsong Zhao, Yi Wang, Jilan Xu, Yinan He, Zifan Song, Limin Wang, Yu Qiao, Cairong Zhao

CVPR 2024 Efficient Deformable ConvNets: Rethinking Dynamic and Sparse Operator for Vision Applications Yuwen Xiong, Zhiqi Li, Yuntao Chen, Feng Wang, Xizhou Zhu, Jiapeng Luo, Wenhai Wang, Tong Lu, Hongsheng Li, Yu Qiao, Lewei Lu, Jie Zhou, Jifeng Dai

CVPR 2024 EgoExoLearn: A Dataset for Bridging Asynchronous Ego- and Exo-Centric View of Procedural Activities in Real World Yifei Huang, Guo Chen, Jilan Xu, Mingfang Zhang, Lijin Yang, Baoqi Pei, Hongjie Zhang, Lu Dong, Yali Wang, Limin Wang, Yu Qiao

ECCV 2024 Embodied Understanding of Driving Scenarios Yunsong Zhou, Linyan Huang, Qingwen Bu, Jia Zeng, Tianyu Li, Hang Qiu, Hongzi Zhu, Minyi Guo, Yu Qiao, Hongyang Li

CVPR 2024 EpiDiff: Enhancing Multi-View Synthesis via Localized Epipolar-Constrained Diffusion Zehuan Huang, Hao Wen, Junting Dong, Yaohui Wang, Yangguang Li, Xinyuan Chen, Yan-Pei Cao, Ding Liang, Yu Qiao, Bo Dai, Lu Sheng

NeurIPS 2024 GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI Pengcheng Chen, Jin Ye, Guoan Wang, Yanjun Li, Zhongying Deng, Wei Li, Tianbin Li, Haodong Duan, Ziyan Huang, Yanzhou Su, Benyou Wang, Shaoting Zhang, Bin Fu, Jianfei Cai, Bohan Zhuang, Eric J Seibel, Yu Qiao, Junjun He

ECCV 2024 GRIDS: Grouped Multiple-Degradation Restoration with Image Degradation Similarity Shuo Cao, Yihao Liu, Wenlong Zhang, Yu Qiao, Chao Dong

CVPR 2024 Generalized Predictive Model for Autonomous Driving Jiazhi Yang, Shenyuan Gao, Yihang Qiu, Li Chen, Tianyu Li, Bo Dai, Kashyap Chitta, Penghao Wu, Jia Zeng, Ping Luo, Jun Zhang, Andreas Geiger, Yu Qiao, Hongyang Li

CVPR 2024 Generate like Experts: Multi-Stage Font Generation by Incorporating Font Transfer Process into Diffusion Models Bin Fu, Fanghua Yu, Anran Liu, Zixuan Wang, Jie Wen, Junjun He, Yu Qiao

WACV 2024 Hierarchical Diffusion Autoencoders and Disentangled Image Manipulation Zeyu Lu, Chengyue Wu, Xinyuan Chen, Yaohui Wang, Lei Bai, Yu Qiao, Xihui Liu

NeurIPS 2024 InternLM-XComposer2-4KHD: A Pioneering Large Vision-Language Model Handling Resolutions from 336 Pixels to 4k HD Xiaoyi Dong, Pan Zhang, Yuhang Zang, Yuhang Cao, Bin Wang, Linke Ouyang, Songyang Zhang, Haodong Duan, Wenwei Zhang, Yining Li, Hang Yan, Yang Gao, Zhe Chen, Xinyue Zhang, Wei Li, Jingwen Li, Wenhai Wang, Kai Chen, Conghui He, Xingcheng Zhang, Jifeng Dai, Yu Qiao, Dahua Lin, Jiaqi Wang

CVPR 2024 InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks Zhe Chen, Jiannan Wu, Wenhai Wang, Weijie Su, Guo Chen, Sen Xing, Muyan Zhong, Qinglong Zhang, Xizhou Zhu, Lewei Lu, Bin Li, Ping Luo, Tong Lu, Yu Qiao, Jifeng Dai

ICLR 2024 InternVid: A Large-Scale Video-Text Dataset for Multimodal Understanding and Generation Yi Wang, Yinan He, Yizhuo Li, Kunchang Li, Jiashuo Yu, Xin Ma, Xinhao Li, Guo Chen, Xinyuan Chen, Yaohui Wang, Ping Luo, Ziwei Liu, Yali Wang, Limin Wang, Yu Qiao

ECCV 2024 InternVideo2: Scaling Foundation Models for Multimodal Video Understanding Yi Wang, Kunchang Li, Xinhao Li, Jiashuo Yu, Yinan He, Guo Chen, Baoqi Pei, Rongkun Zheng, Jilan Xu, Zun Wang, Yansong Shi, Tianxiang Jiang, SongZe Li, Hongjie Zhang, Yifei Huang, Yu Qiao, Yali Wang, Limin Wang

CVPR 2024 Language-Aware Visual Semantic Distillation for Video Question Answering Bo Zou, Chao Yang, Yu Qiao, Chengbin Quan, Youjian Zhao

NeurIPS 2024 Learning 1d Causal Visual Representation with De-Focus Attention Networks Chenxin Tao, Xizhou Zhu, Shiqian Su, Lewei Lu, Changyao Tian, Xuan Luo, Gao Huang, Hongsheng Li, Yu Qiao, Jie Zhou, Jifeng Dai

NeurIPSW 2024 Linear Attention Sequence Parallelism Weigao Sun, Zhen Qin, Dong Li, Xuyang Shen, Yu Qiao, Yiran Zhong

ICLR 2024 Llama-Adapter: Efficient Fine-Tuning of Large Language Models with Zero-Initialized Attention Renrui Zhang, Jiaming Han, Chris Liu, Aojun Zhou, Pan Lu, Yu Qiao, Hongsheng Li, Peng Gao

CVPR 2024 Llama-Excitor: General Instruction Tuning via Indirect Feature Interaction Bo Zou, Chao Yang, Yu Qiao, Chengbin Quan, Youjian Zhao

NeurIPS 2024 LucidAction: A Hierarchical and Multi-Model Dataset for Comprehensive Action Quality Assessment Linfeng Dong, Wei Wang, Yu Qiao, Xiao Sun

NeurIPS 2024 Lumina-Next : Making Lumina-T2X Stronger and Faster with Next-DiT Le Zhuo, Ruoyi Du, Han Xiao, Yangguang Li, Dongyang Liu, Rongjie Huang, Wenze Liu, Xiangyang Zhu, Fu-Yun Wang, Zhanyu Ma, Xu Luo, Zehan Wang, Kaipeng Zhang, Lirui Zhao, Si Liu, Xiangyu Yue, Wanli Ouyang, Yu Qiao, Hongsheng Li, Peng Gao

AAAI 2024 M-BEV: Masked BEV Perception for Robust Autonomous Driving Siran Chen, Yue Ma, Yu Qiao, Yali Wang

NeurIPS 2024 MLLMGuard: A Multi-Dimensional Safety Evaluation Suite for Multimodal Large Language Models Tianle Gu, Zeyang Zhou, Kexin Huang, Dandan Liang, Yixu Wang, Haiquan Zhao, Yuanqi Yao, Xingge Qiao, Keqing Wang, Yujiu Yang, Yan Teng, Yu Qiao, Yingchun Wang

ECCV 2024 MM-SafetyBench: A Benchmark for Safety Evaluation of Multimodal Large Language Models Xin Liu, Yichen Zhu, Jindong Gu, Yunshi Lan, Chao Yang, Yu Qiao

NeurIPS 2024 MMDU: A Multi-Turn Multi-Image Dialog Understanding Benchmark and Instruction-Tuning Dataset for LVLMs Ziyu Liu, Tao Chu, Yuhang Zang, Xilin Wei, Xiaoyi Dong, Pan Zhang, Zijian Liang, Yuanjun Xiong, Yu Qiao, Dahua Lin, Jiaqi Wang

ICML 2024 MMT-Bench: A Comprehensive Multimodal Benchmark for Evaluating Large Vision-Language Models Towards Multitask AGI Kaining Ying, Fanqing Meng, Jin Wang, Zhiqian Li, Han Lin, Yue Yang, Hao Zhang, Wenbo Zhang, Yuqi Lin, Shuo Liu, Jiayi Lei, Quanfeng Lu, Runjian Chen, Peng Xu, Renrui Zhang, Haozhe Zhang, Peng Gao, Yali Wang, Yu Qiao, Ping Luo, Kaipeng Zhang, Wenqi Shao

CVPR 2024 MP5: A Multi-Modal Open-Ended Embodied System in Minecraft via Active Perception Yiran Qin, Enshen Zhou, Qichang Liu, Zhenfei Yin, Lu Sheng, Ruimao Zhang, Yu Qiao, Jing Shao

CVPR 2024 MVBench: A Comprehensive Multi-Modal Video Understanding Benchmark Kunchang Li, Yali Wang, Yinan He, Yizhuo Li, Yi Wang, Yi Liu, Zun Wang, Jilan Xu, Guo Chen, Ping Luo, Limin Wang, Yu Qiao

ECCV 2024 Mask as Supervision: Leveraging Unified Mask Information for Unsupervised 3D Pose Estimation Yuchen Yang, Yu Qiao, Xiao Sun

NeurIPS 2024 MetaLA: Unified Optimal Linear Approximation to SoftMax Attention mAP Yuhong Chou, Man Yao, Kexin Wang, Yuqi Pan, Ruijie Zhu, Yiran Zhong, Yu Qiao, Jibin Wu, Bo Xu, Guoqi Li

NeurIPS 2024 Needle in a Multimodal Haystack Weiyun Wang, Shuibo Zhang, Yiming Ren, Yuchen Duan, Tiantong Li, Shuo Liu, Mengkang Hu, Zhe Chen, Kaipeng Zhang, Lewei Lu, Xizhou Zhu, Ping Luo, Yu Qiao, Jifeng Dai, Wenqi Shao, Wenhai Wang

NeurIPSW 2024 OASIS: Open Agents Social Interaction Simulations on One Million Agents Ziyi Yang, Zaibin Zhang, Zirui Zheng, Yuxian Jiang, Ziyue Gan, Zhiyu Wang, Zijian Ling, Konisberg, Martz Ma, Bowen Dong, Prateek Gupta, Shuyue Hu, Zhenfei Yin, Guohao Li, Xu Jia, Lijun Wang, Bernard Ghanem, Huchuan Lu, Wanli Ouyang, Yu Qiao, Philip Torr, Jing Shao

NeurIPS 2024 OlympicArena: Benchmarking Multi-Discipline Cognitive Reasoning for Superintelligent AI Zhen Huang, Zengzhi Wang, Shijie Xia, Xuefeng Li, Haoyang Zou, Ruijie Xu, Run-Ze Fan, Lyumanshan Ye, Ethan Chern, Yixin Ye, Yikai Zhang, Yuqing Yang, Ting Wu, Binjie Wang, Shichao Sun, Yang Xiao, Yiyuan Li, Fan Zhou, Steffi Chern, Yiwei Qin, Yan Ma, Jiadi Su, Yixiu Liu, Yuxiang Zheng, Shaoting Zhang, Dahua Lin, Yu Qiao, Pengfei Liu

CVPR 2024 OmniMedVQA: A New Large-Scale Comprehensive Evaluation Benchmark for Medical LVLM Yutao Hu, Tianbin Li, Quanfeng Lu, Wenqi Shao, Junjun He, Yu Qiao, Ping Luo

ICLR 2024 OmniQuant: Omnidirectionally Calibrated Quantization for Large Language Models Wenqi Shao, Mengzhao Chen, Zhaoyang Zhang, Peng Xu, Lirui Zhao, Zhiqian Li, Kaipeng Zhang, Peng Gao, Yu Qiao, Ping Luo

ICLRW 2024 On the Road with GPT-4V(ision): Explorations of Utilizing Visual-Language Model as Autonomous Driving Agent Licheng Wen, Xuemeng Yang, Daocheng Fu, Xiaofeng Wang, Pinlong Cai, Xin Li, Tao Ma, Yingxuan Li, Linran Xu, Dengke Shang, Zheng Zhu, Shaoyan Sun, Yeqi Bai, Xinyu Cai, Min Dou, Shuanglu Hu, Botian Shi, Yu Qiao

CVPR 2024 OneLLM: One Framework to Align All Modalities with Language Jiaming Han, Kaixiong Gong, Yiyuan Zhang, Jiaqi Wang, Kaipeng Zhang, Dahua Lin, Yu Qiao, Peng Gao, Xiangyu Yue

NeurIPS 2024 Parameter-Inverted Image Pyramid Networks Xizhou Zhu, Xue Yang, Zhaokai Wang, Hao Li, Wenhan Dou, Junqi Ge, Lewei Lu, Yu Qiao, Jifeng Dai

ICLR 2024 Personalize Segment Anything Model with One Shot Renrui Zhang, Zhengkai Jiang, Ziyu Guo, Shilin Yan, Junting Pan, Hao Dong, Yu Qiao, Peng Gao, Hongsheng Li

CVPR 2024 Point Transformer V3: Simpler Faster Stronger Xiaoyang Wu, Li Jiang, Peng-Shuai Wang, Zhijian Liu, Xihui Liu, Yu Qiao, Wanli Ouyang, Tong He, Hengshuang Zhao

CVPR 2024 Point2RBox: Combine Knowledge from Synthetic Visual Patterns for End-to-End Oriented Object Detection with Single Point Supervision Yi Yu, Xue Yang, Qingyun Li, Feipeng Da, Jifeng Dai, Yu Qiao, Junchi Yan

ICML 2024 Position: Towards Implicit Prompt for Text-to-Image Models Yue Yang, Yuqi Lin, Hong Liu, Wenqi Shao, Runjian Chen, Hailong Shang, Yu Wang, Yu Qiao, Kaipeng Zhang, Ping Luo

NeurIPSW 2024 RH20T-P: A Primitive-Level Robotic Manipulation Dataset Towards Composable Generalization Agents in Real-World Scenarios Zeren Chen, Zhelun Shi, Xiaoya Lu, Lehan He, Sucheng Qian, Zhenfei Yin, Wanli Ouyang, Jing Shao, Yu Qiao, Cewu Lu, Lu Sheng

ICLR 2024 ReSimAD: Zero-Shot 3D Domain Transfer for Autonomous Driving with Source Reconstruction and Target Simulation Bo Zhang, Xinyu Cai, Jiakang Yuan, Donglin Yang, Jianfei Guo, Xiangchao Yan, Renqiu Xia, Botian Shi, Min Dou, Tao Chen, Si Liu, Junchi Yan, Yu Qiao

ECCV 2024 Real-Time Holistic Robot Pose Estimation with Unknown States Shikun Ban, Juling Fan, Xiaoxuan Ma, Wentao Zhu, Yu Qiao, Yizhou Wang

NeurIPS 2024 Reasoning Multi-Agent Behavioral Topology for Interactive Autonomous Driving Haochen Liu, Li Chen, Yu Qiao, Chen Lv, Hongyang Li

AAAI 2024 Referred by Multi-Modality: A Unified Temporal Transformer for Video Object Segmentation Shilin Yan, Renrui Zhang, Ziyu Guo, Wenchao Chen, Wei Zhang, Hongyang Li, Yu Qiao, Hao Dong, Zhongjiang He, Peng Gao

NeurIPS 2024 Rethinking Human Evaluation Protocol for Text-to-Video Models: Enhancing Reliability, Reproducibility, and Practicality Tianle Zhang, Langtian Ma, Yuchen Yan, Yuchen Zhang, Kai Wang, Yue Yang, Ziyao Guo, Wenqi Shao, Yang You, Yu Qiao, Ping Luo, Kaipeng Zhang

ICML 2024 RoboCodeX: Multimodal Code Generation for Robotic Behavior Synthesis Yao Mu, Junting Chen, Qing-Long Zhang, Shoufa Chen, Qiaojun Yu, Chongjian Ge, Runjian Chen, Zhixuan Liang, Mengkang Hu, Chaofan Tao, Peize Sun, Haibao Yu, Chao Yang, Wenqi Shao, Wenhai Wang, Jifeng Dai, Yu Qiao, Mingyu Ding, Ping Luo

ICLR 2024 SEAL: A Framework for Systematic Evaluation of Real-World Super-Resolution Wenlong Zhang, Xiaohui Li, Xiangyu Chen, Xiaoyun Zhang, Yu Qiao, Xiao-Ming Wu, Chao Dong

ICLR 2024 SEINE: Short-to-Long Video Diffusion Model for Generative Transition and Prediction Xinyuan Chen, Yaohui Wang, Lingjun Zhang, Shaobin Zhuang, Xin Ma, Jiashuo Yu, Yali Wang, Dahua Lin, Yu Qiao, Ziwei Liu

ICML 2024 SPHINX-X: Scaling Data and Parameters for a Family of Multi-Modal Large Language Models Dongyang Liu, Renrui Zhang, Longtian Qiu, Siyuan Huang, Weifeng Lin, Shitian Zhao, Shijie Geng, Ziyi Lin, Peng Jin, Kaipeng Zhang, Wenqi Shao, Chao Xu, Conghui He, Junjun He, Hao Shao, Pan Lu, Yu Qiao, Hongsheng Li, Peng Gao

ECCV 2024 SPHINX: A Mixer of Weights, Visual Embeddings and Image Scales for Multi-Modal Large Language Models Ziyi Lin, Dongyang Liu, Renrui Zhang, Peng Gao, Longtian Qiu, Han Xiao, Han Qiu, Wenqi Shao, Keqin Chen, Jiaming Han, Siyuan Huang, Yichi Zhang, Xuming He, Yu Qiao, Hongsheng Li

IJCAI 2024 Safety of Multimodal Large Language Models on Images and Text Xin Liu, Yichen Zhu, Yunshi Lan, Chao Yang, Yu Qiao

CVPR 2024 Scaling up to Excellence: Practicing Model Scaling for Photo-Realistic Image Restoration in the Wild Fanghua Yu, Jinjin Gu, Zheyuan Li, Jinfan Hu, Xiangtao Kong, Xintao Wang, Jingwen He, Yu Qiao, Chao Dong

CVPR 2024 ScoreHypo: Probabilistic Human Mesh Estimation with Hypothesis Scoring Yuan Xu, Xiaoxuan Ma, Jiajun Su, Wentao Zhu, Yu Qiao, Yizhou Wang

NeurIPS 2024 SearchLVLMs: A Plug-and-Play Framework for Augmenting Large Vision-Language Models by Searching Up-to-Date Internet Knowledge Chuanhao Li, Zhen Li, Chenchen Jing, Shuo Liu, Wenqi Shao, Yuwei Wu, Ping Luo, Yu Qiao, Kaipeng Zhang

NeurIPS 2024 ShareGPT4Video: Improving Video Understanding and Generation with Better Captions Lin Chen, Xilin Wei, Jinsong Li, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Zehui Chen, Haodong Duan, Bin Lin, Zhenyu Tang, Li Yuan, Yu Qiao, Dahua Lin, Feng Zhao, Jiaqi Wang

CVPR 2024 SinSR: Diffusion-Based Image Super-Resolution in a Single Step Yufei Wang, Wenhan Yang, Xinyuan Chen, Yaohui Wang, Lanqing Guo, Lap-Pui Chau, Ziwei Liu, Yu Qiao, Alex C. Kot, Bihan Wen

NeurIPS 2024 SyncVIS: Synchronized Video Instance Segmentation Rongkun Zheng, Lu Qi, Xi Chen, Yi Wang, Kun Wang, Yu Qiao, Hengshuang Zhao

ECCV 2024 The All-Seeing Project V2: Towards General Relation Comprehension of the Open World Weiyun Wang, Yiming Ren, Haowen Luo, Tiantong Li, Chenxiang Yan, Zhe Chen, Wenhai Wang, Qingyun Li, Lewei Lu, Xizhou Zhu, Yu Qiao, Jifeng Dai

ICLR 2024 The All-Seeing Project: Towards Panoptic Visual Recognition and Understanding of the Open World Weiyun Wang, Min Shi, Qingyun Li, Wenhai Wang, Zhenhang Huang, Linjie Xing, Zhe Chen, Hao Li, Xizhou Zhu, Zhiguo Cao, Yushi Chen, Tong Lu, Jifeng Dai, Yu Qiao

CVPRW 2024 Towards Real-World Video Face Restoration: A New Benchmark Ziyan Chen, Jingwen He, Xinqi Lin, Yu Qiao, Chao Dong

NeurIPS 2024 TransAgent: Transfer Vision-Language Foundation Models with Heterogeneous Agent Collaboration Yiwei Guo, Shaobin Zhuang, Kunchang Li, Yu Qiao, Yali Wang

ICLR 2024 Tree-Planner: Efficient Close-Loop Task Planning with Large Language Models Mengkang Hu, Yao Mu, Xinmiao Chelsey Yu, Mingyu Ding, Shiguang Wu, Wenqi Shao, Qiguang Chen, Bin Wang, Yu Qiao, Ping Luo

ICML 2024 Unifying Image Processing as Visual Prompting Question Answering Yihao Liu, Xiangyu Chen, Xianzheng Ma, Xintao Wang, Jiantao Zhou, Yu Qiao, Chao Dong

CVPR 2024 VBench: Comprehensive Benchmark Suite for Video Generative Models Ziqi Huang, Yinan He, Jiashuo Yu, Fan Zhang, Chenyang Si, Yuming Jiang, Yuanhan Zhang, Tianxing Wu, Qingyang Jin, Nattapol Chanpaisit, Yaohui Wang, Xinyuan Chen, Limin Wang, Dahua Lin, Yu Qiao, Ziwei Liu

CVPR 2024 VideoBooth: Diffusion-Based Video Generation with Image Prompts Yuming Jiang, Tianxing Wu, Shuai Yang, Chenyang Si, Dahua Lin, Yu Qiao, Chen Change Loy, Ziwei Liu

ECCV 2024 VideoMamba: State Space Model for Efficient Video Understanding Kunchang Li, Xinhao Li, Yi Wang, Yinan He, Yali Wang, Limin Wang, Yu Qiao

NeurIPS 2024 Vision Model Pre-Training on Interleaved Image-Text Data via Latent Compression Learning Chenyu Yang, Xizhou Zhu, Jinguo Zhu, Weijie Su, Junjie Wang, Xuan Dong, Wenhai Wang, Lewei Lu, Bin Li, Jie Zhou, Yu Qiao, Jifeng Dai

NeurIPS 2024 VisionLLM V2: An End-to-End Generalist Multimodal Large Language Model for Hundreds of Vision-Language Tasks Jiannan Wu, Muyan Zhong, Sen Xing, Zeqiang Lai, Zhaoyang Liu, Zhe Chen, Wenhai Wang, Xizhou Zhu, Lewei Lu, Tong Lu, Ping Luo, Yu Qiao, Jifeng Dai

CVPR 2024 Vlogger: Make Your Dream a Vlog Shaobin Zhuang, Kunchang Li, Xinyuan Chen, Yaohui Wang, Ziwei Liu, Yu Qiao, Yali Wang

NeurIPS 2024 Weak-to-Strong Search: Align Large Language Models via Searching over Small Language Models Zhanhui Zhou, Zhixuan Liu, Jie Liu, Zhichen Dong, Chao Yang, Yu Qiao

ECCV 2024 Within the Dynamic Context: Inertia-Aware 3D Human Modeling with Pose Sequence Yutong Chen, Yifan Zhan, Zhihang Zhong, Wei Wang, Xiao Sun, Yu Qiao, Yinqiang Zheng

NeurIPS 2024 ZOPP: A Framework of Zero-Shot Offboard Panoptic Perception for Autonomous Driving Tao Ma, Hongbin Zhou, Qiusheng Huang, Xuemeng Yang, Jianfei Guo, Bo Zhang, Min Dou, Yu Qiao, Botian Shi, Hongsheng Li

NeurIPS 2023 AD-PT: Autonomous Driving Pre-Training with Large-Scale Point Cloud Dataset Jiakang Yuan, Bo Zhang, Xiangchao Yan, Botian Shi, Tao Chen, Yikang Li, Yu Qiao

CVPR 2023 Activating More Pixels in Image Super-Resolution Transformer Xiangyu Chen, Xintao Wang, Jiantao Zhou, Yu Qiao, Chao Dong

CVPR 2023 BEVFormer V2: Adapting Modern Image Backbones to Bird's-Eye-View Recognition via Perspective Supervision Chenyu Yang, Yuntao Chen, Hao Tian, Chenxin Tao, Xizhou Zhu, Zhaoxiang Zhang, Gao Huang, Hongyang Li, Yu Qiao, Lewei Lu, Jie Zhou, Jifeng Dai

CVPR 2023 Bi3D: Bi-Domain Active Learning for Cross-Domain 3D Object Detection Jiakang Yuan, Bo Zhang, Xiangchao Yan, Tao Chen, Botian Shi, Yikang Li, Yu Qiao

CVPR 2023 CLIP2Scene: Towards Label-Efficient 3D Scene Understanding by CLIP Runnan Chen, Youquan Liu, Lingdong Kong, Xinge Zhu, Yuexin Ma, Yikang Li, Yuenan Hou, Yu Qiao, Wenping Wang

ICLR 2023 CO3: Cooperative Unsupervised 3D Representation Learning for Autonomous Driving Runjian Chen, Yao Mu, Runsen Xu, Wenqi Shao, Chenhan Jiang, Hang Xu, Yu Qiao, Zhenguo Li, Ping Luo

CVPR 2023 DegAE: A New Pretraining Paradigm for Low-Level Vision Yihao Liu, Jingwen He, Jinjin Gu, Xiangtao Kong, Yu Qiao, Chao Dong

ICCV 2023 DetZero: Rethinking Offboard 3D Object Detection with Long-Term Sequential Point Clouds Tao Ma, Xuemeng Yang, Hongbin Zhou, Xin Li, Botian Shi, Junjie Liu, Yuchen Yang, Zhizheng Liu, Liang He, Yu Qiao, Yikang Li, Hongsheng Li

ICCV 2023 DiffRate : Differentiable Compression Rate for Efficient Vision Transformers Mengzhao Chen, Wenqi Shao, Peng Xu, Mingbao Lin, Kaipeng Zhang, Fei Chao, Rongrong Ji, Yu Qiao, Ping Luo

CVPR 2023 Distilling Focal Knowledge from Imperfect Expert for 3D Object Detection Jia Zeng, Li Chen, Hanming Deng, Lewei Lu, Junchi Yan, Yu Qiao, Hongyang Li

CVPRW 2023 Dynamic Feature Queue for Surveillance Face Anti-Spoofing via Progressive Training Keyao Wang, Mouxiao Huang, Guosheng Zhang, Haixiao Yue, Gang Zhang, Yu Qiao

NeurIPS 2023 EmbodiedGPT: Vision-Language Pre-Training via Embodied Chain of Thought Yao Mu, Qinglong Zhang, Mengkang Hu, Wenhai Wang, Mingyu Ding, Jun Jin, Bin Wang, Jifeng Dai, Yu Qiao, Ping Luo

CVPR 2023 Fine-Grained Audible Video Description Xuyang Shen, Dong Li, Jinxing Zhou, Zhen Qin, Bowen He, Xiaodong Han, Aixuan Li, Yuchao Dai, Lingpeng Kong, Meng Wang, Yu Qiao, Yiran Zhong

NeurIPS 2023 Foundation Model Is Efficient Multimodal Multitask Model Selector Fanqing Meng, Wenqi Shao, Zhanglin Peng, Chonghe Jiang, Kaipeng Zhang, Yu Qiao, Ping Luo

ICCV 2023 HTML: Hybrid Temporal-Scale Multimodal Learning Framework for Referring Video Object Segmentation Mingfei Han, Yali Wang, Zhihui Li, Lina Yao, Xiaojun Chang, Yu Qiao

AAAI 2023 Improving Training and Inference of Face Recognition Models via Random Temperature Scaling Lei Shang, Mouxiao Huang, Wu Shi, Yuchen Liu, Yang Liu, Wang Steven, Baigui Sun, Xuansong Xie, Yu Qiao

CVPR 2023 InternImage: Exploring Large-Scale Vision Foundation Models with Deformable Convolutions Wenhai Wang, Jifeng Dai, Zhe Chen, Zhenhang Huang, Zhiqi Li, Xizhou Zhu, Xiaowei Hu, Tong Lu, Lewei Lu, Hongsheng Li, Xiaogang Wang, Yu Qiao

NeurIPS 2023 JourneyDB: A Benchmark for Generative Image Understanding Keqiang Sun, Junting Pan, Yuying Ge, Hao Li, Haodong Duan, Xiaoshi Wu, Renrui Zhang, Aojun Zhou, Zipeng Qin, Yi Wang, Jifeng Dai, Yu Qiao, Limin Wang, Hongsheng Li

CVPR 2023 Learning 3D Representations from 2D Pre-Trained Models via Image-to-Point Masked Autoencoders Renrui Zhang, Liuhui Wang, Yu Qiao, Peng Gao, Hongsheng Li

CVPR 2023 Learning Open-Vocabulary Semantic Segmentation Models from Natural Language Supervision Jilan Xu, Junlin Hou, Yuejie Zhang, Rui Feng, Yi Wang, Yu Qiao, Weidi Xie

CVPR 2023 Learning Weather-General and Weather-Specific Features for Image Restoration Under Multiple Adverse Weather Conditions Yurui Zhu, Tianyu Wang, Xueyang Fu, Xuanyu Yang, Xin Guo, Jifeng Dai, Yu Qiao, Xiaowei Hu

NeurIPS 2023 Leveraging Vision-Centric Multi-Modal Expertise for 3D Object Detection Linyan Huang, Zhiqi Li, Chonghao Sima, Wenhai Wang, Jingdong Wang, Yu Qiao, Hongyang Li

CVPR 2023 LoGoNet: Towards Accurate 3D Object Detection with Local-to-Global Cross-Modal Fusion Xin Li, Tao Ma, Yuenan Hou, Botian Shi, Yuchen Yang, Youquan Liu, Xingjiao Wu, Qin Chen, Yikang Li, Yu Qiao, Liang He

ICML 2023 Long-Term Rhythmic Video Soundtracker Jiashuo Yu, Yaohui Wang, Xinyuan Chen, Xiao Sun, Yu Qiao

ICCV 2023 MGMAE: Motion Guided Masking for Video Masked Autoencoding Bingkun Huang, Zhiyu Zhao, Guozhen Zhang, Yu Qiao, Limin Wang

CVPR 2023 MM-3DScene: 3D Scene Understanding by Customizing Masked Modeling with Informative-Preserved Reconstruction and Self-Distilled Consistency Mingye Xu, Mutian Xu, Tong He, Wanli Ouyang, Yali Wang, Xiaoguang Han, Yu Qiao

ICCV 2023 MonoDETR: Depth-Guided Transformer for Monocular 3D Object Detection Renrui Zhang, Han Qiu, Tai Wang, Ziyu Guo, Ziteng Cui, Yu Qiao, Hongsheng Li, Peng Gao

ICCV 2023 Multi-View Spectral Polarization Propagation for Video Glass Segmentation Yu Qiao, Bo Dong, Ao Jin, Yu Fu, Seung-Hwan Baek, Felix Heide, Pieter Peers, Xiaopeng Wei, Xin Yang

NeurIPS 2023 Networks Are Slacking Off: Understanding Generalization Problem in Image Deraining Jinjin Gu, Xianzheng Ma, Xiangtao Kong, Yu Qiao, Chao Dong

CVPR 2023 Neural Transformation Fields for Arbitrary-Styled Font Generation Bin Fu, Junjun He, Jianjun Wang, Yu Qiao

CVPR 2023 Planning-Oriented Autonomous Driving Yihan Hu, Jiazhi Yang, Li Chen, Keyu Li, Chonghao Sima, Xizhou Zhu, Siqi Chai, Senyao Du, Tianwei Lin, Wenhai Wang, Lewei Lu, Xiaosong Jia, Qiang Liu, Jifeng Dai, Yu Qiao, Hongyang Li

ICLR 2023 Policy Pre-Training for Autonomous Driving via Self-Supervised Geometric Modeling Penghao Wu, Li Chen, Hongyang Li, Xiaosong Jia, Junchi Yan, Yu Qiao

CVPR 2023 Prompt, Generate, Then Cache: Cascade of Foundation Models Makes Strong Few-Shot Learners Renrui Zhang, Xiangfei Hu, Bohao Li, Siyuan Huang, Hanqiu Deng, Yu Qiao, Peng Gao, Hongsheng Li

NeurIPS 2023 Real-World Image Super-Resolution as Multi-Task Learning Wenlong Zhang, Xiaohui Li, Guangyuan Shi, Xiangyu Chen, Yu Qiao, Xiaoyun Zhang, Xiao-Ming Wu, Chao Dong

CVPR 2023 ResFormer: Scaling ViTs with Multi-Resolution Training Rui Tian, Zuxuan Wu, Qi Dai, Han Hu, Yu Qiao, Yu-Gang Jiang

ICCV 2023 Rethinking Range View Representation for LiDAR Segmentation Lingdong Kong, Youquan Liu, Runnan Chen, Yuexin Ma, Xinge Zhu, Yikang Li, Yuenan Hou, Yu Qiao, Ziwei Liu

ICCVW 2023 Retrieving-to-Answer: Zero-Shot Video Question Answering with Frozen Large Language Models Junting Pan, Ziyi Lin, Yuying Ge, Xiatian Zhu, Renrui Zhang, Yi Wang, Yu Qiao, Hongsheng Li

CVPR 2023 SCPNet: Semantic Scene Completion on Point Cloud Zhaoyang Xia, Youquan Liu, Xin Li, Xinge Zhu, Yuexin Ma, Yikang Li, Yuenan Hou, Yu Qiao

ICCV 2023 Scaling Data Generation in Vision-and-Language Navigation Zun Wang, Jialu Li, Yicong Hong, Yi Wang, Qi Wu, Mohit Bansal, Stephen Gould, Hao Tan, Yu Qiao

ICCV 2023 Shrinking Class Space for Enhanced Certainty in Semi-Supervised Learning Lihe Yang, Zhen Zhao, Lei Qi, Yu Qiao, Yinghuan Shi, Hengshuang Zhao

CVPR 2023 Siamese Image Modeling for Self-Supervised Vision Representation Learning Chenxin Tao, Xizhou Zhu, Weijie Su, Gao Huang, Bin Li, Jie Zhou, Yu Qiao, Xiaogang Wang, Jifeng Dai

CVPR 2023 Stare at What You See: Masked Image Modeling Without Reconstruction Hongwei Xue, Peng Gao, Hongyang Li, Yu Qiao, Hao Sun, Houqiang Li, Jiebo Luo

NeurIPS 2023 TMT-VIS: Taxonomy-Aware Multi-Dataset Joint Training for Video Instance Segmentation Rongkun Zheng, Lu Qi, Xi Chen, Yi Wang, Kun Wang, Yu Qiao, Hengshuang Zhao

CVPR 2023 Towards All-in-One Pre-Training via Maximizing Multi-Modal Mutual Information Weijie Su, Xizhou Zhu, Chenxin Tao, Lewei Lu, Bin Li, Gao Huang, Yu Qiao, Xiaogang Wang, Jie Zhou, Jifeng Dai

CVPR 2023 Uni-Perceiver V2: A Generalist Model for Large-Scale Vision and Vision-Language Tasks Hao Li, Jinguo Zhu, Xiaohu Jiang, Xizhou Zhu, Hongsheng Li, Chun Yuan, Xiaohua Wang, Yu Qiao, Xiaogang Wang, Wenhai Wang, Jifeng Dai

CVPR 2023 Uni3D: A Unified Baseline for Multi-Dataset 3D Object Detection Bo Zhang, Jiakang Yuan, Botian Shi, Tao Chen, Yikang Li, Yu Qiao

ICCV 2023 UniFormerV2: Unlocking the Potential of Image ViTs for Video Understanding Kunchang Li, Yali Wang, Yinan He, Yizhuo Li, Yi Wang, Limin Wang, Yu Qiao

ICCV 2023 UniSeg: A Unified Multi-Modal LiDAR Segmentation Network and the OpenPCSeg Codebase Youquan Liu, Runnan Chen, Xin Li, Lingdong Kong, Yuchen Yang, Zhaoyang Xia, Yeqi Bai, Xinge Zhu, Yuexin Ma, Yikang Li, Yu Qiao, Yuenan Hou

ICCV 2023 Unmasked Teacher: Towards Training-Efficient Video Foundation Models Kunchang Li, Yali Wang, Yizhuo Li, Yi Wang, Yinan He, Limin Wang, Yu Qiao

CVPR 2023 Video Dehazing via a Multi-Range Temporal Alignment Network with Physical Prior Jiaqi Xu, Xiaowei Hu, Lei Zhu, Qi Dou, Jifeng Dai, Yu Qiao, Pheng-Ann Heng

CVPR 2023 VideoMAE V2: Scaling Video Masked Autoencoders with Dual Masking Limin Wang, Bingkun Huang, Zhiyu Zhao, Zhan Tong, Yinan He, Yi Wang, Yali Wang, Yu Qiao

ICLR 2023 Vision Transformer Adapter for Dense Predictions Zhe Chen, Yuchen Duan, Wenhai Wang, Junjun He, Tong Lu, Jifeng Dai, Yu Qiao

NeurIPS 2023 VisionLLM: Large Language Model Is Also an Open-Ended Decoder for Vision-Centric Tasks Wenhai Wang, Zhe Chen, Xiaokang Chen, Jiannan Wu, Xizhou Zhu, Gang Zeng, Ping Luo, Tong Lu, Jie Zhou, Yu Qiao, Jifeng Dai

ECCV 2022 BEVFormer: Learning Bird’s-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers Zhiqi Li, Wenhai Wang, Hongyang Li, Enze Xie, Chonghao Sima, Tong Lu, Yu Qiao, Jifeng Dai

CVPRW 2022 Blueprint Separable Residual Network for Efficient Image Super-Resolution Zheyuan Li, Yingqi Liu, Xiangyu Chen, Haoming Cai, Jinjin Gu, Yu Qiao, Chao Dong

AAAI 2022 CPRAL: Collaborative Panoptic-Regional Active Learning for Semantic Segmentation Yu Qiao, Jincheng Zhu, Chengjiang Long, Zeyao Zhang, Yuxin Wang, Zhenjun Du, Xin Yang

CVPR 2022 Cross Domain Object Detection by Target-Perceived Dual Branch Distillation Mengzhe He, Yali Wang, Jiaxi Wu, Yiru Wang, Hanqing Li, Bo Li, Weihao Gan, Wei Wu, Yu Qiao

CVPR 2022 Dual-AI: Dual-Path Actor Interaction Learning for Group Activity Recognition Mingfei Han, David Junhao Zhang, Yali Wang, Rui Yan, Lina Yao, Xiaojun Chang, Yu Qiao

ECCVW 2022 Efficient Image Super-Resolution Using Vast-Receptive-Field Attention Lin Zhou, Haoming Cai, Jinjin Gu, Zheyuan Li, Yingqi Liu, Xiangyu Chen, Yu Qiao, Chao Dong

ECCV 2022 Frozen CLIP Models Are Efficient Video Learners Ziyi Lin, Shijie Geng, Renrui Zhang, Peng Gao, Gerard de Melo, Xiaogang Wang, Jifeng Dai, Yu Qiao, Hongsheng Li

NeurIPS 2022 MCMAE: Masked Convolution Meets Masked Autoencoders Peng Gao, Teli Ma, Hongsheng Li, Ziyi Lin, Jifeng Dai, Yu Qiao

ECCV 2022 MorphMLP: An Efficient MLP-like Backbone for Spatial-Temporal Representation Learning David Junhao Zhang, Kunchang Li, Yali Wang, Yunpeng Chen, Shashwat Chandra, Yu Qiao, Luoqi Liu, Mike Zheng Shou

CVPRW 2022 NTIRE 2022 Challenge on Efficient Super-Resolution: Methods and Results Yawei Li, Kai Zhang, Radu Timofte, Luc Van Gool, Fangyuan Kong, Mingxi Li, Songwei Liu, Zongcai Du, Ding Liu, Chenhui Zhou, Jingyi Chen, Qingrui Han, Zheyuan Li, Yingqi Liu, Xiangyu Chen, Haoming Cai, Yu Qiao, Chao Dong, Long Sun, Jinshan Pan, Yi Zhu, Zhikai Zong, Xiaoxiao Liu, Zheng Hui, Tao Yang, Peiran Ren, Xuansong Xie, Xian-Sheng Hua, Yanbo Wang, Xiaozhong Ji, Chuming Lin, Donghao Luo, Ying Tai, Chengjie Wang, Zhizhong Zhang, Yuan Xie, Shen Cheng, Ziwei Luo, Lei Yu, Zhihong Wen, Qi Wu, Youwei Li, Haoqiang Fan, Jian Sun, Shuaicheng Liu, Yuanfei Huang, Meiguang Jin, Hua Huang, Jing Liu, Xinjian Zhang, Yan Wang, Lingshun Long, Gen Li, Yuanfan Zhang, Zuowei Cao, Lei Sun, Panaetov Alexander, Yucong Wang, Minjie Cai, Li Wang, Lu Tian, Zheyuan Wang, Hongbing Ma, Jie Liu, Chao Chen, Yidong Cai, Jie Tang, Gangshan Wu, Weiran Wang, Shirui Huang, Honglei Lu, Huan Liu, Keyan Wang, Jun Chen, Shi Chen, Yuchun Miao, Zimo Huang, Lefei Zhang, Mustafa Ayazoglu, Wei Xiong, Chengyi Xiong, Fei Wang, Hao Li, Ruimian Wen, Zhijing Yang, Wenbin Zou, Weixin Zheng, Tian Ye, Yuncheng Zhang, Xiangzhen Kong, Aditya Arora, Syed Waqas Zamir, Salman H. Khan, Munawar Hayat, Fahad Shahbaz Khan, Dandan Gao, Dengwen Zhou, Qian Ning, Jingzhu Tang, Han Huang, Yufei Wang, Zhangheng Peng, Haobo Li, Wenxue Guan, Shenghua Gong, Xin Li, Jun Liu, Wanjun Wang, Kun Zeng, Hanjiang Lin, Xinyu Chen, Jinsheng Fang

ECCV 2022 PalGAN: Image Colorization with Palette Generative Adversarial Networks Yi Wang, Menghan Xia, Lu Qi, Jing Shao, Yu Qiao

ECCV 2022 PersFormer: 3D Lane Detection via Perspective Transformer and the OpenLane Benchmark Li Chen, Chonghao Sima, Yang Li, Zehan Zheng, Jiajie Xu, Xiangwei Geng, Hongyang Li, Conghui He, Jianping Shi, Yu Qiao, Junchi Yan

NeurIPS 2022 Point-M2AE: Multi-Scale Masked Autoencoders for Hierarchical Point Cloud Pre-Training Renrui Zhang, Ziyu Guo, Peng Gao, Rongyao Fang, Bin Zhao, Dong Wang, Yu Qiao, Hongsheng Li

CVPR 2022 PointCLIP: Point Cloud Understanding by CLIP Renrui Zhang, Ziyu Guo, Wei Zhang, Kunchang Li, Xupeng Miao, Bin Cui, Yu Qiao, Peng Gao, Hongsheng Li

ECCV 2022 Recurrent Bilinear Optimization for Binary Neural Networks Sheng Xu, Yanjing Li, Tiancheng Wang, Teli Ma, Baochang Zhang, Peng Gao, Yu Qiao, Jinhu Lü, Guodong Guo

CVPR 2022 Reflash Dropout in Image Super-Resolution Xiangtao Kong, Xina Liu, Jinjin Gu, Yu Qiao, Chao Dong

ECCV 2022 Self-Slimmed Vision Transformer Zhuofan Zong, Kunchang Li, Guanglu Song, Yali Wang, Yu Qiao, Biao Leng, Yu Liu

ECCV 2022 Tip-Adapter: Training-Free Adaption of CLIP for Few-Shot Classification Renrui Zhang, Wei Zhang, Rongyao Fang, Peng Gao, Kunchang Li, Jifeng Dai, Yu Qiao, Hongsheng Li

CoRL 2022 Towards Capturing the Temporal Dynamics for Trajectory Prediction: A Coarse-to-Fine Approach Xiaosong Jia, Li Chen, Penghao Wu, Jia Zeng, Junchi Yan, Hongyang Li, Yu Qiao

NeurIPS 2022 Trajectory-Guided Control Prediction for End-to-End Autonomous Driving: A Simple yet Strong Baseline Penghao Wu, Xiaosong Jia, Li Chen, Junchi Yan, Hongyang Li, Yu Qiao

ICLR 2022 UniFormer: Unified Transformer for Efficient Spatial-Temporal Representation Learning Kunchang Li, Yali Wang, Gao Peng, Guanglu Song, Yu Liu, Hongsheng Li, Yu Qiao

ECCV 2022 VL-LTR: Learning Class-Wise Visual-Linguistic Representation for Long-Tailed Visual Recognition Changyao Tian, Wenhai Wang, Xizhou Zhu, Jifeng Dai, Yu Qiao

ECCV 2022 X-Learner: Learning Cross Sources and Tasks for Universal Visual Representation Yinan He, Gengshi Huang, Siyu Chen, Jianing Teng, Kun Wang, Zhenfei Yin, Lu Sheng, Ziwei Liu, Yu Qiao, Jing Shao

ICCV 2021 A New Journey from SDRTV to HDRTV Xiangyu Chen, Zhengwen Zhang, Jimmy S. Ren, Lynhoo Tian, Yu Qiao, Chao Dong

CVPR 2021 Affordance Transfer Learning for Human-Object Interaction Detection Zhi Hou, Baosheng Yu, Yu Qiao, Xiaojiang Peng, Dacheng Tao

AAAI 2021 BSN++: Complementary Boundary Regressor with Scale-Balanced Relation Modeling for Temporal Action Proposal Generation Haisheng Su, Weihao Gan, Wei Wu, Yu Qiao, Junjie Yan

ICLR 2021 CT-Net: Channel Tensorization Network for Video Classification Kunchang Li, Xianhang Li, Yali Wang, Jun Wang, Yu Qiao

CVPR 2021 ClassSR: A General Framework to Accelerate Super-Resolution Networks by Data Characteristic Xiangtao Kong, Hengyuan Zhao, Yu Qiao, Chao Dong

CVPR 2021 Detecting Human-Object Interaction via Fabricated Compositional Learning Zhi Hou, Baosheng Yu, Yu Qiao, Xiaojiang Peng, Dacheng Tao

ICCV 2021 Digging into Uncertainty in Self-Supervised Multi-View Stereo Hongbin Xu, Zhipeng Zhou, Yali Wang, Wenxiong Kang, Baigui Sun, Hao Li, Yu Qiao

ICLR 2021 Domain Generalization with MixStyle Kaiyang Zhou, Yongxin Yang, Yu Qiao, Tao Xiang

CVPRW 2021 HDRUNet: Single Image HDR Reconstruction with Denoising and Dequantization Xiangyu Chen, Yihao Liu, Zhengwen Zhang, Yu Qiao, Chao Dong

AAAI 2021 Investigate Indistinguishable Points in Semantic Segmentation of 3D Point Cloud Mingye Xu, Zhipeng Zhou, Junhao Zhang, Yu Qiao

AAAI 2021 Learning Geometry-Disentangled Representation for Complementary Understanding of 3D Object Point Cloud Mutian Xu, Junhao Zhang, Zhipeng Zhou, Mingye Xu, Xiaojuan Qi, Yu Qiao

CVPRW 2021 NTIRE 2021 Challenge on Perceptual Image Quality Assessment Jinjin Gu, Haoming Cai, Chao Dong, Jimmy S. Ren, Yu Qiao, Shuhang Gu, Radu Timofte

AAAI 2021 PC-HMR: Pose Calibration for 3D Human Mesh Recovery from 2D Images/Videos Tianyu Luan, Yali Wang, Junhao Zhang, Zhe Wang, Zhipeng Zhou, Yu Qiao

CVPR 2021 Refining Pseudo Labels with Clustering Consensus over Generations for Unsupervised Object Re-Identification Xiao Zhang, Yixiao Ge, Yu Qiao, Hongsheng Li

AAAI 2021 SSN3D: Self-Separated Network to Align Parts for 3D Convolution in Video Person Re-Identification Xiaoke Jiang, Yu Qiao, Junjie Yan, Qichen Li, Wanrong Zheng, Dapeng Chen

AAAI 2021 Self-Supervised Multi-View Stereo via Effective Co-Segmentation and Data-Augmentation Hongbin Xu, Zhipeng Zhou, Yu Qiao, Wenxiong Kang, Qiuxia Wu

CVPR 2021 Temporal Context Aggregation Network for Temporal Action Proposal Refinement Zhiwu Qing, Haisheng Su, Weihao Gan, Dongliang Wang, Wei Wu, Xiang Wang, Yu Qiao, Junjie Yan, Changxin Gao, Nong Sang

CVPRW 2021 Toward Interactive Modulation for Photo-Realistic Image Restoration Haoming Cai, Jingwen He, Yu Qiao, Chao Dong

ICCV 2021 Tripartite Information Mining and Integration for Image Matting Yuhao Liu, Jiake Xie, Xiao Shi, Yu Qiao, Yujie Huang, Yong Tang, Xin Yang

AAAI 2020 A Multi-Unit Profit Competitive Mechanism for Cellular Traffic Offloading Jun Wu, Yu Qiao, Lei Zhang, Chongjun Wang, Meilin Liu

ECCVW 2020 AIM 2020 Challenge on Efficient Super-Resolution: Methods and Results Kai Zhang, Martin Danelljan, Yawei Li, Radu Timofte, Jie Liu, Jie Tang, Gangshan Wu, Yu Zhu, Xiangyu He, Wenjie Xu, Chenghua Li, Cong Leng, Jian Cheng, Guangyang Wu, Wenyi Wang, Xiaohong Liu, Hengyuan Zhao, Xiangtao Kong, Jingwen He, Yu Qiao, Chao Dong, Xiaotong Luo, Liang Chen, Jiangtao Zhang, Maitreya Suin, Kuldeep Purohit, A. N. Rajagopalan, Xiaochuan Li, Zhiqiang Lang, Jiangtao Nie, Wei Wei, Lei Zhang, Abdul Muqeet, Jiwon Hwang, Subin Yang, Jung Heum Kang, Sung-Ho Bae, Yongwoo Kim, Yanyun Qu, Geun-Woo Jeon, Jun-Ho Choi, Jun-Hyuk Kim, Jong-Seok Lee, Steven Marty, Éric Marty, Dongliang Xiong, Siang Chen, Lin Zha, Jiande Jiang, Xinbo Gao, Wen Lu, Haicheng Wang, Vineeth Bhaskara, Alex Levinshtein, Stavros Tsogkas, Allan D. Jepson, Xiangzhen Kong, Tongtong Zhao, Shanshan Zhao, P. S Hrishikesh, Densen Puthussery, C. V. Jiji, Nan Nan, Shuai Liu, Jie Cai, Zibo Meng, Jiaming Ding, Chiu Man Ho, Xuehui Wang, Qiong Yan, Yuzhi Zhao, Long Chen, Long Sun, Wenhao Wang, Zhenbing Liu, Rushi Lan, Rao Muhammad Umer, Christian Micheloni

ECCVW 2020 AIM 2020 Challenge on Video Temporal Super-Resolution Sanghyun Son, Jaerin Lee, Seungjun Nah, Radu Timofte, Kyoung Mu Lee, Yihao Liu, Liangbin Xie, Siyao Li, Wenxiu Sun, Yu Qiao, Chao Dong, Woonsung Park, Wonyong Seo, Munchurl Kim, Wenhao Zhang, Pablo Navarrete Michelini, Kazutoshi Akita, Norimichi Ukita

ECCV 2020 Attention-Driven Dynamic Graph Convolutional Network for Multi-Label Image Recognition Jin Ye, Junjun He, Xiaojiang Peng, Wenhao Wu, Yu Qiao

ECCV 2020 Conditional Sequential Modulation for Efficient Global Image Retouching Jingwen He, Yihao Liu, Yu Qiao, Chao Dong

AAAI 2020 Context-Transformer: Tackling Object Confusion for Few-Shot Detection Ze Yang, Yali Wang, Xianyu Chen, Jianzhuang Liu, Yu Qiao

AAAI 2020 Dynamic Sampling Network for Semantic Segmentation Bin Fu, Junjun He, Zhengfu Zhang, Yu Qiao

ECCVW 2020 Efficient Image Super-Resolution Using Pixel Attention Hengyuan Zhao, Xiangtao Kong, Jingwen He, Yu Qiao, Chao Dong

ECCVW 2020 Enhanced Quadratic Video Interpolation Yihao Liu, Liangbin Xie, Siyao Li, Wenxiu Sun, Yu Qiao, Chao Dong

AAAI 2020 FD-GAN: Generative Adversarial Networks with Fusion-Discriminator for Single Image Dehazing Yu Dong, Yihao Liu, He Zhang, Shifeng Chen, Yu Qiao

AAAI 2020 Geometry Sharing Network for 3D Point Cloud Classification and Segmentation Mingye Xu, Zhipeng Zhou, Yu Qiao

ECCV 2020 Interactive Multi-Dimension Modulation with Dynamic Controllable Residual Learning for Image Restoration Jingwen He, Chao Dong, Yu Qiao

AAAI 2020 Learning Attentive Pairwise Interaction for Fine-Grained Classification Peiqin Zhuang, Yali Wang, Yu Qiao

ECCV 2020 Learning to Predict Context-Adaptive Convolution for Semantic Segmentation Jianbo Liu, Junjun He, Yu Qiao, Jimmy S. Ren, Hongsheng Li

ECCV 2020 Mining Inter-Video Proposal Relations for Video Object Detection Mingfei Han, Yali Wang, Xiaojun Chang, Yu Qiao

CVPRW 2020 Multiple Transfer Learning and Multi-Label Balanced Training Strategies for Facial AU Detection in the Wild Sijie Ji, Kai Wang, Xiaojiang Peng, Jianfei Yang, Zhaoyang Zeng, Yu Qiao

AAAI 2020 Pose-Assisted Multi-Camera Collaboration for Active Object Tracking Jing Li, Jing Xu, Fangwei Zhong, Xiangyu Kong, Yu Qiao, Yizhou Wang

ECCV 2020 RBF-SoftMax: Learning Deep Representative Prototypes with Radial Basis Function SoftMax Xiao Zhang, Rui Zhao, Yu Qiao, Hongsheng Li

ECCV 2020 Suppressing Mislabeled Data via Grouping and Self-Attention Xiaojiang Peng, Kai Wang, Zhaoyang Zeng, Qing Li, Jianfei Yang, Yu Qiao

ECCV 2020 Visual Compositional Learning for Human-Object Interaction Detection Zhi Hou, Xiaojiang Peng, Yu Qiao, Dacheng Tao

CVPRW 2019 NTIRE 2019 Challenge on Real Image Super-Resolution: Methods and Results Jianrui Cai, Shuhang Gu, Radu Timofte, Lei Zhang, Xiao Liu, Yukang Ding, Dongliang He, Chao Li, Yi Fu, Shilei Wen, Ruicheng Feng, Jinjin Gu, Yu Qiao, Chao Dong, Dongwon Park, Se Young Chun, Sanghoon Yoon, Junhyung Kwak, Donghee Son, Syed Waqas Zamir, Aditya Arora, Salman H. Khan, Fahad Shahbaz Khan, Ling Shao, Zhengping Wei, Lei Liu, Hong Cai, Darui Li, Fujie Gao, Zheng Hui, Xiumei Wang, Xinbo Gao, Guoan Cheng, Ai Matsune, Qiuyu Li, Leilei Zhu, Huaijuan Zang, Shu Zhan, Yajun Qiu, Ruxin Wang, Jiawei Li, Yongcheng Jing, Mingli Song, Pengju Liu, Kai Zhang, Jingdong Liu, Jiye Liu, Hongzhi Zhang, Wangmeng Zuo, Wenyi Tang, Jing Liu, Youngjung Kim, Changyeop Shin, Minbeom Kim, Sungho Kim, Pablo Navarrete Michelini, Hanwen Liu, Dan Zhu, Xuan Xu, Xin Li, Furui Bai, Xiaopeng Sun, Lin Zha, Yuanfei Huang, Wen Lu, Yanpeng Cao, Du Chen, Zewei He, Anshun Sun, Siliang Tang, Hongfei Fan, Xiang Li, Guo Li, Wenjie Zhang, Yumei Zhang, Qingwen He, Jinghui Qin, Lishan Huang, Yukai Shi, Pengxu Wei, Wushao Wen, Liang Lin, Jun Yu, Guochen Xie, Mengyan Li, Rong Chen, Xiaotong Luo, Chen Hong, Yanyun Qu, Cuihua Li, Zhi-Song Liu, Li-Wen Wang, Chu-Tak Li, Can Zhao, Bowen Li, Chung-Chi Tsai, Shang-Chih Chuang, Joonhee Choi, Joonsoo Kim, Xiaoyun Jiang, Ze Pan, Qunbo Lv, Zheng Tan, Peidong He

AAAI 2019 Residual Compensation Networks for Heterogeneous Face Recognition Zhongying Deng, Xiaojiang Peng, Yu Qiao

CVPRW 2019 Suppressing Model Overfitting for Image Super-Resolution Networks Ruicheng Feng, Jinjin Gu, Yu Qiao, Chao Dong

IJCAI 2018 A Multi-Task Learning Approach for Image Captioning Wei Zhao, Benyou Wang, Jianbo Ye, Min Yang, Zhou Zhao, Ruotian Luo, Yu Qiao

AAAI 2018 Deep Reinforcement Learning for Unsupervised Video Summarization with Diversity-Representativeness Reward Kaiyang Zhou, Yu Qiao, Tao Xiang

ECCVW 2018 ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks Xintao Wang, Ke Yu, Shixiang Wu, Jinjin Gu, Yihao Liu, Chao Dong, Yu Qiao, Chen Change Loy

ECCV 2018 Find and Focus: Retrieve and Localize Video Events with Natural Language Queries Dian Shao, Yu Xiong, Yue Zhao, Qingqiu Huang, Yu Qiao, Dahua Lin

AAAI 2018 LSTD: A Low-Shot Transfer Detector for Object Detection Hao Chen, Yali Wang, Guoyou Wang, Yu Qiao

ECCVW 2018 PIRM Challenge on Perceptual Image Enhancement on Smartphones: Report Andrey Ignatov, Radu Timofte, Thang Van Vu, Tung Minh Luu, Trung X. Pham, Cao Van Nguyen, Yongwoo Kim, Jae-Seok Choi, Munchurl Kim, Jie Huang, Jiewen Ran, Chen Xing, Xingguang Zhou, Pengfei Zhu, Mingrui Geng, Yawei Li, Eirikur Agustsson, Shuhang Gu, Luc Van Gool, Etienne de Stoutz, Nikolay Kobyshev, Kehui Nie, Yan Zhao, Gen Li, Tong Tong, Qinquan Gao, Hanwen Liu, Pablo Navarrete Michelini, Dan Zhu, Hu Fengshuo, Zheng Hui, Xiumei Wang, Lirui Deng, Rang Meng, Jinghui Qin, Yukai Shi, Wushao Wen, Liang Lin, Ruicheng Feng, Shixiang Wu, Chao Dong, Yu Qiao, Subeesh Vasu, Thekke Madam Nimisha, Praveen Kandula, A. N. Rajagopalan, Jie Liu, Cheolkon Jung

ECCV 2018 SpiderCNN: Deep Learning on Point Sets with Parameterized Convolutional Filters Yifan Xu, Tianqi Fan, Mingye Xu, Long Zeng, Yu Qiao

WACV 2018 Structured Triplet Learning with POS-Tag Guided Attention for Visual Question Answering Zhe Wang, Xiaoyi Liu, Limin Wang, Yu Qiao, Xiaohui Xie, Charless C. Fowlkes

ECCV 2018 Super-Identity Convolutional Neural Network for Face Hallucination Kaipeng Zhang, Zhanpeng Zhang, Chia-Wen Cheng, Winston H. Hsu, Yu Qiao, Wei Liu, Tong Zhang

IJCAI 2018 Text Genre Classification Based on Linguistic Complexity Contours Using a Recurrent Neural Network Marcus Ströbel, Elma Kerz, Daniel Wiechmann, Yu Qiao

ICCV 2017 Detecting Faces Using Inside Cascaded Contextual CNN Kaipeng Zhang, Zhanpeng Zhang, Hao Wang, Zhifeng Li, Yu Qiao, Wei Liu

CVPRW 2017 NTIRE 2017 Challenge on Single Image Super-Resolution: Methods and Results Radu Timofte, Eirikur Agustsson, Luc Van Gool, Ming-Hsuan Yang, Lei Zhang, Bee Lim, Sanghyun Son, Heewon Kim, Seungjun Nah, Kyoung Mu Lee, Xintao Wang, Yapeng Tian, Ke Yu, Yulun Zhang, Shixiang Wu, Chao Dong, Liang Lin, Yu Qiao, Chen Change Loy, Woong Bae, Jaejun Yoo, Yoseob Han, Jong Chul Ye, Jae-Seok Choi, Munchurl Kim, Yuchen Fan, Jiahui Yu, Wei Han, Ding Liu, Haichao Yu, Zhangyang Wang, Honghui Shi, Xinchao Wang, Thomas S. Huang, Yunjin Chen, Kai Zhang, Wangmeng Zuo, Zhimin Tang, Linkai Luo, Shaohui Li, Min Fu, Lei Cao, Wen Heng, Giang Bui, Truc Le, Ye Duan, Dacheng Tao, Ruxin Wang, Xu Lin, Jianxin Pang, Jinchang Xu, Yu Zhao, Xiangyu Xu, Jin-shan Pan, Deqing Sun, Yujin Zhang, Xibin Song, Yuchao Dai, Xueying Qin, Xuan-Phung Huynh, Tiantong Guo, Hojjat Seyed Mousavi, Tiep Huu Vu, Vishal Monga, Cristóvão Cruz, Karen O. Egiazarian, Vladimir Katkovnik, Rakesh Mehta, Arnav Kumar Jain, Abhinav Agarwalla, Ch V. Sai Praveen, Ruofan Zhou, Hongdiao Wen, Che Zhu, Zhiqiang Xia, Zhengtao Wang, Qi Guo

ICCV 2017 RPAN: An End-to-End Recurrent Pose-Attention Network for Action Recognition in Videos Wenbin Du, Yali Wang, Yu Qiao

ICCV 2017 Range Loss for Deep Face Recognition with Long-Tailed Training Data Xiao Zhang, Zhiyuan Fang, Yandong Wen, Zhifeng Li, Yu Qiao

ICCV 2017 Single Shot Text Detector with Regional Attention Pan He, Weilin Huang, Tong He, Qile Zhu, Yu Qiao, Xiaolin Li

AAAI 2017 Sparse Deep Transfer Learning for Convolutional Neural Network Jiaming Liu, Yali Wang, Yu Qiao

ECCV 2016 A Discriminative Feature Learning Approach for Deep Face Recognition Yandong Wen, Kaipeng Zhang, Zhifeng Li, Yu Qiao

CVPR 2016 A Key Volume Mining Deep Framework for Action Recognition Wangjiang Zhu, Jie Hu, Gang Sun, Xudong Cao, Yu Qiao

CVPR 2016 Actionness Estimation Using Hybrid Fully Convolutional Networks Limin Wang, Yu Qiao, Xiaoou Tang, Luc Van Gool

ECCV 2016 Detecting Text in Natural Image with Connectionist Text Proposal Network Zhi Tian, Weilin Huang, Tong He, Pan He, Yu Qiao

CVPRW 2016 Gender and Smile Classification Using Deep Convolutional Neural Networks Kaipeng Zhang, Lianzhi Tan, Zhifeng Li, Yu Qiao

CVPR 2016 Latent Factor Guided Convolutional Neural Networks for Age-Invariant Face Recognition Yandong Wen, Zhifeng Li, Yu Qiao

AAAI 2016 Reading Scene Text in Deep Convolutional Sequences Pan He, Weilin Huang, Yu Qiao, Chen Change Loy, Xiaoou Tang

CVPR 2016 Real-Time Action Recognition with Enhanced Motion Vector CNNs Bowen Zhang, Limin Wang, Zhe Wang, Yu Qiao, Hanli Wang

ECCV 2016 Temporal Segment Networks: Towards Good Practices for Deep Action Recognition Limin Wang, Yuanjun Xiong, Zhe Wang, Yu Qiao, Dahua Lin, Xiaoou Tang, Luc Van Gool

CVPR 2015 Action Recognition with Trajectory-Pooled Deep-Convolutional Descriptors Limin Wang, Yu Qiao, Xiaoou Tang

ICCVW 2015 Better Exploiting OS-CNNs for Better Event Recognition in Images Limin Wang, Zhe Wang, Sheng Guo, Yu Qiao

CVPRW 2015 Exploring Fisher Vector and Deep Networks for Action Spotting Zhe Wang, Limin Wang, Wenbin Du, Yu Qiao

CVPRW 2015 Object-Scene Convolutional Neural Networks for Event Recognition in Images Limin Wang, Zhe Wang, Wenbin Du, Yu Qiao

ECCV 2014 Action Recognition with Stacked Fisher Vectors Xiaojiang Peng, Changqing Zou, Yu Qiao, Qiang Peng

ECCVW 2014 Action and Gesture Temporal Spotting with Super Vector Representation Xiaojiang Peng, Limin Wang, Zhuowei Cai, Yu Qiao

ECCV 2014 Boosting VLAD with Supervised Dictionary Learning and High-Order Statistics Xiaojiang Peng, Limin Wang, Yu Qiao, Qiang Peng

CVPR 2014 Multi-View Super Vector for Action Recognition Zhuowei Cai, Limin Wang, Xiaojiang Peng, Yu Qiao

ECCV 2014 Robust Scene Text Detection with Convolution Neural Network Induced MSER Trees Weilin Huang, Yu Qiao, Xiaoou Tang

ECCV 2014 Video Action Detection with Relational Dynamic-Poselets Limin Wang, Yu Qiao, Xiaoou Tang

ICCV 2013 Mining Motion Atoms and Phrases for Complex Action Recognition Limin Wang, Yu Qiao, Xiaoou Tang

CVPR 2013 Motionlets: Mid-Level 3D Parts for Human Motion Recognition LiMin Wang, Yu Qiao, Xiaoou Tang

CVPR 2007 Offline Signature Verification Using Online Handwriting Registration Yu Qiao, Jianzhuang Liu, Xiaoou Tang