Bai, Xiang

130 publications

CVPR 2025 A Unified Image-Dense Annotation Generation Model for Underwater Scenes Hongkai Lin, Dingkang Liang, Zhenghao Qi, Xiang Bai

ICCV 2025 AnimateAnyMesh: A Feed-Forward 4D Foundation Model for Text-Driven Universal Mesh Animation Zijie Wu, Chaohui Yu, Fan Wang, Xiang Bai

ICCV 2025 Describe, Adapt and Combine: Empowering CLIP Encoders for Open-Set 3D Object Retrieval Zhichuan Wang, Yang Zhou, Zhe Liu, Rui Yu, Song Bai, Yulong Wang, Xinwei He, Xiang Bai

ICCV 2025 DocThinker: Explainable Multimodal Large Language Models with Rule-Based Reinforcement Learning for Document Understanding Wenwen Yu, Zhibo Yang, Yuliang Liu, Xiang Bai

ICCV 2025 HERMES: A Unified Self-Driving World Model for Simultaneous 3D Scene Understanding and Generation Xin Zhou, Dingkang Liang, Sifan Tu, Xiwu Chen, Yikang Ding, Dingyuan Zhang, Feiyang Tan, Hengshuang Zhao, Xiang Bai

ICCV 2025 LIRA: Inferring Segmentation in Large Multi-Modal Models with Local Interleaved Region Assistance Zhang Li, Biao Yang, Qiang Liu, Shuo Zhang, Zhiyin Ma, Liang Yin, Linger Deng, Yabo Sun, Yuliang Liu, Xiang Bai

ICCV 2025 LLaVA-KD: A Framework of Distilling Multimodal Large Language Models Yuxuan Cai, Jiangning Zhang, Haoyang He, Xinwei He, Ao Tong, Zhenye Gan, Chengjie Wang, Zhucun Xue, Yong Liu, Xiang Bai

CVPR 2025 MINIMA: Modality Invariant Image Matching Jiangwei Ren, Xingyu Jiang, Zizhuo Li, Dingkang Liang, Xin Zhou, Xiang Bai

NeurIPS 2025 MSTAR: Box-Free Multi-Query Scene Text Retrieval with Attention Recycling Liang Yin, Xudong Xie, Zhang Li, Xiang Bai, Yuliang Liu

NeurIPS 2025 MiCo: Multi-Image Contrast for Reinforcement Visual Reasoning Xi Chen, Mingkang Zhu, Shaoteng Liu, Xiaoyang Wu, Xiaogang Xu, Yu Liu, Xiang Bai, Hengshuang Zhao

ICLR 2025 Mini-Monkey: Alleviating the Semantic Sawtooth Effect for Lightweight MLLMs via Complementary Image Pyramid Mingxin Huang, Yuliang Liu, Dingkang Liang, Lianwen Jin, Xiang Bai

NeurIPS 2025 More than Generation: Unifying Generation and Depth Estimation via Text-to-Image Diffusion Models Hongkai Lin, Dingkang Liang, Mingyang Du, Xin Zhou, Xiang Bai

ICCV 2025 Multi-Scenario Overlapping Text Segmentation with Depth Awareness Yang Liu, Xudong Xie, Yuliang Liu, Xiang Bai

NeurIPS 2025 NAUTILUS: A Large Multimodal Model for Underwater Scene Understanding Wei Xu, Cheng Wang, Dingkang Liang, Zongchuang Zhao, Xingyu Jiang, Peng Zhang, Xiang Bai

NeurIPS 2025 OCRBench V2: An Improved Benchmark for Evaluating Large Multimodal Models on Visual Text Localization and Reasoning Ling Fu, Zhebin Kuang, Jiajun Song, Mingxin Huang, Biao Yang, Yuzhe Li, Linghao Zhu, Qidi Luo, Xinyu Wang, Hao Lu, Zhang Li, Guozhi Tang, Bin Shan, Chunhui Lin, Qi Liu, Binghong Wu, Hao Feng, Hao Liu, Can Huang, Jingqun Tang, Wei Chen, Lianwen Jin, Yuliang Liu, Xiang Bai

ICCV 2025 ORION: A Holistic End-to-End Autonomous Driving Framework by Vision-Language Instructed Action Generation Haoyu Fu, Diankun Zhang, Zongchuang Zhao, Jianfeng Cui, Dingkang Liang, Chong Zhang, Dingyuan Zhang, Hongwei Xie, Bing Wang, Xiang Bai

NeurIPS 2025 PlayerOne: Egocentric World Simulator Yuanpeng Tu, Hao Luo, Xi Chen, Xiang Bai, Fan Wang, Hengshuang Zhao

ICCV 2025 ReCamMaster: Camera-Controlled Generative Rendering from a Single Video Jianhong Bai, Menghan Xia, Xiao Fu, Xintao Wang, Lianrui Mu, Jinwen Cao, Zuozhu Liu, Haoji Hu, Xiang Bai, Pengfei Wan, Di Zhang

CVPR 2025 SemiETS: Integrating Spatial and Content Consistencies for Semi-Supervised End-to-End Text Spotting Dongliang Luo, Hanshen Zhu, Ziyang Zhang, Dingkang Liang, Xudong Xie, Yuliang Liu, Xiang Bai

ICCV 2025 Towards Comprehensive Lecture Slides Understanding: Large-Scale Dataset and Effective Method Enming Zhang, Yuzhe Li, Yuliang Liu, Yingying Zhu, Xiang Bai

ICCV 2025 Training-Free Geometric Image Editing on Diffusion Models Hanshen Zhu, Zhen Zhu, Kaile Zhang, Yiming Gong, Yuliang Liu, Xiang Bai

NeurIPS 2025 URDF-Anything: Constructing Articulated Objects with 3D Multimodal Language Model Zhe Li, Xiang Bai, Jieyu Zhang, Zhuangzhe Wu, Che Xu, Ying Li, Chengkai Hou, Shanghang Zhang

ICML 2025 VIP: Vision Instructed Pre-Training for Robotic Manipulation Zhuoling Li, Liangliang Ren, Jinrong Yang, Yong Zhao, Xiaoyang Wu, Zhenhua Xu, Xiang Bai, Hengshuang Zhao

NeurIPS 2024 A Unified Framework for 3D Scene Understanding Wei Xu, Chunsheng Shi, Sifan Tu, Xin Zhou, Dingkang Liang, Xiang Bai

CVPR 2024 Bridging the Gap Between End-to-End and Two-Step Text Spotting Mingxin Huang, Hongliang Li, Yuliang Liu, Xiang Bai, Lianwen Jin

CVPR 2024 Dynamic Adapter Meets Prompt Tuning: Parameter-Efficient Transfer Learning for Point Cloud Analysis Xin Zhou, Dingkang Liang, Wei Xu, Xingkui Zhu, Yihan Xu, Zhikang Zou, Xiang Bai

CVPR 2024 General Object Foundation Model for Images and Videos at Scale Junfeng Wu, Yi Jiang, Qihao Liu, Zehuan Yuan, Xiang Bai, Song Bai

NeurIPS 2024 LION: Linear Group RNN for 3D Object Detection in Point Clouds Zhe Liu, Jinghua Hou, Xinyu Wang, Xiaoqing Ye, Jingdong Wang, Hengshuang Zhao, Xiang Bai

ECCV 2024 Make Your ViT-Based Multi-View 3D Detectors Faster via Token Compression Dingyuan Zhang, Dingkang Liang, Zichang Tan, Xiaoqing Ye, Cheng Zhang, Jingdong Wang, Xiang Bai

NeurIPS 2024 MoE Jetpack: From Dense Checkpoints to Adaptive Mixture of Experts for Vision Tasks Xingkui Zhu, Yiran Guan, Dingkang Liang, Yuchao Chen, Yuliang Liu, Xiang Bai

CVPR 2024 Monkey: Image Resolution and Text Label Are Important Things for Large Multi-Modal Models Zhang Li, Biao Yang, Qiang Liu, Zhiyin Ma, Shuo Zhang, Jingxu Yang, Yabo Sun, Yuliang Liu, Xiang Bai

ECCV 2024 OPEN: Object-Wise Position Embedding for Multi-View 3D Object Detection Jinghua Hou, Tong Wang, Xiaoqing Ye, Zhe Liu, Shi Gong, Xiao Tan, Errui Ding, Jingdong Wang, Xiang Bai

CVPR 2024 OmniParser: A Unified Framework for Text Spotting Key Information Extraction and Table Recognition Jianqiang Wan, Sibo Song, Wenwen Yu, Yuliang Liu, Wenqing Cheng, Fei Huang, Xiang Bai, Cong Yao, Zhibo Yang

ECCV 2024 PSALM: Pixelwise Segmentation with Large Multi-Modal Model Zheng Zhang, Yeyao Ma, Enming Zhang, Xiang Bai

ECCV 2024 PartGLEE: A Foundation Model for Recognizing and Parsing Any Objects Junyi Li, Junfeng Wu, Weizhi Zhao, Song Bai, Xiang Bai

NeurIPS 2024 PointMamba: A Simple State Space Model for Point Cloud Analysis Dingkang Liang, Xin Zhou, Wei Xu, Xingkui Zhu, Zhikang Zou, Xiaoqing Ye, Xiao Tan, Xiang Bai

ECCV 2024 SC4D: Sparse-Controlled Video-to-4D Generation and Motion Transfer Zijie Wu, Chaohui Yu, Yanqin Jiang, Chenjie Cao, Fan Wang, Xiang Bai

ECCV 2024 SEED: A Simple and Effective 3D DETR in Point Clouds Zhe Liu, Jinghua Hou, Xiaoqing Ye, Tong Wang, Jingdong Wang, Xiang Bai

ECCV 2024 WAS: Dataset and Methods for Artistic Text Segmentation Xudong Xie, Yuzhe Li, Yang Liu, Zhifei Zhang, Zhaowen Wang, Wei Xiong, Xiang Bai

ECCVW 2024 Well Begun Is Half Done: The Importance of Initialization in Dataset Distillation Yiran Guan, Zhu Chen, Xingkui Zhu, Dingkang Liang, Yuliang Liu, Xiang Bai

ICCV 2023 A Simple Vision Transformer for Weakly Semi-Supervised 3D Object Detection Dingyuan Zhang, Dingkang Liang, Zhikang Zou, Jingyu Li, Xiaoqing Ye, Zhe Liu, Xiao Tan, Xiang Bai

CVPR 2023 CAPE: Camera View Position Embedding for Multi-View 3D Object Detection Kaixin Xiong, Shi Gong, Xiaoqing Ye, Xiao Tan, Ji Wan, Errui Ding, Jingdong Wang, Xiang Bai

CVPR 2023 CrowdCLIP: Unsupervised Crowd Counting via Vision-Language Model Dingkang Liang, Jiahao Xie, Zhikang Zou, Xiaoqing Ye, Wei Xu, Xiang Bai

ICCV 2023 ESTextSpotter: Towards Better Scene Text Spotting with Explicit Synergy in Transformer Mingxin Huang, Jiaxin Zhang, Dezhi Peng, Hao Lu, Can Huang, Yuliang Liu, Xiang Bai, Lianwen Jin

CVPR 2023 InstMove: Instance Motion for Object-Centric Video Segmentation Qihao Liu, Junfeng Wu, Yi Jiang, Xiang Bai, Alan L. Yuille, Song Bai

CVPR 2023 Modeling Entities as Semantic Points for Visual Information Extraction in the Wild Zhibo Yang, Rujiao Long, Pengfei Wang, Sibo Song, Humen Zhong, Wenqing Cheng, Xiang Bai, Cong Yao

NeurIPS 2023 Query-Based Temporal Fusion with Explicit Motion for 3D Object Detection Jinghua Hou, Zhe Liu, Dingkang Liang, Zhikang Zou, Xiaoqing Ye, Xiang Bai

CVPR 2023 SOOD: Towards Semi-Supervised Oriented Object Detection Wei Hua, Dingkang Liang, Jingyu Li, Xiaolong Liu, Zhikang Zou, Xiaoqing Ye, Xiang Bai

CVPR 2023 Side Adapter Network for Open-Vocabulary Semantic Segmentation Mengde Xu, Zheng Zhang, Fangyun Wei, Han Hu, Xiang Bai

AAAI 2023 StereoDistill: Pick the Cream from LiDAR for Distilling Stereo-Based 3D Object Detection Zhe Liu, Xiaoqing Ye, Xiao Tan, Errui Ding, Xiang Bai

CVPR 2023 Turning a CLIP Model into a Scene Text Detector Wenwen Yu, Yuliang Liu, Wei Hua, Deqiang Jiang, Bo Ren, Xiang Bai

ECCV 2022 A Simple Baseline for Open-Vocabulary Semantic Segmentation with Pre-Trained Vision-Language Model Mengde Xu, Zheng Zhang, Fangyun Wei, Yutong Lin, Yue Cao, Han Hu, Xiang Bai

CVPR 2022 An Empirical Study of End-to-End Temporal Action Detection Xiaolong Liu, Song Bai, Xiang Bai

ECCV 2022 An End-to-End Transformer Model for Crowd Localization Dingkang Liang, Wei Xu, Xiang Bai

ECCV 2022 CCPL: Contrastive Coherence Preserving Loss for Versatile Style Transfer Zijie Wu, Zhen Zhu, Junping Du, Xiang Bai

CVPR 2022 Few Could Be Better than All: Feature Sampling and Grouping for Scene Text Detection Jingqun Tang, Wenqing Zhang, Hongye Liu, MingKun Yang, Bo Jiang, Guanglong Hu, Xiang Bai

ECCV 2022 GitNet: Geometric Prior-Based Transformation for Birds-Eye-View Segmentation Shi Gong, Xiaoqing Ye, Xiao Tan, Jingdong Wang, Errui Ding, Yu Zhou, Xiang Bai

ECCV 2022 In Defense of Online Models for Video Instance Segmentation Junfeng Wu, Qihao Liu, Yi Jiang, Song Bai, Alan Yuille, Xiang Bai

CVPR 2022 Knowledge Mining with Scene Text for Fine-Grained Recognition Hao Wang, Junchao Liao, Tianheng Cheng, Zewen Gao, Hao Liu, Bo Ren, Xiang Bai, Wenyu Liu

ECCV 2022 Optimal Boxes: Boosting End-to-End Scene Text Recognition by Adjusting Annotated Bounding Boxes via Reinforcement Learning Jingqun Tang, Wenming Qian, Luchuan Song, Xiena Dong, Lan Li, Xiang Bai

ECCV 2022 SeqFormer: Sequential Transformer for Video Instance Segmentation Junfeng Wu, Yi Jiang, Song Bai, Wenqing Zhang, Xiang Bai

CVPR 2022 Syntax-Aware Network for Handwritten Mathematical Expression Recognition Ye Yuan, Xiao Liu, Wondimu Dikubab, Hui Liu, Zhilong Ji, Zhongqin Wu, Xiang Bai

ECCV 2022 Toward Understanding WordArt: Corner-Guided Transformer for Scene Text Recognition Xudong Xie, Ling Fu, Zhifei Zhang, Zhaowen Wang, Xiang Bai

CVPR 2022 Vision-Language Pre-Training for Boosting Scene Text Detectors Sibo Song, Jianqiang Wan, Zhibo Yang, Jun Tang, Wenqing Cheng, Xiang Bai, Cong Yao

ECCV 2022 When Counting Meets HMER: Counting-Aware Network for Handwritten Mathematical Expression Recognition Bohan Li, Ye Yuan, Dingkang Liang, Xiao Liu, Zhilong Ji, Jinfeng Bai, Wenyu Liu, Xiang Bai

NeurIPS 2021 Bootstrap Your Object Detector via Mixed Training Mengde Xu, Zheng Zhang, Fangyun Wei, Yutong Lin, Yue Cao, Stephen Lin, Han Hu, Xiang Bai

ICCV 2021 End-to-End Semi-Supervised Object Detection with Soft Teacher Mengde Xu, Zheng Zhang, Han Hu, Jianfeng Wang, Lijuan Wang, Fangyun Wei, Xiang Bai, Zicheng Liu

AAAI 2021 FaceController: Controllable Attribute Editing for Face in the Wild Zhiliang Xu, Xiyu Yu, Zhibin Hong, Zhen Zhu, Junyu Han, Jingtuo Liu, Errui Ding, Xiang Bai

CVPR 2021 Improving OCR-Based Image Captioning by Incorporating Geometrical Relationship Jing Wang, Jinhui Tang, Mingkun Yang, Xiang Bai, Jiebo Luo

ICCVW 2021 LUAI Challenge 2021 on Learning to Understand Aerial Images Gui-Song Xia, Jian Ding, Ming Qian, Nan Xue, Jiaming Han, Xiang Bai, Michael Ying Yang, Shengyang Li, Serge J. Belongie, Jiebo Luo, Mihai Datcu, Marcello Pelillo, Liangpei Zhang, Qiang Zhou, Chao-hui Yu, Kaixuan Hu, Yingjia Bu, Wenming Tan, Zhe Yang, Wei Li, Shang Liu, Jiaxuan Zhao, Tianzhi Ma, Zi-han Gao, Lingqi Wang, Yi Zuo, Licheng Jiao, Chang Meng, Hao Wang, Jiahao Wang, Yiming Hui, Zhuojun Dong, Jie Zhang, Qianyue Bao, Zixiao Zhang, Fang Liu

CVPR 2021 MOST: A Multi-Oriented Scene Text Detector with Localization Refinement Minghang He, Minghui Liao, Zhibo Yang, Humen Zhong, Jun Tang, Wenqing Cheng, Cong Yao, Yongpan Wang, Xiang Bai

CVPR 2021 Multi-Shot Temporal Event Localization: A Benchmark Xiaolong Liu, Yao Hu, Song Bai, Fei Ding, Xiang Bai, Philip H. S. Torr

CVPR 2021 Scene Text Retrieval via Joint Text Detection and Similarity Learning Hao Wang, Xiang Bai, Mingkun Yang, Shenggao Zhu, Jing Wang, Wenyu Liu

ICCVW 2021 VisDrone-CC2021: The Vision Meets Drone Crowd Counting Challenge Results Zhihao Liu, Zhijian He, Lujia Wang, Wenguan Wang, Yixuan Yuan, Dingwen Zhang, Jinglin Zhang, Pengfei Zhu, Luc Van Gool, Junwei Han, Steven C. H. Hoi, Qinghua Hu, Ming Liu, Junwen Pan, Baoqun Yin, Binyu Zhang, Chengxin Liu, Ding Ding, Dingkang Liang, Guanchen Ding, Hao Lu, Hui Lin, Jingyuan Chen, Jiong Li, Liang Liu, Lin Zhou, Min Shi, Qianqian Yang, Qing He, Sifan Peng, Wei Xu, Wenwei Han, Xiang Bai, Xiwu Chen, Yabin Wang, Yinfeng Xia, Yiran Tao, Zhenzhong Chen, Zhiguo Cao

WACV 2021 WDNet: Watermark-Decomposition Network for Visible Watermark Removal Yang Liu, Zhen Zhu, Xiang Bai

AAAI 2020 All You Need Is Boundary: Toward Arbitrary-Shaped Text Spotting Hao Wang, Pu Lu, Hui Zhang, Mingkun Yang, Xiang Bai, Yongchao Xu, Mengchao He, Yongpan Wang, Wenyu Liu

ECCV 2020 AutoSTR: Efficient Backbone Search for Scene Text Recognition Hui Zhang, Quanming Yao, Mingkun Yang, Yongchao Xu, Xiang Bai

ECCV 2020 EPNet: Enhancing Point Features with Image Semantics for 3D Object Detection Tengteng Huang, Zhe Liu, Xiwu Chen, Xiang Bai

ECCV 2020 Intra-Class Feature Variation Distillation for Semantic Segmentation Yukang Wang, Wei Zhou, Tao Jiang, Xiang Bai, Yongchao Xu

ECCV 2020 Mask TextSpotter V3: Segmentation Proposal Network for Robust Scene Text Spotting Minghui Liao, Guan Pang, Jing Huang, Tal Hassner, Xiang Bai

AAAI 2020 Real-Time Scene Text Detection with Differentiable Binarization Minghui Liao, Zhaoyi Wan, Cong Yao, Kai Chen, Xiang Bai

ECCV 2020 Scene Text Image Super-Resolution in the Wild Wenjia Wang, Enze Xie, Xuebo Liu, Wenhai Wang, Ding Liang, Chunhua Shen, Xiang Bai

AAAI 2020 TANet: Robust 3D Object Detection from Point Clouds with Triple Attention Zhe Liu, Xin Zhao, Tengteng Huang, Ruolan Hu, Yu Zhou, Xiang Bai

AAAI 2020 TextScanner: Reading Characters in Order for Robust Scene Text Recognition Zhaoyi Wan, Minghang He, Haoran Chen, Xiang Bai, Cong Yao

ECCVW 2020 VisDrone-CC2020: The Vision Meets Drone Crowd Counting Challenge Results Dawei Du, Longyin Wen, Pengfei Zhu, Heng Fan, Qinghua Hu, Haibin Ling, Mubarak Shah, Junwen Pan, Ali Al-Ali, Amr Mohamed, Bakour Imene, Bin Dong, Binyu Zhang, Bouchali Hadia Nesma, Chenfeng Xu, Chenzhen Duan, Ciro Castiello, Corrado Mencar, Dingkang Liang, Florian Krüger, Gennaro Vessio, Giovanna Castellano, Jieru Wang, Junyu Gao, Khalid Abualsaud, Laihui Ding, Lei Zhao, Marco Cianciotta, Muhammad Saqib, Noor Almaadeed, Omar Elharrouss, Pei Lyu, Qi Wang, Shidong Liu, Shuang Qiu, Siyang Pan, Somaya Al-Máadeed, Sultan Daud Khan, Tamer Khattab, Tao Han, Thomas Golda, Wei Xu, Xiang Bai, Xiaoqing Xu, Xuelong Li, Yanyun Zhao, Ye Tian, Yingnan Lin, Yongchao Xu, Yuehan Yao, Zhenyu Xu, Zhijian Zhao, Zhipeng Luo, Zhiwei Wei, Zhiyuan Zhao

AAAI 2019 Human-like Delicate Region Erasing Strategy for Weakly Supervised Detection Qing En, Lijuan Duan, Zhaoxiang Zhang, Xiang Bai, Yundong Zhang

AAAI 2019 Scene Text Recognition from Two-Dimensional Perspective Minghui Liao, Jian Zhang, Zhaoyi Wan, Fengming Xie, Jiajun Liang, Pengyuan Lyu, Cong Yao, Xiang Bai

ICCVW 2019 The Seventh Visual Object Tracking VOT2019 Challenge Results Matej Kristan, Amanda Berg, Linyu Zheng, Litu Rout, Luc Van Gool, Luca Bertinetto, Martin Danelljan, Matteo Dunnhofer, Meng Ni, Min Young Kim, Ming Tang, Ming-Hsuan Yang, Abdelrahman Eldesokey, Naveen Paluru, Niki Martinel, Pengfei Xu, Pengfei Zhang, Pengkun Zheng, Pengyu Zhang, Philip H. S. Torr, Qi Zhang, Qiang Wang, Qing Guo, Radu Timofte, Jani Käpylä, Rama Krishna Sai Subrahmanyam Gorthi, Richard M. Everson, Ruize Han, Ruohan Zhang, Shan You, Shao-Chuan Zhao, Shengwei Zhao, Shihu Li, Shikun Li, Shiming Ge, Gustavo Fernández, Shuai Bai, Shuosen Guan, Tengfei Xing, Tianyang Xu, Tianyu Yang, Ting Zhang, Tomás Vojír, Wei Feng, Weiming Hu, Weizhao Wang, Abel Gonzalez-Garcia, Wenjie Tang, Wenjun Zeng, Wenyu Liu, Xi Chen, Xi Qiu, Xiang Bai, Xiao-Jun Wu, Xiaoyun Yang, Xier Chen, Xin Li, Alireza Memarmoghadam, Xing Sun, Xingyu Chen, Xinmei Tian, Xu Tang, Xuefeng Zhu, Yan Huang, Yanan Chen, Yanchao Lian, Yang Gu, Yang Liu, Andong Lu, Yanjie Chen, Yi Zhang, Yinda Xu, Yingming Wang, Yingping Li, Yu Zhou, Yuan Dong, Yufei Xu, Yunhua Zhang, Yunkun Li, Anfeng He, Zeyu Wang, Zhao Luo, Zhaoliang Zhang, Zhenhua Feng, Zhenyu He, Zhichao Song, Zhihao Chen, Zhipeng Zhang, Zhirong Wu, Zhiwei Xiong, Zhongjian Huang, Anton Varfolomieiev, Zhu Teng, Zihan Ni, Antoni B. Chan, Jirí Matas, Ardhendu Shekhar Tripathi, Arnold W. M. Smeulders, Bala Suraj Pedasingu, Bao Xin Chen, Baopeng Zhang, Baoyuan Wu, Bi Li, Bin He, Bin Yan, Bing Bai, Ales Leonardis, Bing Li, Bo Li, Byeong Hak Kim, Chao Ma, Chen Fang, Chen Qian, Cheng Chen, Chenglong Li, Chengquan Zhang, Chi-Yi Tsai, Michael Felsberg, Chong Luo, Christian Micheloni, Chunhui Zhang, Dacheng Tao, Deepak Gupta, Dejia Song, Dong Wang, Efstratios Gavves, Eunu Yi, Fahad Shahbaz Khan, Roman P. Pflugfelder, Fangyi Zhang, Fei Wang, Fei Zhao, George De Ath, Goutam Bhat, Guangqi Chen, Guangting Wang, Guoxuan Li, Hakan Cevikalp, Hao Du, Joni-Kristian Kämäräinen, Haojie Zhao, Hasan Saribas, Ho Min Jung, Hongliang Bai, Hongyuan Yu, Houwen Peng, Huchuan Lu, Hui Li, Jiakun Li, Luka Cehovin Zajc, Jianhua Li, Jianlong Fu, Jie Chen, Jie Gao, Jie Zhao, Jin Tang, Jing Li, Jingjing Wu, Jingtuo Liu, Jinqiao Wang, Ondrej Drbohlav, Jinqing Qi, Jinyue Zhang, John K. Tsotsos, Jong Hyuk Lee, Joost van de Weijer, Josef Kittler, Jun Ha Lee, Junfei Zhuang, Kangkai Zhang, Kangkang Wang, Alan Lukezic, Kenan Dai, Lei Chen, Lei Liu, Leida Guo, Li Zhang, Liang Wang, Liangliang Wang, Lichao Zhang, Lijun Wang, Lijun Zhou

CVPRW 2019 iSAID: A Large-Scale Dataset for Instance Segmentation in Aerial Images Syed Waqas Zamir, Aditya Arora, Akshita Gupta, Salman H. Khan, Guolei Sun, Fahad Shahbaz Khan, Fan Zhu, Ling Shao, Gui-Song Xia, Xiang Bai

ECCV 2018 Adaptively Transforming Graph Matching Fudong Wang, Nan Xue, Yipeng Zhang, Xiang Bai, Gui-Song Xia

IJCAI 2018 Cascaded SR-GAN for Scale-Adaptive Low Resolution Person Re-Identification Zheng Wang, Mang Ye, Fan Yang, Xiang Bai, Shin'ichi Satoh

ECCV 2018 Hard-Aware Point-to-Set Deep Metric for Person Re-Identification Rui Yu, Zhiyong Dou, Song Bai, Zhaoxiang Zhang, Yongchao Xu, Xiang Bai

ECCV 2018 Mask TextSpotter: An End-to-End Trainable Neural Network for Spotting Text with Arbitrary Shapes Pengyuan Lyu, Minghui Liao, Cong Yao, Wenhao Wu, Xiang Bai

CVPR 2017 Detecting Oriented Text in Natural Images by Linking Segments Baoguang Shi, Xiang Bai, Serge Belongie

IJCAI 2017 Dynamic Multi-Task Learning with Convolutional Neural Network Yuchun Fang, Zhengyan Ma, Zhaoxiang Zhang, Xu-Yao Zhang, Xiang Bai

ICCV 2017 Ensemble Diffusion for Retrieval Song Bai, Zhichao Zhou, Jingdong Wang, Xiang Bai, Longin Jan Latecki, Qi Tian

ICCVW 2017 Fusing Image and Segmentation Cues for Skeleton Extraction in the Wild Xiaolong Liu, Pengyuan Lyu, Xiang Bai, Ming-Ming Cheng

AAAI 2017 Multidimensional Scaling on Multiple Input Distance Matrices Song Bai, Xiang Bai, Longin Jan Latecki, Qi Tian

CVPR 2017 Multiple Instance Detection Network with Online Instance Classifier Refinement Peng Tang, Xinggang Wang, Xiang Bai, Wenyu Liu

AAAI 2017 Regularized Diffusion Process for Visual Retrieval Song Bai, Xiang Bai, Qi Tian, Longin Jan Latecki

CVPR 2017 Richer Convolutional Features for Edge Detection Yun Liu, Ming-Ming Cheng, Xiaowei Hu, Kai Wang, Xiang Bai

CVPR 2017 Scalable Person Re-Identification on Supervised Smoothed Manifold Song Bai, Xiang Bai, Qi Tian

AAAI 2017 TextBoxes: A Fast Text Detector with a Single Deep Neural Network Minghui Liao, Baoguang Shi, Xiang Bai, Xinggang Wang, Wenyu Liu

CVPR 2016 GIFT: A Real-Time and Scalable 3D Shape Search Engine Song Bai, Xiang Bai, Zhichao Zhou, Zhaoxiang Zhang, Longin Jan Latecki

CVPR 2016 Multi-Oriented Text Detection with Fully Convolutional Networks Zheng Zhang, Chengquan Zhang, Wei Shen, Cong Yao, Wenyu Liu, Xiang Bai

CVPR 2016 Object Skeleton Extraction in Natural Images by Fusing Scale-Associated Deep Side Outputs Wei Shen, Kai Zhao, Yuan Jiang, Yan Wang, Zhijiang Zhang, Xiang Bai

CVPR 2016 Robust Scene Text Recognition with Automatic Rectification Baoguang Shi, Xinggang Wang, Pengyuan Lyu, Cong Yao, Xiang Bai

ECCV 2016 Smooth Neighborhood Structure Mining on Multiple Affinity Graphs with Applications to Context-Sensitive Similarity Song Bai, Shaoyan Sun, Xiang Bai, Zhaoxiang Zhang, Qi Tian

CVPR 2015 DeepContour: A Deep Convolutional Feature Learned by Positive-Sharing Loss for Contour Detection Wei Shen, Xinggang Wang, Yan Wang, Xiang Bai, Zhijiang Zhang

ICCV 2015 Relaxed Multiple-Instance SVM with Application to Object Discovery Xinggang Wang, Zhuotun Zhu, Cong Yao, Xiang Bai

CVPR 2015 Symmetry-Based Text Line Detection in Natural Scenes Zheng Zhang, Wei Shen, Cong Yao, Xiang Bai

ECCV 2014 Human Detection Using Learned Part Alphabet and Pose Dictionary Cong Yao, Xiang Bai, Wenyu Liu, Longin Jan Latecki

WACV 2014 Scale-Space SIFT Flow Weichao Qiu, Xinggang Wang, Xiang Bai, Alan L. Yuille, Zhuowen Tu

CVPR 2014 Strokelets: A Learned Multi-Scale Representation for Scene Text Recognition Cong Yao, Xiang Bai, Baoguang Shi, Wenyu Liu

ICML 2013 Max-Margin Multiple-Instance Dictionary Learning Xinggang Wang, Baoyuan Wang, Xiang Bai, Wenyu Liu, Zhuowen Tu

CVPR 2012 Detecting Texts of Arbitrary Orientations in Natural Images Cong Yao, Xiang Bai, Wenyu Liu, Yi Ma, Zhuowen Tu

CVPR 2012 Exemplar-Based Human Action Pose Correction and Tagging Wei Shen, Ke Deng, Xiang Bai, Tommer Leyvand, Baining Guo, Zhuowen Tu

CVPR 2012 Fan Shape Model for Object Detection Xinggang Wang, Xiang Bai, Tianyang Ma, Wenyu Liu, Longin Jan Latecki

NeurIPS 2012 Fusion with Diffusion for Robust Visual Tracking Yu Zhou, Xiang Bai, Wenyu Liu, Longin J. Latecki

CVPR 2011 Feature Context for Image Classification and Object Detection Xinggang Wang, Xiang Bai, Wenyu Liu, Longin Jan Latecki

NeurIPS 2011 Maximal Cliques That Satisfy Hard Constraints with Application to Deformable Object Model Learning Xinggang Wang, Xiang Bai, Xingwei Yang, Wenyu Liu, Longin J. Latecki

ECCV 2010 Co-Transduction for Shape Retrieval Xiang Bai, Bo Wang, Xinggang Wang, Wenyu Liu, Zhuowen Tu

ECCV 2010 Object Recognition Using Junctions Bo Wang, Xiang Bai, Xinggang Wang, Wenyu Liu, Zhuowen Tu

ICCV 2009 Active Skeleton for Non-Rigid Object Detection Xiang Bai, Xinggang Wang, Longin Jan Latecki, Wenyu Liu, Zhuowen Tu

ICCVW 2009 Integrating Contour and Skeleton for Shape Classification Xiang Bai, Wenyu Liu, Zhuowen Tu

CVPR 2009 Shape Band: A Deformable Object Detection Approach Xiang Bai, Quannan Li, Longin Jan Latecki, Wenyu Liu, Zhuowen Tu

ECCV 2008 Improving Shape Retrieval by Learning Graph Transduction Xingwei Yang, Xiang Bai, Longin Jan Latecki, Zhuowen Tu

NeurIPS 2008 Multiscale Random Fields with Application to Contour Grouping Longin J. Latecki, Chengen Lu, Marc Sobel, Xiang Bai

ICCV 2007 Contour Grouping Based on Local Symmetry Nagesh Adluru, Longin Jan Latecki, Rolf Lakämper, Thomas Young, Xiang Bai, Ari D. Gross

CVPR 2007 Visual Curvature Hairong Liu, Longin Jan Latecki, Wenyu Liu, Xiang Bai