Shen, Xiaohui

69 publications

ICCV 2025 Beyond Next-Token: Next-X Prediction for Autoregressive Visual Generation Sucheng Ren, Qihang Yu, Ju He, Xiaohui Shen, Alan Yuille, Liang-Chieh Chen

NeurIPS 2025 COCONut-PanCap: Joint Panoptic Segmentation and Grounded Captions for Fine-Grained Understanding and Generation Xueqing Deng, Linjie Yang, Qihang Yu, Ali Athar, Chenglin Yang, Xiaojie Jin, Xiaohui Shen, Liang-Chieh Chen

ICCV 2025 D-Attn: Decomposed Attention for Large Vision-and-Language Model Chia-Wen Kuo, Sijie Zhu, Fan Chen, Xiaohui Shen, Longyin Wen

ICCV 2025 Democratizing Text-to-Image Masked Generative Models with Compact Text-Aware One-Dimensional Tokens Dongwon Kim, Ju He, Qihang Yu, Chenglin Yang, Xiaohui Shen, Suha Kwak, Liang-Chieh Chen

TMLR 2025 Enhancing Temporal Consistency in Video Editing by Reconstructing Videos with 3D Gaussian Splatting Inkyu Shin, Qihang Yu, Xiaohui Shen, In So Kweon, Kuk-Jin Yoon, Liang-Chieh Chen

ICML 2025 FlowAR: Scale-Wise Autoregressive Image Generation Meets Flow Matching Sucheng Ren, Qihang Yu, Ju He, Xiaohui Shen, Alan Yuille, Liang-Chieh Chen

ICCV 2025 Randomized Autoregressive Visual Generation Qihang Yu, Ju He, Xueqing Deng, Xiaohui Shen, Liang-Chieh Chen

TMLR 2024 A Simple Video Segmenter by Tracking Objects Along Axial Trajectories Ju He, Qihang Yu, Inkyu Shin, Xueqing Deng, Alan Yuille, Xiaohui Shen, Liang-Chieh Chen

NeurIPS 2024 Alleviating Distortion in Image Generation via Multi-Resolution Diffusion Models and Time-Dependent Layer Normalization Qihao Liu, Zhanpeng Zeng, Ju He, Qihang Yu, Xiaohui Shen, Liang-Chieh Chen

NeurIPS 2024 An Image Is Worth 32 Tokens for Reconstruction and Generation Qihang Yu, Mark Weber, Xueqing Deng, Xiaohui Shen, Daniel Cremers, Liang-Chieh Chen

CVPR 2024 COCONut: Modernizing COCO Segmentation Xueqing Deng, Qihang Yu, Peng Wang, Xiaohui Shen, Liang-Chieh Chen

CVPR 2024 MV-Adapter: Multimodal Video Transfer Learning for Video Text Retrieval Xiaojie Jin, Bowen Zhang, Weibo Gong, Kai Xu, Xueqing Deng, Peng Wang, Zhao Zhang, Xiaohui Shen, Jiashi Feng

TMLR 2024 MaskBit: Embedding-Free Image Generation via Bit Tokens Mark Weber, Lijun Yu, Qihang Yu, Xueqing Deng, Xiaohui Shen, Daniel Cremers, Liang-Chieh Chen

ECCV 2024 Towards Open-Ended Visual Recognition with Large Language Models Qihang Yu, Xiaohui Shen, Liang-Chieh Chen

CVPR 2024 ViTamin: Designing Scalable Vision Models in the Vision-Language Era Jieneng Chen, Qihang Yu, Xiaohui Shen, Alan Yuille, Liang-Chieh Chen

NeurIPS 2023 Convolutions Die Hard: Open-Vocabulary Segmentation with Single Frozen Convolutional CLIP Qihang Yu, Ju He, Xueqing Deng, Xiaohui Shen, Liang-Chieh Chen

CVPR 2023 R2Former: Unified Retrieval and Reranking Transformer for Place Recognition Sijie Zhu, Linjie Yang, Chen Chen, Mubarak Shah, Xiaohui Shen, Heng Wang

WACV 2022 Adversarial Open Domain Adaptation for Sketch-to-Photo Synthesis Xiaoyu Xiang, Ding Liu, Xiao Yang, Yiheng Zhu, Xiaohui Shen, Jan P. Allebach

CVPR 2022 SemanticStyleGAN: Learning Compositional Generative Priors for Controllable Image Synthesis and Editing Yichun Shi, Xiao Yang, Yangyue Wan, Xiaohui Shen

WACV 2022 Video Salient Object Detection via Contrastive Features and Attention Modules Yi-Wen Chen, Xiaojie Jin, Xiaohui Shen, Ming-Hsuan Yang

ICCV 2021 A Unified 3D Human Motion Synthesis Model via Conditional Variational Auto-Encoder Yujun Cai, Yiwei Wang, Yiheng Zhu, Tat-Jen Cham, Jianfei Cai, Junsong Yuan, Jun Liu, Chuanxia Zheng, Sijie Yan, Henghui Ding, Xiaohui Shen, Ding Liu, Nadia Magnenat Thalmann

WACV 2020 Best Frame Selection in a Short Video Jian Ren, Xiaohui Shen, Zhe Lin, Radomir Mech

ECCVW 2020 Human Motion Transfer from Poses in the Wild Jian Ren, Menglei Chai, Sergey Tulyakov, Chen Fang, Xiaohui Shen, Jianchao Yang

ECCV 2020 Learning Progressive Joint Propagation for Human Motion Prediction Yujun Cai, Lin Huang, Yiwei Wang, Tat-Jen Cham, Jianfei Cai, Junsong Yuan, Jun Liu, Xu Yang, Yiheng Zhu, Xiaohui Shen, Ding Liu, Jing Liu, Nadia Magnenat Thalmann

ECCV 2020 Regional Homogeneity: Towards Learning Transferable Universal Adversarial Perturbations Against Defenses Yingwei Li, Song Bai, Cihang Xie, Zhenyu Liao, Xiaohui Shen, Alan Yuille

ECCV 2020 Video Object Detection via Object-Level Temporal Aggregation Chun-Han Yao, Chen Fang, Xiaohui Shen, Yangyue Wan, Ming-Hsuan Yang

ECCV 2018 A Modulation Module for Multi-Task Learning with Applications in Image Retrieval Xiangyun Zhao, Haoxiang Li, Xiaohui Shen, Xiaodan Liang, Ying Wu

ECCV 2018 Compositing-Aware Image Search Hengshuang Zhao, Xiaohui Shen, Zhe Lin, Kalyan Sunkavalli, Brian Price, Jiaya Jia

ECCV 2018 Concept Mask: Large-Scale Segmentation from Semantic Concepts Yufei Wang, Zhe Lin, Xiaohui Shen, Jianming Zhang, Scott Cohen

ECCV 2018 Learning to Blend Photos Wei-Chih Hung, Jianming Zhang, Xiaohui Shen, Zhe Lin, Joon-Young Lee, Ming-Hsuan Yang

WACV 2018 Learning to Detect Multiple Photographic Defects Ning Yu, Xiaohui Shen, Zhe Lin, Radomír Mech, Connelly Barnes

NeurIPS 2018 Sequence-to-Segment Networks for Segment Detection Zijun Wei, Boyu Wang, Minh Hoai Nguyen, Jianming Zhang, Zhe Lin, Xiaohui Shen, Radomir Mech, Dimitris Samaras

CVPR 2017 Deep Image Harmonization Yi-Hsuan Tsai, Xiaohui Shen, Zhe Lin, Kalyan Sunkavalli, Xin Lu, Ming-Hsuan Yang

ICCV 2017 FoveaNet: Perspective-Aware Urban Scene Parsing Xin Li, Zequn Jie, Wei Wang, Changsong Liu, Jimei Yang, Xiaohui Shen, Zhe Lin, Qiang Chen, Shuicheng Yan, Jiashi Feng

CVPR 2017 Interpretable Structure-Evolving LSTM Xiaodan Liang, Liang Lin, Xiaohui Shen, Jiashi Feng, Shuicheng Yan, Eric P. Xing

CVPR 2017 Look into Person: Self-Supervised Structure-Sensitive Learning and a New Benchmark for Human Parsing Ke Gong, Xiaodan Liang, Dongyu Zhang, Xiaohui Shen, Liang Lin

ICCV 2017 Personalized Image Aesthetics Jian Ren, Xiaohui Shen, Zhe Lin, Radomir Mech, David J. Foran

NeurIPS 2017 Predicting Scene Parsing and Motion Dynamics in the Future Xiaojie Jin, Huaxin Xiao, Xiaohui Shen, Jimei Yang, Zhe Lin, Yunpeng Chen, Zequn Jie, Jiashi Feng, Shuicheng Yan

ICCV 2017 Recurrent Multimodal Interaction for Referring Image Segmentation Chenxi Liu, Zhe Lin, Xiaohui Shen, Jimei Yang, Xin Lu, Alan Yuille

ICCV 2017 Scene Parsing with Global Context Embedding Wei-Chih Hung, Yi-Hsuan Tsai, Xiaohui Shen, Zhe Lin, Kalyan Sunkavalli, Xin Lu, Ming-Hsuan Yang

CVPR 2017 Skeleton Key: Image Captioning by Skeleton-Attribute Decomposition Yufei Wang, Zhe Lin, Xiaohui Shen, Scott Cohen, Garrison W. Cottrell

ICCV 2017 Video Scene Parsing with Predictive Feature Learning Xiaojie Jin, Xin Li, Huaxin Xiao, Xiaohui Shen, Zhe Lin, Jimei Yang, Yunpeng Chen, Jian Dong, Luoqi Liu, Zequn Jie, Jiashi Feng, Shuicheng Yan

CVPR 2016 A Multi-Level Contextual Model for Person Recognition in Photo Albums Haoxiang Li, Jonathan Brandt, Zhe Lin, Xiaohui Shen, Gang Hua

CVPR 2016 Automatic Content-Aware Color and Tone Stylization Joon-Young Lee, Kalyan Sunkavalli, Zhe Lin, Xiaohui Shen, In So Kweon

CVPR 2016 Event-Specific Image Importance Yufei Wang, Zhe Lin, Xiaohui Shen, Radomir Mech, Gavin Miller, Garrison W. Cottrell

ECCV 2016 Photo Aesthetics Ranking Network with Attributes and Content Adaptation Shu Kong, Xiaohui Shen, Zhe Lin, Radomír Mech, Charless C. Fowlkes

CVPR 2016 Reversible Recursive Instance-Level Object Segmentation Xiaodan Liang, Yunchao Wei, Xiaohui Shen, Zequn Jie, Jiashi Feng, Liang Lin, Shuicheng Yan

NeurIPS 2016 SURGE: Surface Regularized Geometry Estimation from a Single Image Peng Wang, Xiaohui Shen, Bryan Russell, Scott Cohen, Brian Price, Alan L. Yuille

ECCV 2016 Semantic Object Parsing with Graph LSTM Xiaodan Liang, Xiaohui Shen, Jiashi Feng, Liang Lin, Shuicheng Yan

CVPR 2016 Semantic Object Parsing with Local-Global Long Short-Term Memory Xiaodan Liang, Xiaohui Shen, Donglai Xiang, Jiashi Feng, Liang Lin, Shuicheng Yan

CVPR 2016 Shortlist Selection with Residual-Aware Distance Estimator for K-Nearest Neighbor Search Jae-Pil Heo, Zhe Lin, Xiaohui Shen, Jonathan Brandt, Sung-eui Yoon

ECCV 2016 Top-Down Neural Attention by Excitation Backprop Jianming Zhang, Zhe Lin, Jonathan Brandt, Xiaohui Shen, Stan Sclaroff

CVPR 2016 Unconstrained Salient Object Detection via Proposal Subset Optimization Jianming Zhang, Stan Sclaroff, Zhe Lin, Xiaohui Shen, Brian Price, Radomir Mech

CVPR 2015 A Convolutional Neural Network Cascade for Face Detection Haoxiang Li, Zhe Lin, Xiaohui Shen, Jonathan Brandt, Gang Hua

ICCV 2015 Deep Multi-Patch Aggregation Network for Image Style, Aesthetics, and Quality Estimation Xin Lu, Zhe Lin, Xiaohui Shen, Radomir Mech, James Z. Wang

ICCV 2015 Human Parsing with Contextualized Convolutional Neural Network Xiaodan Liang, Chunyan Xu, Xiaohui Shen, Jianchao Yang, Si Liu, Jinhui Tang, Liang Lin, Shuicheng Yan

ICCV 2015 Joint Object and Part Segmentation Using Deep Learned Potentials Peng Wang, Xiaohui Shen, Zhe Lin, Scott Cohen, Brian Price, Alan L. Yuille

CVPR 2015 Matching-CNN Meets KNN: Quasi-Parametric Human Parsing Si Liu, Xiaodan Liang, Luoqi Liu, Xiaohui Shen, Jianchao Yang, Changsheng Xu, Liang Lin, Xiaochun Cao, Shuicheng Yan

ICCV 2015 Minimum Barrier Salient Object Detection at 80 FPS Jianming Zhang, Stan Sclaroff, Zhe Lin, Xiaohui Shen, Brian Price, Radomir Mech

CVPR 2015 Salient Object Subitizing Jianming Zhang, Shugao Ma, Mehrnoosh Sameki, Stan Sclaroff, Margrit Betke, Zhe Lin, Xiaohui Shen, Brian Price, Radomir Mech

CVPR 2015 Towards Unified Depth and Semantic Prediction from a Single Image Peng Wang, Xiaohui Shen, Zhe Lin, Scott Cohen, Brian Price, Alan L. Yuille

CVPR 2014 Efficient Boosted Exemplar-Based Face Detection Haoxiang Li, Zhe Lin, Jonathan Brandt, Xiaohui Shen, Gang Hua

CVPR 2014 Towards Unified Human Parsing and Pose Estimation Jian Dong, Qiang Chen, Xiaohui Shen, Jianchao Yang, Shuicheng Yan

CVPR 2013 Detecting and Aligning Faces by Image Retrieval Xiaohui Shen, Zhe Lin, Jonathan Brandt, Ying Wu

CVPR 2012 A Unified Approach to Salient Object Detection via Low Rank Matrix Recovery Xiaohui Shen, Ying Wu

ECCV 2012 Mobile Product Image Search by Automatic Query Object Extraction Xiaohui Shen, Zhe Lin, Jonathan Brandt, Ying Wu

CVPR 2012 Object Retrieval and Localization with Spatially-Constrained Similarity Measure and k-NN Re-Ranking Xiaohui Shen, Zhe Lin, Jonathan Brandt, Shai Avidan, Ying Wu

ECCV 2010 Closed-Loop Adaptation for Robust Tracking Jialue Fan, Xiaohui Shen, Ying Wu

CVPR 2010 Sparsity Model for Robust Optical Flow Estimation at Motion Discontinuities Xiaohui Shen, Ying Wu