Dai, Xiyang

35 publications

ICML 2025 Exploring Invariance in Images Through One-Way Wave Equations Yinpeng Chen, Dongdong Chen, Xiyang Dai, Mengchen Liu, Yinan Feng, Youzuo Lin, Lu Yuan, Zicheng Liu

NeurIPS 2024 DeepStack: Deeply Stacking Visual Tokens Is Surprisingly Simple and Effective for LMMs Lingchen Meng, Jianwei Yang, Rui Tian, Xiyang Dai, Zuxuan Wu, Jianfeng Gao, Yu-Gang Jiang

ICLR 2024 Efficient Modulation for Vision Networks Xu Ma, Xiyang Dai, Jianwei Yang, Bin Xiao, Yinpeng Chen, Yun Fu, Lu Yuan

CVPR 2024 Florence-2: Advancing a Unified Representation for a Variety of Vision Tasks Bin Xiao, Haiping Wu, Weijian Xu, Xiyang Dai, Houdong Hu, Yumao Lu, Michael Zeng, Ce Liu, Lu Yuan

NeurIPSW 2024 LLM2CLIP: Powerful Language Model Unlock Richer Visual Representation Aoqi Wu, Weiquan Huang, Yifan Yang, Xufang Luo, Yuqing Yang, Chunyu Wang, Liang Hu, Xiyang Dai, Dongdong Chen, Chong Luo, Lili Qiu

CVPR 2024 Rewrite the Stars Xu Ma, Xiyang Dai, Yue Bai, Yizhou Wang, Yun Fu

CVPR 2023 Detection Hub: Unifying Object Detection Datasets via Query Adaptation on Language Embedding Lingchen Meng, Xiyang Dai, Yinpeng Chen, Pengchuan Zhang, Dongdong Chen, Mengchen Liu, Jianfeng Wang, Zuxuan Wu, Lu Yuan, Yu-Gang Jiang

CVPR 2023 Generalized Decoding for Pixel, Image, and Language Xueyan Zou, Zi-Yi Dou, Jianwei Yang, Zhe Gan, Linjie Li, Chunyuan Li, Xiyang Dai, Harkirat Behl, Jianfeng Wang, Lu Yuan, Nanyun Peng, Lijuan Wang, Yong Jae Lee, Jianfeng Gao

ICLR 2023 Layer Grafted Pre-Training: Bridging Contrastive Learning and Masked Image Modeling for Label-Efficient Representations Ziyu Jiang, Yinpeng Chen, Mengchen Liu, Dongdong Chen, Xiyang Dai, Lu Yuan, Zicheng Liu, Zhangyang Wang

NeurIPS 2023 Learning from Rich Semantics and Coarse Locations for Long-Tailed Object Detection Lingchen Meng, Xiyang Dai, Jianwei Yang, Dongdong Chen, Yinpeng Chen, Mengchen Liu, Yi-Ling Chen, Zuxuan Wu, Lu Yuan, Yu-Gang Jiang

CVPR 2023 Look Before You Match: Instance Understanding Matters in Video Object Segmentation Junke Wang, Dongdong Chen, Zuxuan Wu, Chong Luo, Chuanxin Tang, Xiyang Dai, Yucheng Zhao, Yujia Xie, Lu Yuan, Yu-Gang Jiang

CVPR 2023 Masked Video Distillation: Rethinking Masked Feature Modeling for Self-Supervised Video Representation Learning Rui Wang, Dongdong Chen, Zuxuan Wu, Yinpeng Chen, Xiyang Dai, Mengchen Liu, Lu Yuan, Yu-Gang Jiang

CVPR 2022 BEVT: BERT Pretraining of Video Transformers Rui Wang, Dongdong Chen, Zuxuan Wu, Yinpeng Chen, Xiyang Dai, Mengchen Liu, Yu-Gang Jiang, Luowei Zhou, Lu Yuan

ICLR 2022 Efficient Self-Supervised Vision Transformers for Representation Learning Chunyuan Li, Jianwei Yang, Pengchuan Zhang, Mei Gao, Bin Xiao, Xiyang Dai, Lu Yuan, Jianfeng Gao

NeurIPS 2022 Focal Modulation Networks Jianwei Yang, Chunyuan Li, Xiyang Dai, Jianfeng Gao

NeurIPS 2022 GLIPv2: Unifying Localization and Vision-Language Understanding Haotian Zhang, Pengchuan Zhang, Xiaowei Hu, Yen-Chun Chen, Liunian Li, Xiyang Dai, Lijuan Wang, Lu Yuan, Jenq-Neng Hwang, Jianfeng Gao

CVPR 2022 Mobile-Former: Bridging MobileNet and Transformer Yinpeng Chen, Xiyang Dai, Dongdong Chen, Mengchen Liu, Xiaoyi Dong, Lu Yuan, Zicheng Liu

CVPR 2022 Reduce Information Loss in Transformers for Pluralistic Image Inpainting Qiankun Liu, Zhentao Tan, Dongdong Chen, Qi Chu, Xiyang Dai, Yinpeng Chen, Mengchen Liu, Lu Yuan, Nenghai Yu

CVPR 2022 RegionCLIP: Region-Based Language-Image Pretraining Yiwu Zhong, Jianwei Yang, Pengchuan Zhang, Chunyuan Li, Noel Codella, Liunian Harold Li, Luowei Zhou, Xiyang Dai, Lu Yuan, Yin Li, Jianfeng Gao

ECCV 2022 Should All Proposals Be Treated Equally in Object Detection? Yunsheng Li, Yinpeng Chen, Xiyang Dai, Dongdong Chen, Mengchen Liu, Pei Yu, Ying Jin, Lu Yuan, Zicheng Liu, Nuno Vasconcelos

NeurIPS 2022 Visual Clues: Bridging Vision and Language Foundations for Image Paragraph Captioning Yujia Xie, Luowei Zhou, Xiyang Dai, Lu Yuan, Nguyen Bach, Ce Liu, Michael Zeng

ICCV 2021 CvT: Introducing Convolutions to Vision Transformers Haiping Wu, Bin Xiao, Noel Codella, Mengchen Liu, Xiyang Dai, Lu Yuan, Lei Zhang

ICCV 2021 Dynamic DETR: End-to-End Object Detection with Dynamic Attention Xiyang Dai, Yinpeng Chen, Jianwei Yang, Pengchuan Zhang, Lu Yuan, Lei Zhang

CVPR 2021 Dynamic Head: Unifying Object Detection Heads with Attentions Xiyang Dai, Yinpeng Chen, Bin Xiao, Dongdong Chen, Mengchen Liu, Lu Yuan, Lei Zhang

NeurIPS 2021 Focal Attention for Long-Range Interactions in Vision Transformers Jianwei Yang, Chunyuan Li, Pengchuan Zhang, Xiyang Dai, Bin Xiao, Lu Yuan, Jianfeng Gao

ICCV 2021 MicroNet: Improving Image Recognition with Extremely Low FLOPs Yunsheng Li, Yinpeng Chen, Xiyang Dai, Dongdong Chen, Mengchen Liu, Lu Yuan, Zicheng Liu, Lei Zhang, Nuno Vasconcelos

ICCV 2021 Multi-Scale Vision Longformer: A New Vision Transformer for High-Resolution Image Encoding Pengchuan Zhang, Xiyang Dai, Jianwei Yang, Bin Xiao, Lu Yuan, Lei Zhang, Jianfeng Gao

ICLR 2021 Revisiting Dynamic Convolution via Matrix Decomposition Yunsheng Li, Yinpeng Chen, Xiyang Dai, Mengchen Liu, Dongdong Chen, Ye Yu, Lu Yuan, Zicheng Liu, Mei Chen, Nuno Vasconcelos

NeurIPS 2021 Stronger NAS with Weaker Predictors Junru Wu, Xiyang Dai, Dongdong Chen, Yinpeng Chen, Mengchen Liu, Ye Yu, Zhangyang Wang, Zicheng Liu, Mei Chen, Lu Yuan

ECCV 2020 DA-NAS: Data Adapted Pruning for Efficient Neural Architecture Search Xiyang Dai, Dongdong Chen, Mengchen Liu, Yinpeng Chen, Lu Yuan

ECCV 2020 Dynamic ReLU Yinpeng Chen, Xiyang Dai, Mengchen Liu, Dongdong Chen, Lu Yuan, Zicheng Liu

WACV 2019 TAN: Temporal Aggregation Network for Dense Multi-Label Action Recognition Xiyang Dai, Bharat Singh, Joe Yue-Hei Ng, Larry S. Davis

ICCVW 2017 Efficient Fine-Grained Classification and Part Localization Using One Compact Network Xiyang Dai, Ben Southall, Nhon Trinh, Bogdan Matei

CVPR 2017 FASON: First and Second Order Information Fusion Network for Texture Recognition Xiyang Dai, Joe Yue-Hei Ng, Larry S. Davis

ICCV 2017 Temporal Context Network for Activity Localization in Videos Xiyang Dai, Bharat Singh, Guyue Zhang, Larry S. Davis, Yan Qiu Chen