Yuan, Zehuan

47 publications

CVPR 2025 Goku: Flow Based Video Generative Foundation Models Shoufa Chen, Chongjian Ge, Yuqi Zhang, Yida Zhang, Fengda Zhu, Hao Yang, Hongxiang Hao, Hui Wu, Zhichao Lai, Yifei Hu, Ting-Che Lin, Shilong Zhang, Fu Li, Chuan Li, Xing Wang, Yanghua Peng, Peize Sun, Ping Luo, Yi Jiang, Zehuan Yuan, Bingyue Peng, Xiaobing Liu

CVPR 2025 Infinity: Scaling Bitwise AutoRegressive Modeling for High-Resolution Image Synthesis Jian Han, Jinlai Liu, Yi Jiang, Bin Yan, Yuqi Zhang, Zehuan Yuan, Bingyue Peng, Xiaobing Liu

NeurIPS 2025 InfinityStar: Uniﬁed Spacetime AutoRegressive Modeling for Visual Generation Jinlai Liu, Jian Han, Bin Yan, Wuhui, Fengda Zhu, Xing Wang, Yi Jiang, Bingyue Peng, Zehuan Yuan

CVPR 2025 TokenFlow: Unified Image Tokenizer for Multimodal Understanding and Generation Liao Qu, Huichao Zhang, Yiheng Liu, Xu Wang, Yi Jiang, Yiming Gao, Hu Ye, Daniel K. Du, Zehuan Yuan, Xinglong Wu

NeurIPS 2025 UniTok: A Unified Tokenizer for Visual Generation and Understanding Chuofan Ma, Yi Jiang, Junfeng Wu, Jihan Yang, Xin Yu, Zehuan Yuan, Bingyue Peng, Xiaojuan Qi

AAAI 2024 EVE: Efficient Vision-Language Pre-Training with Masked Prediction and Modality-Aware MoE Junyi Chen, Longteng Guo, Jia Sun, Shuai Shao, Zehuan Yuan, Liang Lin, Dongyu Zhang

CVPR 2024 General Object Foundation Model for Images and Videos at Scale Junfeng Wu, Yi Jiang, Qihao Liu, Zehuan Yuan, Xiang Bai, Song Bai

CVPR 2024 Generative Region-Language Pretraining for Open-Ended Object Detection Chuang Lin, Yi Jiang, Lizhen Qu, Zehuan Yuan, Jianfei Cai

ECCV 2024 Groma: Localized Visual Tokenization for Grounding Multimodal Large Language Models Chuofan Ma, Yi Jiang, Jiannan Wu, Zehuan Yuan, Xiaojuan Qi

NeurIPS 2024 OmniTokenizer: A Joint Image-Video Tokenizer for Visual Generation Junke Wang, Yi Jiang, Zehuan Yuan, Binyue Peng, Zuxuan Wu, Yu-Gang Jiang

NeurIPS 2024 Recognize Any Regions Haosen Yang, Chuofan Ma, Bin Wen, Yi Jiang, Zehuan Yuan, Xiatian Zhu

NeurIPS 2024 Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction Keyu Tian, Yi Jiang, Zehuan Yuan, Bingyue Peng, Liwei Wang

NeurIPS 2023 CoDet: Co-Occurrence Guided Region-Word Alignment for Open-Vocabulary Object Detection Chuofan Ma, Yi Jiang, Xin Wen, Zehuan Yuan, Xiaojuan Qi

ICLR 2023 Designing BERT for Convolutional Networks: Sparse and Hierarchical Masked Modeling Keyu Tian, Yi Jiang, Qishuai Diao, Chen Lin, Liwei Wang, Zehuan Yuan

ICCV 2023 EGC: Image Generation and Classification via a Diffusion Energy-Based Model Qiushan Guo, Chuofan Ma, Yi Jiang, Zehuan Yuan, Yizhou Yu, Ping Luo

ICCV 2023 Exploring Transformers for Open-World Instance Segmentation Jiannan Wu, Yi Jiang, Bin Yan, Huchuan Lu, Zehuan Yuan, Ping Luo

CVPR 2023 Learning Instance-Level Representation for Large-Scale Multi-Modal Pretraining in E-Commerce Yang Jin, Yongzhi Li, Zehuan Yuan, Yadong Mu

ICLR 2023 Learning Object-Language Alignments for Open-Vocabulary Object Detection Chuang Lin, Peize Sun, Yi Jiang, Ping Luo, Lizhen Qu, Gholamreza Haffari, Zehuan Yuan, Jianfei Cai

CVPR 2023 Meta Compositional Referring Expression Segmentation Li Xu, Mark He Huang, Xindi Shang, Zehuan Yuan, Ying Sun, Jun Liu

ICCV 2023 Segment Every Reference Object in Spatial and Temporal Spaces Jiannan Wu, Yi Jiang, Bin Yan, Huchuan Lu, Zehuan Yuan, Ping Luo

ICCVW 2023 The First Visual Object Tracking Segmentation VOTS2023 Challenge Results Matej Kristan, Jirí Matas, Martin Danelljan, Michael Felsberg, Hyung Jin Chang, Luka Cehovin Zajc, Alan Lukezic, Ondrej Drbohlav, Zhongqun Zhang, Khanh-Tung Tran, Xuan-Son Vu, Johanna Björklund, Christoph Mayer, Yushan Zhang, Lei Ke, Jie Zhao, Gustavo Fernández, Noor Al-Shakarji, Dong An, Michael Arens, Stefan Becker, Goutam Bhat, Sebastian Bullinger, Antoni B. Chan, Shijie Chang, Hanyuan Chen, Xin Chen, Yan Chen, Zhenyu Chen, Yangming Cheng, Yutao Cui, Chunyuan Deng, Jiahua Dong, Matteo Dunnhofer, Wei Feng, Jianlong Fu, Jie Gao, Ruize Han, Zeqi Hao, Jun-Yan He, Keji He, Zhenyu He, Xiantao Hu, Kaer Huang, Yuqing Huang, Yi Jiang, Ben Kang, Jin-Peng Lan, Hyungjun Lee, Chenyang Li, Jiahao Li, Ning Li, Wangkai Li, Xiaodi Li, Xin Li, Pengyu Liu, Yue Liu, Huchuan Lu, Bin Luo, Ping Luo, Yinchao Ma, Deshui Miao, Christian Micheloni, Kannappan Palaniappan, Hancheol Park, Matthieu Paul, Houwen Peng, Zekun Qian, Gani Rahmon, Norbert Scherer-Negenborn, Pengcheng Shao, Wooksu Shin, Elham Soltani Kazemi, Tianhui Song, Rainer Stiefelhagen, Rui Sun, Chuanming Tang, Zhangyong Tang, Imad Eddine Toubal, Jack Valmadre, Joost van de Weijer, Luc Van Gool, Jash Vira, Stéphane Vujasinovic, Cheng Wan, Jia Wan, Dong Wang, Fei Wang, Feifan Wang, He Wang, Limin Wang, Song Wang, Yaowei Wang, Zhepeng Wang, Gangshan Wu, Jiannan Wu, Qiangqiang Wu, Xiaojun Wu, Anqi Xiao, Jinxia Xie, Chenlong Xu, Min Xu, Tianyang Xu, Yuanyou Xu, Bin Yan, Dawei Yang, Ming-Hsuan Yang, Tianyu Yang, Yi Yang, Zongxin Yang, Xuanwu Yin, Fisher Yu, Hongyuan Yu, Qianjin Yu, Weichen Yu, Yongsheng Yuan, Zehuan Yuan, Jianlin Zhang, Lu Zhang, Tianzhu Zhang, Guodongfang Zhao, Shaochuan Zhao, Yaozong Zheng, Bineng Zhong, Jiawen Zhu, Xuefeng Zhu, Yueting Zhuang, ChengAo Zong, Kunlong Zuo

CVPR 2023 Token Boosting for Robust Self-Supervised Visual Transformer Pre-Training Tianjiao Li, Lin Geng Foo, Ping Hu, Xindi Shang, Hossein Rahmani, Zehuan Yuan, Jun Liu

CVPR 2023 Universal Instance Perception as Object Discovery and Retrieval Bin Yan, Yi Jiang, Jiannan Wu, Dong Wang, Ping Luo, Zehuan Yuan, Huchuan Lu

ECCV 2022 ByteTrack: Multi-Object Tracking by Associating Every Detection Box Yifu Zhang, Peize Sun, Yi Jiang, Dongdong Yu, Fucheng Weng, Zehuan Yuan, Ping Luo, Wenyu Liu, Xinggang Wang

AAAI 2022 Content-Variant Reference Image Quality Assessment via Knowledge Distillation Guanghao Yin, Wei Wang, Zehuan Yuan, Chuchu Han, Wei Ji, Shouqian Sun, Changhu Wang

CVPR 2022 DanceTrack: Multi-Object Tracking in Uniform Appearance and Diverse Motion Peize Sun, Jinkun Cao, Yi Jiang, Zehuan Yuan, Song Bai, Kris Kitani, Ping Luo

NeurIPS 2022 Embracing Consistency: A One-Stage Approach for Spatio-Temporal Video Grounding Yang Jin, Yongzhi Li, Zehuan Yuan, Yadong Mu

CVPR 2022 Focal and Global Knowledge Distillation for Detectors Zhendong Yang, Zhe Li, Xiaohu Jiang, Yuan Gong, Zehuan Yuan, Danpei Zhao, Chun Yuan

CVPR 2022 Language as Queries for Referring Video Object Segmentation Jiannan Wu, Yi Jiang, Peize Sun, Zehuan Yuan, Ping Luo

ECCV 2022 Masked Generative Distillation Zhendong Yang, Zhe Li, Mingqi Shao, Dachuan Shi, Zehuan Yuan, Chun Yuan

ECCV 2022 Multimodal Transformer with Variable-Length Memory for Vision-and-Language Navigation Chuang Lin, Yi Jiang, Jianfei Cai, Lizhen Qu, Gholamreza Haffari, Zehuan Yuan

ICLR 2022 Objects in Semantic Topology Shuo Yang, Peize Sun, Yi Jiang, Xiaobo Xia, Ruiheng Zhang, Zehuan Yuan, Changhu Wang, Ping Luo, Min Xu

NeurIPS 2022 QueryPose: Sparse Multi-Person Pose Regression via Spatial-Aware Part-Level Query Yabo Xiao, Kai Su, Xiaojuan Wang, Dongdong Yu, Lei Jin, Mingshu He, Zehuan Yuan

NeurIPS 2022 Rethinking Resolution in the Context of Efficient Video Recognition Chuofan Ma, Qiushan Guo, Yi Jiang, Ping Luo, Zehuan Yuan, Xiaojuan Qi

ECCV 2022 Towards Grand Unification of Object Tracking Bin Yan, Yi Jiang, Peize Sun, Dong Wang, Zehuan Yuan, Ping Luo, Huchuan Lu

ECCV 2022 You Should Look at All Objects Zhenchao Jin, Dongdong Yu, Luchuan Song, Zehuan Yuan, Lequan Yu

NeurIPS 2021 Disentangled Contrastive Learning on Graphs Haoyang Li, Xin Wang, Ziwei Zhang, Zehuan Yuan, Hang Li, Wenwu Zhu

ICCV 2021 Domain-Invariant Disentangled Network for Generalizable Object Detection Chuang Lin, Zehuan Yuan, Sicheng Zhao, Peize Sun, Changhu Wang, Jianfei Cai

ICLR 2021 Exploring Balanced Feature Spaces for Representation Learning Bingyi Kang, Yu Li, Sa Xie, Zehuan Yuan, Jiashi Feng

AAAI 2021 Slimmable Generative Adversarial Networks Liang Hou, Zehuan Yuan, Lei Huang, Huawei Shen, Xueqi Cheng, Changhu Wang

CVPR 2021 Sparse R-CNN: End-to-End Object Detection with Learnable Proposals Peize Sun, Rufeng Zhang, Yi Jiang, Tao Kong, Chenfeng Xu, Wei Zhan, Masayoshi Tomizuka, Lei Li, Zehuan Yuan, Changhu Wang, Ping Luo

ICCV 2021 Unsupervised Real-World Super-Resolution: A Domain Adaptation Perspective Wei Wang, Haochen Zhang, Zehuan Yuan, Changhu Wang

ICCV 2021 Weakly Supervised Person Search with Region Siamese Networks Chuchu Han, Kai Su, Dongdong Yu, Zehuan Yuan, Changxin Gao, Nong Sang, Yi Yang, Changhu Wang

ICML 2021 What Makes for End-to-End Object Detection? Peize Sun, Yi Jiang, Enze Xie, Wenqi Shao, Zehuan Yuan, Changhu Wang, Ping Luo

ECCVW 2018 Knowing Where to Look? Analysis on Attention of Visual Question Answering System Wei Li, Zehuan Yuan, Xiangzhong Fang, Changhu Wang

ECCVW 2018 Towards Good Practices for Multi-Modal Fusion in Large-Scale Video Classification Jinlai Liu, Zehuan Yuan, Changhu Wang

CVPR 2017 Temporal Action Localization by Structured Maximal Sums Zehuan Yuan, Jonathan C. Stroud, Tong Lu, Jia Deng