Zhu, Yi

61 publications

CVPR 2025 CAP-Net: A Unified Network for 6d Pose and Size Estimation of Categorical Articulated Parts from a Single RGB-D Image Jingshun Huang, Haitao Lin, Tianyu Wang, Yanwei Fu, Xiangyang Xue, Yi Zhu

ICLR 2025 Differential Transformer Tianzhu Ye, Li Dong, Yuqing Xia, Yutao Sun, Yi Zhu, Gao Huang, Furu Wei

WACV 2025 DisCo: Discovering Common Affordance from Large Models for Actionable Part Perception Youpeng Wen, Yi Zhu, Zhihao Zhan, Pengzhen Ren, Jianhua Han, Hang Xu, Shen Zhao, Xiaodan Liang

CVPR 2025 EMOVA: Empowering Language Models to See, Hear and Speak with Vivid Emotions Kai Chen, Yunhao Gou, Runhui Huang, Zhili Liu, Daxin Tan, Jing Xu, Chunwei Wang, Yi Zhu, Yihan Zeng, Kuo Yang, Dingdong Wang, Kun Xiang, Haoyuan Li, Haoli Bai, Jianhua Han, Xiaohui Li, Weike Jin, Nian Xie, Yu Zhang, James T. Kwok, Hengshuang Zhao, Xiaodan Liang, Dit-Yan Yeung, Xiao Chen, Zhenguo Li, Wei Zhang, Qun Liu, Lanqing Hong, Lu Hou, Hang Xu

TMLR 2025 Potential Score Matching: Debiasing Molecular Structure Sampling with Potential Energy Guidance Liya Guo, Zun Wang, Chang Liu, Junzhe Li, Pipi Hu, Yi Zhu, Tao Qin

NeurIPS 2025 rStar-Coder: Scaling Competitive Code Reasoning with a Large-Scale Verified Dataset Yifei Liu, Li Lyna Zhang, Yi Zhu, Bingcheng Dong, Xudong Zhou, Ning Shang, Fan Yang, Cheng Li, Mao Yang

ICML 2025 rStar-Math: Small LLMs Can Master Math Reasoning with Self-Evolved Deep Thinking Xinyu Guan, Li Lyna Zhang, Yifei Liu, Ning Shang, Youran Sun, Yi Zhu, Fan Yang, Mao Yang

DMLR 2024 Benchmarking Robustness of Multimodal Image-Text Models Under Distribution Shift Jielin Qiu, Yi Zhu, Xingjian Shi, Florian Wenzel, Zhiqiang Tang, Ding Zhao, Bo Li, Mu Li

NeurIPSW 2024 Benchmarking Table Comprehension in the Wild Yikang Pan, Yi Zhu, Rand Xie, Yizhi Liu

CVPRW 2024 Benchmarking Zero-Shot Recognition with Vision-Language Models: Challenges on Granularity and Specificity Zhenlin Xu, Yi Zhu, Siqi Deng, Abhay Mittal, Yanbei Chen, Manchen Wang, Paolo Favaro, Joseph Tighe, Davide Modolo

TMLR 2024 Efficient Large Language Models: A Survey Zhongwei Wan, Xin Wang, Che Liu, Samiul Alam, Yu Zheng, Jiachen Liu, Zhongnan Qu, Shen Yan, Yi Zhu, Quanlu Zhang, Mosharaf Chowdhury, Mi Zhang

NeurIPS 2024 SLIM: Style-Linguistics Mismatch Model for Generalized Audio Deepfake Detection Yi Zhu, Surya Koppisetti, Trang Tran, Gaurav Bharaj

NeurIPS 2024 UNIT: Unifying Image and Text Recognition in One Vision Encoder Yi Zhu, Yanpeng Zhou, Chunwei Wang, Yang Cao, Jianhua Han, Lu Hou, Hang Xu

NeurIPS 2024 VidMan: Exploiting Implicit Dynamics from Video Diffusion Model for Effective Robot Manipulation Youpeng Wen, Junfan Lin, Yi Zhu, Jianhua Han, Hang Xu, Shen Zhao, Xiaodan Liang

NeurIPS 2024 You Only Cache Once: Decoder-Decoder Architectures for Language Models Yutao Sun, Li Dong, Yi Zhu, Shaohan Huang, Wenhui Wang, Shuming Ma, Quanlu Zhang, Jianyong Wang, Furu Wei

ICLR 2023 AIM: Adapting Image Models for Efficient Video Action Recognition Taojiannan Yang, Yi Zhu, Yusheng Xie, Aston Zhang, Chen Chen, Mu Li

AAAI 2023 Actional Atomic-Concept Learning for Demystifying Vision-Language Navigation Bingqian Lin, Yi Zhu, Xiaodan Liang, Liang Lin, Jianzhuang Liu

WACV 2023 ImpDet: Exploring Implicit Fields for 3D Object Detection Xuelin Qian, Li Wang, Yi Zhu, Li Zhang, Yanwei Fu, Xiangyang Xue

ICCV 2023 MixReorg: Cross-Modal Mixed Patch Reorganization Is a Good Mask Learner for Open-World Semantic Segmentation Kaixin Cai, Pengzhen Ren, Yi Zhu, Hang Xu, Jianzhuang Liu, Changlin Li, Guangrun Wang, Xiaodan Liang

ICCV 2023 Motion-Guided Masking for Spatiotemporal Representation Learning David Fan, Jue Wang, Shuai Liao, Yi Zhu, Vimal Bhat, Hector Santos-Villalobos, Rohith Mv, Xinyu Li

NeurIPS 2023 PreDiff: Precipitation Nowcasting with Latent Diffusion Models Zhihan Gao, Xingjian Shi, Boran Han, Hao Wang, Xiaoyong Jin, Danielle Maddix, Yi Zhu, Mu Li, Yuyang Wang

NeurIPSW 2023 PreDiff: Precipitation Nowcasting with Latent Diffusion Models Zhihan Gao, Xingjian Shi, Boran Han, Hao Wang, Xiaoyong Jin, Danielle C. Maddix, Yi Zhu, Mu Li, Bernie Wang

NeurIPS 2023 Prompt Pre-Training with Twenty-Thousand Classes for Open-Vocabulary Visual Recognition Shuhuai Ren, Aston Zhang, Yi Zhu, Shuai Zhang, Shuai Zheng, Mu Li, Alexander J Smola, Xu Sun

ICCV 2023 Towards Geospatial Foundation Models via Continual Pretraining Matías Mendieta, Boran Han, Xingjian Shi, Yi Zhu, Chen Chen

ICLR 2023 Unsupervised Semantic Segmentation with Self-Supervised Object-Centric Representations Andrii Zadaianchuk, Matthaeus Kleindessner, Yi Zhu, Francesco Locatello, Thomas Brox

ICLR 2023 ViewCo: Discovering Text-Supervised Segmentation Masks via Multi-View Semantic Consistency Pengzhen Ren, Changlin Li, Hang Xu, Yi Zhu, Guangrun Wang, Jianzhuang Liu, Xiaojun Chang, Xiaodan Liang

CVPR 2022 ADAPT: Vision-Language Navigation with Modality-Aligned Action Prompts Bingqian Lin, Yi Zhu, Zicong Chen, Xiwen Liang, Jianzhuang Liu, Xiaodan Liang

NeurIPSW 2022 Benchmarking Robustness Under Distribution Shift of Multimodal Image-Text Models Jielin Qiu, Yi Zhu, Xingjian Shi, Zhiqiang Tang, Ding Zhao, Bo Li, Mu Li

CVPRW 2022 BigDetection: A Large-Scale Benchmark for Improved Object Detector Pre-Training Likun Cai, Zhi Zhang, Yi Zhu, Li Zhang, Mu Li, Xiangyang Xue

AAAI 2022 Contrastive Instruction-Trajectory Learning for Vision-Language Navigation Xiwen Liang, Fengda Zhu, Yi Zhu, Bingqian Lin, Bing Wang, Xiaodan Liang

NeurIPS 2022 CoupAlign: Coupling Word-Pixel with Sentence-Mask Alignments for Referring Image Segmentation Zicheng Zhang, Yi Zhu, Jianzhuang Liu, Xiaodan Liang, Wei Ke

NeurIPS 2022 Earthformer: Exploring Space-Time Transformers for Earth System Forecasting Zhihan Gao, Xingjian Shi, Hao Wang, Yi Zhu, Yuyang Wang, Mu Li, Dit-Yan Yeung

CVPR 2022 Learning Canonical F-Correlation Projection for Compact Multiview Representation Yun-Hao Yuan, Jin Li, Yun Li, Jipeng Qiang, Yi Zhu, Xiaobo Shen, Jianping Gou

CVPRW 2022 NTIRE 2022 Challenge on Efficient Super-Resolution: Methods and Results Yawei Li, Kai Zhang, Radu Timofte, Luc Van Gool, Fangyuan Kong, Mingxi Li, Songwei Liu, Zongcai Du, Ding Liu, Chenhui Zhou, Jingyi Chen, Qingrui Han, Zheyuan Li, Yingqi Liu, Xiangyu Chen, Haoming Cai, Yu Qiao, Chao Dong, Long Sun, Jinshan Pan, Yi Zhu, Zhikai Zong, Xiaoxiao Liu, Zheng Hui, Tao Yang, Peiran Ren, Xuansong Xie, Xian-Sheng Hua, Yanbo Wang, Xiaozhong Ji, Chuming Lin, Donghao Luo, Ying Tai, Chengjie Wang, Zhizhong Zhang, Yuan Xie, Shen Cheng, Ziwei Luo, Lei Yu, Zhihong Wen, Qi Wu, Youwei Li, Haoqiang Fan, Jian Sun, Shuaicheng Liu, Yuanfei Huang, Meiguang Jin, Hua Huang, Jing Liu, Xinjian Zhang, Yan Wang, Lingshun Long, Gen Li, Yuanfan Zhang, Zuowei Cao, Lei Sun, Panaetov Alexander, Yucong Wang, Minjie Cai, Li Wang, Lu Tian, Zheyuan Wang, Hongbing Ma, Jie Liu, Chao Chen, Yidong Cai, Jie Tang, Gangshan Wu, Weiran Wang, Shirui Huang, Honglei Lu, Huan Liu, Keyan Wang, Jun Chen, Shi Chen, Yuchun Miao, Zimo Huang, Lefei Zhang, Mustafa Ayazoglu, Wei Xiong, Chengyi Xiong, Fei Wang, Hao Li, Ruimian Wen, Zhijing Yang, Wenbin Zou, Weixin Zheng, Tian Ye, Yuncheng Zhang, Xiangzhen Kong, Aditya Arora, Syed Waqas Zamir, Salman H. Khan, Munawar Hayat, Fahad Shahbaz Khan, Dandan Gao, Dengwen Zhou, Qian Ning, Jingzhu Tang, Han Huang, Yufei Wang, Zhangheng Peng, Haobo Li, Wenxue Guan, Shenghua Gong, Xin Li, Jun Liu, Wanjun Wang, Kun Zeng, Hanjiang Lin, Xinyu Chen, Jinsheng Fang

WACV 2022 NUTA: Non-Uniform Temporal Aggregation for Action Recognition Xinyu Li, Chunhui Liu, Bing Shuai, Yi Zhu, Hao Chen, Joseph Tighe

ICML 2022 Partial and Asymmetric Contrastive Learning for Out-of-Distribution Detection in Long-Tailed Recognition Haotao Wang, Aston Zhang, Yi Zhu, Shuai Zheng, Mu Li, Alex J Smola, Zhangyang Wang

ICMLW 2022 Pixel-Level Correspondence for Self-Supervised Learning from Video Yash Sharma, Yi Zhu, Chris Russell, Thomas Brox

CVPRW 2022 ResNeSt: Split-Attention Networks Hang Zhang, Chongruo Wu, Zhongyue Zhang, Yi Zhu, Haibin Lin, Zhi Zhang, Yue Sun, Tong He, Jonas Mueller, R. Manmatha, Mu Li, Alexander J. Smola

ICCVW 2021 A Unified Efficient Pyramid Transformer for Semantic Segmentation Fangrui Zhu, Yi Zhu, Li Zhang, Chongruo Wu, Yanwei Fu, Mu Li

NeurIPS 2021 Blending Anti-Aliasing into Vision Transformer Shengju Qian, Hao Shao, Yi Zhu, Mu Li, Jiaya Jia

ICCV 2021 CrossCLR: Cross-Modal Contrastive Learning for Multi-Modal Video Representations Mohammadreza Zolfaghari, Yi Zhu, Peter Gehler, Thomas Brox

ICCV 2021 CrossNorm and SelfNorm for Generalization Under Distribution Shifts Zhiqiang Tang, Yunhe Gao, Yi Zhu, Zhi Zhang, Mu Li, Dimitris N. Metaxas

CVPR 2021 Domain Consensus Clustering for Universal Domain Adaptation Guangrui Li, Guoliang Kang, Yi Zhu, Yunchao Wei, Yi Yang

NeurIPS 2021 Progressive Coordinate Transforms for Monocular 3D Object Detection Li Wang, Li Zhang, Yi Zhu, Zhi Zhang, Tong He, Mu Li, Xiangyang Xue

CVPR 2021 SOON: Scenario Oriented Object Navigation with Graph-Based Exploration Fengda Zhu, Xiwen Liang, Yi Zhu, Qizhi Yu, Xiaojun Chang, Xiaodan Liang

WACV 2021 Scale Aware Adaptation for Land-Cover Classification in Remote Sensing Imagery Xueqing Deng, Yi Zhu, Yuxin Tian, Shawn Newsam

ICCV 2021 Self-Motivated Communication Agent for Real-World Vision-Dialog Navigation Yi Zhu, Yue Weng, Fengda Zhu, Xiaodan Liang, Qixiang Ye, Yutong Lu, Jianbin Jiao

ICCV 2021 VidTr: Video Transformer Without Convolutions Yanyi Zhang, Xinyu Li, Chunhui Liu, Bing Shuai, Yi Zhu, Biagio Brattoli, Hao Chen, Ivan Marsic, Joseph Tighe

ICCVW 2021 Video Contrastive Learning with Global Context Haofei Kuang, Yi Zhu, Zhi Zhang, Xinyu Li, Joseph Tighe, Sören Schwertfeger, Cyrill Stachniss, Mu Li

WACV 2020 Cross-Time and Orientation-Invariant Overhead Image Geolocalization Using Deep Local Features Yuxin Tian, Xueqing Deng, Yi Zhu, Shawn Newsam

ICLR 2020 Efficient Inference and Exploration for Reinforcement Learning Yi Zhu, Jing Dong, Henry Lam

JMLR 2020 GluonCV and GluonNLP: Deep Learning in Computer Vision and Natural Language Processing Jian Guo, He He, Tong He, Leonard Lausen, Mu Li, Haibin Lin, Xingjian Shi, Chenguang Wang, Junyuan Xie, Sheng Zha, Aston Zhang, Hang Zhang, Zhi Zhang, Zhongyue Zhang, Shuai Zheng, Yi Zhu

AAAI 2020 Lexical Simplification with Pretrained Encoders Jipeng Qiang, Yun Li, Yi Zhu, Yunhao Yuan, Xindong Wu

ECCV 2020 Motion-Excited Sampler: Video Adversarial Attack with Sparked Prior Hu Zhang, Linchao Zhu, Yi Zhu, Yi Yang

AAAI 2019 Tensor Decomposition for Multilayer Networks Clustering Zitai Chen, Chuan Chen, Zibin Zheng, Yi Zhu

CVPRW 2017 Deep Local Video Feature for Action Recognition Zhen-Zhong Lan, Yi Zhu, Alexander G. Hauptmann, Shawn D. Newsam

WACV 2017 Efficient Action Detection in Untrimmed Videos via Multi-Task Learning Yi Zhu, Shawn D. Newsam

ICCV 2017 Soft Proposal Networks for Weakly Supervised Object Localization Yi Zhu, Yanzhao Zhou, Qixiang Ye, Qiang Qiu, Jianbin Jiao

ECCV 2016 Depth2Action: Exploring Embedded Depth for Large-Scale Action Recognition Yi Zhu, Shawn D. Newsam

ECCVW 2016 Depth2Action: Exploring Embedded Depth for Large-Scale Action Recognition Yi Zhu, Shawn D. Newsam

AAAI 2008 A User-Oriented Webpage Ranking Algorithm Based on User Attention Time Songhua Xu, Yi Zhu, Hao Jiang, Francis C. M. Lau