Ren, Shuhuai

9 publications

ICCV 2025 Bridging Continuous and Discrete Tokens for Autoregressive Visual Generation Yuqing Wang, Zhijie Lin, Yao Teng, Yuanzhi Zhu, Shuhuai Ren, Jiashi Feng, Xihui Liu

CVPR 2025 Parallelized Autoregressive Visual Generation Yuqing Wang, Shuhuai Ren, Zhijie Lin, Yujin Han, Haoyuan Guo, Zhenheng Yang, Difan Zou, Jiashi Feng, Xihui Liu

NeurIPS 2025 UVE: Are MLLMs Unified Evaluators for AI-Generated Videos? Yuanxin Liu, Rui Zhu, Shuhuai Ren, Jiacong Wang, Haoyuan Guo, Xu Sun, Lu Jiang

CVPR 2025 Video-MME: The First-Ever Comprehensive Evaluation Benchmark of Multi-Modal LLMs in Video Analysis Chaoyou Fu, Yuhan Dai, Yongdong Luo, Lei Li, Shuhuai Ren, Renrui Zhang, Zihan Wang, Chenyu Zhou, Yunhang Shen, Mengdan Zhang, Peixian Chen, Yanwei Li, Shaohui Lin, Sirui Zhao, Ke Li, Tong Xu, Xiawu Zheng, Enhong Chen, Caifeng Shan, Ran He, Xing Sun

CVPR 2024 TimeChat: A Time-Sensitive Multimodal Large Language Model for Long Video Understanding Shuhuai Ren, Linli Yao, Shicheng Li, Xu Sun, Lu Hou

ECCV 2024 VITATECS: A Diagnostic Dataset for Temporal Concept Understanding of Video-Language Models Shicheng Li, Lei Li, Yi Liu, Shuhuai Ren, Yuanxin Liu, Rundong Gao, Xu Sun, Lu Hou

NeurIPS 2023 FETV: A Benchmark for Fine-Grained Evaluation of Open-Domain Text-to-Video Generation Yuanxin Liu, Lei Li, Shuhuai Ren, Rundong Gao, Shicheng Li, Sishuo Chen, Xu Sun, Lu Hou

NeurIPS 2023 Prompt Pre-Training with Twenty-Thousand Classes for Open-Vocabulary Visual Recognition Shuhuai Ren, Aston Zhang, Yi Zhu, Shuai Zhang, Shuai Zheng, Mu Li, Alexander J Smola, Xu Sun

NeurIPSW 2023 Towards End-to-End Embodied Decision Making with Multi-Modal Large Language Model: Explorations with GPT4-Vision and Beyond Liang Chen, Yichi Zhang, Shuhuai Ren, Haozhe Zhao, Zefan Cai, Yuchi Wang, Tianyu Liu, Baobao Chang