Shi, Yang

16 publications

ICLR 2026 AVoCaDO: An Audiovisual Video Captioner Driven by Temporal Orchestration Xinlong Chen, Yue Ding, Weihong Lin, Jingyun Hua, Linli Yao, Yang Shi, Bozhou Li, Qiang Liu, Yuanxing Zhang, Pengfei Wan, Liang Wang

ICLR 2026 BaseReward: A Strong Baseline for Multimodal Reward Model YiFan Zhang, Haihua Yang, Huanyu Zhang, Yang Shi, Zezhou Chen, Haochen Tian, Chaoyou Fu, Kai Wu, Bo Cui, Xu Wang, Jianfei Pan, Haotian Wang, Zhang Zhang, Liang Wang

ICLR 2026 MME-Unify: A Comprehensive Benchmark for Unified Multimodal Understanding and Generation Models Wulin Xie, YiFan Zhang, Chaoyou Fu, Yang Shi, Jianshu Zeng, Bingyan Nie, Hongkai Chen, Zhang Zhang, Liang Wang

ICLR 2026 The Unseen Bias: How Norm Discrepancy in Pre-Norm MLLMs Leads to Visual Information Loss Bozhou Li, Xinda Xue, Sihan Yang, Yang Shi, Xinlong Chen, Yushuo Guan, Yuanxing Zhang, Wentao Zhang

ICLR 2026 Transformers with Endogenous In-Context Learning: Bias Characterization and Mitigation Haotian Wang, Hao Zou, Haoxuan Li, Haoang Chi, Yang Shi, Yuanxing Zhang, Wenjing Yang, Xinwang Liu, Zhouchen Lin

ICLR 2026 VidBridge-R1: Bridging QA and Captioning for RL-Based Video Understanding Models with Intermediate Proxy Tasks Xinlong Chen, Yuanxing Zhang, Yushuo Guan, Weihong Lin, Zekun Moore Wang, Bohan Zeng, Yang Shi, Sihan Yang, Qiang Liu, Pengfei Wan, Liang Wang

AAAI 2025 Generalized Debiased Semi-Supervised Hashing for Large-Scale Image Retrieval Xingbo Liu, Xuening Zhang, Xiushan Nie, Yang Shi, Yilong Yin

ICML 2025 MM-RLHF: The Next Step Forward in Multimodal LLM Alignment Yifan Zhang, Tao Yu, Haochen Tian, Chaoyou Fu, Peiyan Li, Jianshu Zeng, Wulin Xie, Yang Shi, Huanyu Zhang, Junkang Wu, Xue Wang, Yibo Hu, Bin Wen, Tingting Gao, Zhang Zhang, Fan Yang, Di Zhang, Liang Wang, Rong Jin

NeurIPS 2025 MME-VideoOCR: Evaluating OCR-Based Capabilities of Multimodal LLMs in Video Scenarios Yang Shi, Huanqian Wang, Wulin Xie, Huanyao Zhang, Lijie Zhao, YiFan Zhang, Xinfeng Li, Chaoyou Fu, Zhuoer Wen, Wenting Liu, Zhuoran Zhang, Xinlong Chen, Bohan Zeng, Sihan Yang, Yushuo Guan, Zhang Zhang, Liang Wang, Haoxuan Li, Zhouchen Lin, Yuanxing Zhang, Pengfei Wan, Haotian Wang, Wenjing Yang

AAAI 2024 Students' Perceptions and Preferences of Generative Artificial Intelligence Feedback for Programming Zhengdong Zhang, Zihan Dong, Yang Shi, Thomas W. Price, Noboru Matsuda, Dongkuan Xu

ICCV 2023 Bring Clipart to Life Nanxuan Zhao, Shengqi Dang, Hexun Lin, Yang Shi, Nan Cao

AAAI 2020 Focusing on Detail: Deep Hashing Based on Multiple Region Details (Student Abstract) Quan Zhou, Xiushan Nie, Yang Shi, Xingbo Liu, Yilong Yin

AAAI 2019 AI-Sketcher : A Deep Generative Model for Producing High-Quality Sketches Nan Cao, Xin Yan, Yang Shi, Chaoran Chen

ECCV 2018 Question Type Guided Attention in Visual Question Answering Yang Shi, Tommaso Furlanello, Sheng Zha, Animashree Anandkumar

AISTATS 2016 Tensor vs. Matrix Methods: Robust Tensor Decomposition Under Block Sparse Perturbations Anima Anandkumar, Prateek Jain, Yang Shi, U. N. Niranjan

AAAI 2004 Evaluating Consistency Algorithms for Temporal Metric Constraints Yang Shi, Anagh Lal, Berthe Y. Choueiry