Xu, Mingze

15 publications

ICLR 2025 MM1.5: Methods, Analysis & Insights from Multimodal LLM Fine-Tuning Haotian Zhang, Mingfei Gao, Zhe Gan, Philipp Dufter, Nina Wenzel, Forrest Huang, Dhruti Shah, Xianzhi Du, Bowen Zhang, Yanghao Li, Sam Dodge, Keen You, Zhen Yang, Aleksei Timofeev, Mingze Xu, Hong-You Chen, Jean-Philippe Fauconnier, Zhengfeng Lai, Haoxuan You, Zirui Wang, Afshin Dehghan, Peter Grasch, Yinfei Yang

NeurIPS 2025 StreamBridge: Turning Your Offline Video Large Language Model into a Proactive Streaming Assistant Haibo Wang, Bo Feng, Zhengfeng Lai, Mingze Xu, Shiyu Li, Weifeng Ge, Afshin Dehghan, Meng Cao, Ping Huang

NeurIPS 2025 UniGen: Enhanced Training & Test-Time Strategies for Unified Multimodal Understanding and Generation Rui Tian, Mingfei Gao, Mingze Xu, Jiaming Hu, Jiasen Lu, Zuxuan Wu, Yinfei Yang, Afshin Dehghan

ICCV 2023 SkeleTR: Towards Skeleton-Based Action Recognition in the Wild Haodong Duan, Mingze Xu, Bing Shuai, Davide Modolo, Zhuowen Tu, Joseph Tighe, Alessandro Bergamo

NeurIPS 2022 An In-Depth Study of Stochastic Backpropagation Jun Fang, Mingze Xu, Hao Chen, Bing Shuai, Zhuowen Tu, Joseph Tighe

NeurIPSW 2022 Exploring Biases in Facial Expression Analysis Using Synthetic Faces Ritik Raina, Miguel Monares, Mingze Xu, Sarah Fabi, Xiaojing Xu, Lehan Li, Will Sumerfield, Jin Gan, Virginia R. de Sa

CVPR 2022 MeMOT: Multi-Object Tracking with Memory Jiarui Cai, Mingze Xu, Wei Li, Yuanjun Xiong, Wei Xia, Zhuowen Tu, Stefano Soatto

CVPR 2022 Stochastic Backpropagation: A Memory Efficient Strategy for Training Video Models Feng Cheng, Mingze Xu, Yuanjun Xiong, Hao Chen, Xinyu Li, Wei Li, Wei Xia

CVPR 2022 TubeR: Tubelet Transformer for Video Action Detection Jiaojiao Zhao, Yanyi Zhang, Xinyu Li, Hao Chen, Bing Shuai, Mingze Xu, Chunhui Liu, Kaustav Kundu, Yuanjun Xiong, Davide Modolo, Ivan Marsic, Cees G. M. Snoek, Joseph Tighe

ICCV 2021 Learning Self-Consistency for Deepfake Detection Tianchen Zhao, Xiang Xu, Mingze Xu, Hui Ding, Yuanjun Xiong, Wei Xia

NeurIPS 2021 Long Short-Term Transformer for Online Action Detection Mingze Xu, Yuanjun Xiong, Hao Chen, Xinyu Li, Wei Xia, Zhuowen Tu, Stefano Soatto

WACV 2018 Fully-Coupled Two-Stream Spatiotemporal Networks for Extremely Low Resolution Action Recognition Mingze Xu, Aidean Sharghi, Xin Chen, David J. Crandall

ECCV 2018 Joint Person Segmentation and Identification in Synchronized First- and Third-Person Videos Mingze Xu, Chenyou Fan, Yuchen Wang, Michael S. Ryoo, David J. Crandall

WACV 2018 Multi-Task Spatiotemporal Neural Networks for Structured Surface Reconstruction Mingze Xu, Chenyou Fan, John D. Paden, Geoffrey C. Fox, David J. Crandall

CVPR 2017 Identifying First-Person Camera Wearers in Third-Person Videos Chenyou Fan, Jangwon Lee, Mingze Xu, Krishna Kumar Singh, Yong Jae Lee, David J. Crandall, Michael S. Ryoo