Yuan, Liangzhe

14 publications

CVPR 2024 Distilling Vision-Language Models on Millions of Videos Yue Zhao, Long Zhao, Xingyi Zhou, Jialin Wu, Chun-Te Chu, Hui Miao, Florian Schroff, Hartwig Adam, Ting Liu, Boqing Gong, Philipp Krahenbuhl, Liangzhe Yuan

WACV 2024 PolyMaX: General Dense Prediction with Mask Transformer Xuan Yang, Liangzhe Yuan, Kimberly Wilber, Astuti Sharma, Xiuye Gu, Siyuan Qiao, Stephanie Debats, Huisheng Wang, Hartwig Adam, Mikhail Sirotenko, Liang-Chieh Chen

ICLR 2024 Structured Video-Language Modeling with Temporal Grouping and Spatial Grounding Yuanhao Xiong, Long Zhao, Boqing Gong, Ming-Hsuan Yang, Florian Schroff, Ting Liu, Cho-Jui Hsieh, Liangzhe Yuan

TMLR 2024 VideoGLUE: Video General Understanding Evaluation of Foundation Models Liangzhe Yuan, Nitesh Bharadwaj Gundavarapu, Long Zhao, Hao Zhou, Yin Cui, Lu Jiang, Xuan Yang, Menglin Jia, Tobias Weyand, Luke Friedman, Mikhail Sirotenko, Huisheng Wang, Florian Schroff, Hartwig Adam, Ming-Hsuan Yang, Ting Liu, Boqing Gong

ICML 2024 VideoPrism: A Foundational Visual Encoder for Video Understanding Long Zhao, Nitesh Bharadwaj Gundavarapu, Liangzhe Yuan, Hao Zhou, Shen Yan, Jennifer J. Sun, Luke Friedman, Rui Qian, Tobias Weyand, Yue Zhao, Rachel Hornung, Florian Schroff, Ming-Hsuan Yang, David A Ross, Huisheng Wang, Hartwig Adam, Mikhail Sirotenko, Ting Liu, Boqing Gong

ICCV 2023 Learning from Semantic Alignment Between Unpaired Multiviews for Egocentric Video Recognition Qitong Wang, Long Zhao, Liangzhe Yuan, Ting Liu, Xi Peng

ICCV 2023 Unified Visual Relationship Detection with Vision and Language Models Long Zhao, Liangzhe Yuan, Boqing Gong, Yin Cui, Florian Schroff, Ming-Hsuan Yang, Hartwig Adam, Ting Liu

CVPR 2022 Contextualized Spatio-Temporal Contrastive Learning with Self-Supervision Liangzhe Yuan, Rui Qian, Yin Cui, Boqing Gong, Florian Schroff, Ming-Hsuan Yang, Hartwig Adam, Ting Liu

ICLR 2022 Surrogate Gap Minimization Improves Sharpness-Aware Training Juntang Zhuang, Boqing Gong, Liangzhe Yuan, Yin Cui, Hartwig Adam, Nicha C Dvornek, Sekhar Tatikonda, James s Duncan, Ting Liu

CVPR 2021 Learning View-Disentangled Human Pose Representation by Contrastive Cross-View Mutual Information Maximization Long Zhao, Yuxiao Wang, Jiaping Zhao, Liangzhe Yuan, Jennifer J. Sun, Florian Schroff, Hartwig Adam, Xi Peng, Dimitris Metaxas, Ting Liu

CVPR 2021 MoViNets: Mobile Video Networks for Efficient Video Recognition Dan Kondratyuk, Liangzhe Yuan, Yandong Li, Li Zhang, Mingxing Tan, Matthew Brown, Boqing Gong

NeurIPS 2021 VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and Text Hassan Akbari, Liangzhe Yuan, Rui Qian, Wei-Hong Chuang, Shih-Fu Chang, Yin Cui, Boqing Gong

CVPRW 2019 Live Demonstration: Unsupervised Event-Based Learning of Optical Flow, Depth and Egomotion Alex Zihao Zhu, Liangzhe Yuan, Kenneth Chaney, Kostas Daniilidis

ECCVW 2018 Unsupervised Event-Based Optical Flow Using Motion Compensation Alex Zihao Zhu, Liangzhe Yuan, Kenneth Chaney, Kostas Daniilidis