Zhao, Long

31 publications

ICML 2025 Epsilon-VAE: Denoising as Visual Decoding Long Zhao, Sanghyun Woo, Ziyu Wan, Yandong Li, Han Zhang, Boqing Gong, Hartwig Adam, Xuhui Jia, Ting Liu

NeurIPS 2025 InstructSAM: A Training-Free Framework for Instruction-Oriented Remote Sensing Object Recognition Yijie Zheng, Weijie Wu, Qingyun Li, Xuehui Wang, Xu Zhou, Aiai Ren, Jun Shen, Long Zhao, Guoqing Li, Xue Yang

ICML 2025 The Hidden Life of Tokens: Reducing Hallucination of Large Vision-Language Models via Visual Information Steering Zhuowei Li, Haizhou Shi, Yunhe Gao, Di Liu, Zhenting Wang, Yuxiao Chen, Ting Liu, Long Zhao, Hao Wang, Dimitris N. Metaxas

CVPR 2024 Distilling Vision-Language Models on Millions of Videos Yue Zhao, Long Zhao, Xingyi Zhou, Jialin Wu, Chun-Te Chu, Hui Miao, Florian Schroff, Hartwig Adam, Ting Liu, Boqing Gong, Philipp Krahenbuhl, Liangzhe Yuan

CVPR 2024 Generating Enhanced Negatives for Training Language-Based Object Detectors Shiyu Zhao, Long Zhao, B G Vijay Kumar, Yumin Suh, Dimitris N. Metaxas, Manmohan Chandraker, Samuel Schulter

AAAI 2024 MINES: Message Intercommunication for Inductive Relation Reasoning over Neighbor-Enhanced Subgraphs Ke Liang, Lingyuan Meng, Sihang Zhou, Wenxuan Tu, Siwei Wang, Yue Liu, Meng Liu, Long Zhao, Xiangjun Dong, Xinwang Liu

ECCV 2024 Open-Vocabulary 3D Semantic Segmentation with Text-to-Image Diffusion Models Xiaoyu Zhu, Hao Zhou, Pengfei Xing, Long Zhao, Hao Xu, Junwei Liang, Alexander G. Hauptmann, Ting Liu, Andrew Gallagher

AAAI 2024 Sample-Level Cross-View Similarity Learning for Incomplete Multi-View Clustering Suyuan Liu, Junpu Zhang, Yi Wen, Xihong Yang, Siwei Wang, Yi Zhang, En Zhu, Chang Tang, Long Zhao, Xinwang Liu

WACV 2024 Steering Prototypes with Prompt-Tuning for Rehearsal-Free Continual Learning Zhuowei Li, Long Zhao, Zizhao Zhang, Han Zhang, Di Liu, Ting Liu, Dimitris N. Metaxas

ICLR 2024 Structured Video-Language Modeling with Temporal Grouping and Spatial Grounding Yuanhao Xiong, Long Zhao, Boqing Gong, Ming-Hsuan Yang, Florian Schroff, Ting Liu, Cho-Jui Hsieh, Liangzhe Yuan

CVPR 2024 Taming Self-Training for Open-Vocabulary Object Detection Shiyu Zhao, Samuel Schulter, Long Zhao, Zhixing Zhang, B G Vijay Kumar, Yumin Suh, Manmohan Chandraker, Dimitris N. Metaxas

TMLR 2024 VideoGLUE: Video General Understanding Evaluation of Foundation Models Liangzhe Yuan, Nitesh Bharadwaj Gundavarapu, Long Zhao, Hao Zhou, Yin Cui, Lu Jiang, Xuan Yang, Menglin Jia, Tobias Weyand, Luke Friedman, Mikhail Sirotenko, Huisheng Wang, Florian Schroff, Hartwig Adam, Ming-Hsuan Yang, Ting Liu, Boqing Gong

ICML 2024 VideoPrism: A Foundational Visual Encoder for Video Understanding Long Zhao, Nitesh Bharadwaj Gundavarapu, Liangzhe Yuan, Hao Zhou, Shen Yan, Jennifer J. Sun, Luke Friedman, Rui Qian, Tobias Weyand, Yue Zhao, Rachel Hornung, Florian Schroff, Ming-Hsuan Yang, David A Ross, Huisheng Wang, Hartwig Adam, Mikhail Sirotenko, Ting Liu, Boqing Gong

ICCV 2023 Learning from Semantic Alignment Between Unpaired Multiviews for Egocentric Video Recognition Qitong Wang, Long Zhao, Liangzhe Yuan, Ting Liu, Xi Peng

WACV 2023 More than Just Attention: Improving Cross-Modal Attentions with Contrastive Constraints for Image-Text Matching Yuxiao Chen, Jianbo Yuan, Long Zhao, Tianlang Chen, Rui Luo, Larry Davis, Dimitris N. Metaxas

ICCV 2023 Unified Visual Relationship Detection with Vision and Language Models Long Zhao, Liangzhe Yuan, Boqing Gong, Yin Cui, Florian Schroff, Ming-Hsuan Yang, Hartwig Adam, Ting Liu

CVPR 2022 Are Multimodal Transformers Robust to Missing Modality? Mengmeng Ma, Jian Ren, Long Zhao, Davide Testuggine, Xi Peng

ECCV 2022 COMPOSER: Compositional Reasoning of Group Activity in Videos with Keypoint-Only Modality Honglu Zhou, Asim Kadav, Aviv Shamsian, Shijie Geng, Farley Lai, Long Zhao, Ting Liu, Mubbasir Kapadia, Hans Peter Graf

ECCV 2022 Exploiting Unlabeled Data with Vision and Language Models for Object Detection Shiyu Zhao, Zhixing Zhang, Samuel Schulter, Long Zhao, B G Vijay Kumar, Anastasis Stathopoulos, Manmohan Chandraker, Dimitris N. Metaxas

CVPR 2022 Global Matching with Overlapping Attention for Optical Flow Estimation Shiyu Zhao, Long Zhao, Zhixing Zhang, Enyu Zhou, Dimitris Metaxas

ECCV 2022 Hierarchically Self-Supervised Transformer for Human Skeleton Representation Learning Yuxiao Chen, Long Zhao, Jianbo Yuan, Yu Tian, Zhaoyang Xia, Shijie Geng, Ligong Han, Dimitris N. Metaxas

AAAI 2022 Nested Hierarchical Transformer: Towards Accurate, Data-Efficient and Interpretable Visual Understanding Zizhao Zhang, Han Zhang, Long Zhao, Ting Chen, Sercan Ö. Arik, Tomas Pfister

NeurIPS 2021 Improved Transformer for High-Resolution GANs Long Zhao, Zizhao Zhang, Ting Chen, Dimitris Metaxas, Han Zhang

CVPR 2021 Learning View-Disentangled Human Pose Representation by Contrastive Cross-View Mutual Information Maximization Long Zhao, Yuxiao Wang, Jiaping Zhao, Liangzhe Yuan, Jennifer J. Sun, Florian Schroff, Hartwig Adam, Xi Peng, Dimitris Metaxas, Ting Liu

AAAI 2021 SMIL: Multimodal Learning with Severely Missing Modality Mengmeng Ma, Jian Ren, Long Zhao, Sergey Tulyakov, Cathy Wu, Xi Peng

NeurIPS 2020 Maximum-Entropy Adversarial Data Augmentation for Improved Generalization and Robustness Long Zhao, Ting Liu, Xi Peng, Dimitris Metaxas

NeurIPS 2019 Rethinking Kernel Methods for Node Representation Learning on Graphs Yu Tian, Long Zhao, Xi Peng, Dimitris Metaxas

IJCAI 2018 CR-GAN: Learning Complete Representations for Multi-View Generation Yu Tian, Xi Peng, Long Zhao, Shaoting Zhang, Dimitris N. Metaxas

ECCV 2018 Learning to Forecast and Refine Residual Motion for Image-to-Video Generation Long Zhao, Xi Peng, Yu Tian, Mubbasir Kapadia, Dimitris Metaxas

IJCAI 2016 Bridging Saliency Detection to Weakly Supervised Object Detection Based on Self-Paced Curriculum Learning Dingwen Zhang, Deyu Meng, Long Zhao, Junwei Han

CVPR 2015 Object Proposal by Multi-Branch Hierarchical Segmentation Chaoyang Wang, Long Zhao, Shuang Liang, Liqing Zhang, Jinyuan Jia, Yichen Wei