Zhang, Gengyuan

7 publications

WACV 2025 CL-Cross VQA: A Continual Learning Benchmark for Cross-Domain Visual Question Answering Yao Zhang, Haokun Chen, Ahmed Frikha, Denis Krompass, Gengyuan Zhang, Jindong Gu, Volker Tresp

CVPR 2025 FedBiP: Heterogeneous One-Shot Federated Learning with Personalized Latent Diffusion Models Haokun Chen, Hang Li, Yao Zhang, Jinhe Bi, Gengyuan Zhang, Yueqi Zhang, Philip Torr, Jindong Gu, Denis Krompass, Volker Tresp

CVPR 2025 Localizing Events in Videos with Multimodal Queries Gengyuan Zhang, Mang Ling Ada Fok, Jialu Ma, Yan Xia, Daniel Cremers, Philip Torr, Volker Tresp, Jindong Gu

ICLRW 2025 Memory Helps, but Confabulation Misleads: Understanding Streaming Events in Videos with MLLMs Gengyuan Zhang, Mingcong Ding, Tong Liu, Yao Zhang, Volker Tresp

WACV 2025 Perceive Query & Reason: Enhancing Video QA with Question-Guided Temporal Queries Roberto Amoroso, Gengyuan Zhang, Rajat Koner, Lorenzo Baraldi, Rita Cucchiara, Volker Tresp

WACV 2024 Can Vision-Language Models Be a Good Guesser? Exploring VLMs for Times and Location Reasoning Gengyuan Zhang, Yurui Zhang, Kerui Zhang, Volker Tresp

ICCV 2023 Multi-Event Video-Text Retrieval Gengyuan Zhang, Jisen Ren, Jindong Gu, Volker Tresp