Shen, Xiaoqian

12 publications

ICML 2025 LongVU: Spatiotemporal Adaptive Compression for Long Video-Language Understanding Xiaoqian Shen, Yunyang Xiong, Changsheng Zhao, Lemeng Wu, Jun Chen, Chenchen Zhu, Zechun Liu, Fanyi Xiao, Balakrishnan Varadarajan, Florian Bordes, Zhuang Liu, Hu Xu, Hyunwoo J. Kim, Bilge Soran, Raghuraman Krishnamoorthi, Mohamed Elhoseiny, Vikas Chandra

CVPR 2025 StoryGPT-V: Large Language Models as Consistent Story Visualizers Xiaoqian Shen, Mohamed Elhoseiny

NeurIPS 2025 Vgent: Graph-Based Retrieval-Reasoning-Augmented Generation for Long Video Understanding Xiaoqian Shen, Wenxuan Zhang, Jun Chen, Mohamed Elhoseiny

ICCV 2025 WikiAutoGen: Towards Multi-Modal Wikipedia-Style Article Generation Zhongyu Yang, Jun Chen, Dannong Xu, Junjie Fei, Xiaoqian Shen, Liangbing Zhao, Chun-Mei Feng, Mohamed Elhoseiny

CVPR 2024 Adversarial Text to Continuous Image Generation Kilichbek Haydarov, Aashiq Muhamed, Xiaoqian Shen, Jovana Lazarevic, Ivan Skorokhodov, Chamuditha Jayanga Galappaththige, Mohamed Elhoseiny

ECCV 2024 Affective Visual Dialog: A Large-Scale Benchmark for Emotional Reasoning Based on Visually Grounded Conversations Kilichbek Haydarov, Xiaoqian Shen, Avinash Madasu, Mahmoud Salem, Li-Jia Li, Gamaleldin F Elsayed, Mohamed Elhoseiny

TMLR 2024 ChatGPT Asks, BLIP-2 Answers: Automatic Questioning Towards Enriched Visual Descriptions Deyao Zhu, Jun Chen, Kilichbek Haydarov, Xiaoqian Shen, Wenxuan Zhang, Mohamed Elhoseiny

ECCV 2024 Goldfish: Vision-Language Understanding of Arbitrarily Long Videos Kirolos Ataallah, Xiaoqian Shen, Eslam mohamed Abdelrahman, Essam Sleiman, Mingchen Zhuge, Jian Ding, Deyao Zhu, Jürgen Schmidhuber, Mohamed Elhoseiny

ICLR 2024 MiniGPT-4: Enhancing Vision-Language Understanding with Advanced Large Language Models Deyao Zhu, Jun Chen, Xiaoqian Shen, Xiang Li, Mohamed Elhoseiny

ICCV 2023 HRS-Bench: Holistic, Reliable and Scalable Benchmark for Text-to-Image Models Eslam Mohamed Bakr, Pengzhan Sun, Xiaoqian Shen, Faizan Farooq Khan, Li Erran Li, Mohamed Elhoseiny

CVPR 2023 MoStGAN-V: Video Generation with Temporal Motion Styles Xiaoqian Shen, Xiang Li, Mohamed Elhoseiny

ECCV 2022 Exploring Hierarchical Graph Representation for Large-Scale Zero-Shot Image Classification Kai Yi, Xiaoqian Shen, Yunhao Gou, Mohamed Elhoseiny