Wu, Shengqiong

21 publications

ICML 2025 $\mathcal{Vista}\mathcal{DPO}$: Video Hierarchical Spatial-Temporal Direct Preference Optimization for Large Video Models Haojian Huang, Haodong Chen, Shengqiong Wu, Meng Luo, Jinlan Fu, Xinya Du, Hanwang Zhang, Hao Fei

AAAI 2025 Combating Multimodal LLM Hallucination via Bottom-up Holistic Reasoning Shengqiong Wu, Hao Fei, Liangming Pan, William Yang Wang, Shuicheng Yan, Tat-Seng Chua

NeurIPS 2025 JavisGPT: A Unified Multi-Modal LLM for Sounding-Video Comprehension and Generation Kai Liu, Jungang Li, Yuchong Sun, Shengqiong Wu, Jianzhang Gao, Daoan Zhang, Wei Zhang, Sheng Jin, Sicheng Yu, Geng Zhan, Jiayi Ji, Fan Zhou, Liang Zheng, Shuicheng Yan, Hao Fei, Tat-Seng Chua

CVPR 2025 Learning 4D Panoptic Scene Graph Generation from Rich 2D Visual Scene Shengqiong Wu, Hao Fei, Jingkang Yang, Xiangtai Li, Juncheng Li, Hanwang Zhang, Tat-seng Chua

ICML 2025 On Path to Multimodal Generalist: General-Level and General-Bench Hao Fei, Yuan Zhou, Juncheng Li, Xiangtai Li, Qingshan Xu, Bobo Li, Shengqiong Wu, Yaoting Wang, Junbao Zhou, Jiahao Meng, Qingyu Shi, Zhiyuan Zhou, Liangtao Shi, Minghe Gao, Daoan Zhang, Zhiqi Ge, Siliang Tang, Kaihang Pan, Yaobo Ye, Haobo Yuan, Tao Zhang, Weiming Wu, Tianjie Ju, Zixiang Meng, Shilin Xu, Liyu Jia, Wentao Hu, Meng Luo, Jiebo Luo, Tat-Seng Chua, Shuicheng Yan, Hanwang Zhang

ICLR 2025 Towards Semantic Equivalence of Tokenization in Multimodal LLM Shengqiong Wu, Hao Fei, Xiangtai Li, Jiayi Ji, Hanwang Zhang, Tat-Seng Chua, Shuicheng Yan

CVPR 2025 Universal Scene Graph Generation Shengqiong Wu, Hao Fei, Tat-seng Chua

CVPR 2024 Dysen-VDM: Empowering Dynamics-Aware Text-to-Video Diffusion with LLMs Hao Fei, Shengqiong Wu, Wei Ji, Hanwang Zhang, Tat-Seng Chua

ICML 2024 NExT-GPT: Any-to-Any Multimodal LLM Shengqiong Wu, Hao Fei, Leigang Qu, Wei Ji, Tat-Seng Chua

NeurIPS 2024 OMG-LLaVA: Bridging Image-Level, Object-Level, Pixel-Level Reasoning and Understanding Tao Zhang, Xiangtai Li, Hao Fei, Haobo Yuan, Shengqiong Wu, Shunping Ji, Chen Change Loy, Shuicheng Yan

ICML 2024 Video-of-Thought: Step-by-Step Video Reasoning from Perception to Cognition Hao Fei, Shengqiong Wu, Wei Ji, Hanwang Zhang, Meishan Zhang, Mong-Li Lee, Wynne Hsu

NeurIPS 2024 Vitron: A Unified Pixel-Level Vision LLM for Understanding, Generating, Segmenting, Editing Hao Fei, Shengqiong Wu, Hanwang Zhang, Tat-Seng Chua, Shuicheng Yan

NeurIPS 2023 Imagine That! Abstract-to-Intricate Text-to-Image Synthesis with Scene Graph Hallucination Diffusion Shengqiong Wu, Hao Fei, Hanwang Zhang, Tat-Seng Chua

IJCAI 2022 Conversational Semantic Role Labeling with Predicate-Oriented Latent Graph Hao Fei, Shengqiong Wu, Meishan Zhang, Yafeng Ren, Donghong Ji

IJCAI 2022 Global Inference with Explicit Syntactic and Discourse Structures for Dialogue-Level Relation Extraction Hao Fei, Jingye Li, Shengqiong Wu, Chenliang Li, Donghong Ji, Fei Li

IJCAI 2022 Inheriting the Wisdom of Predecessors: A Multiplex Cascade Framework for Unified Aspect-Based Sentiment Analysis Hao Fei, Fei Li, Chenliang Li, Shengqiong Wu, Jingye Li, Donghong Ji

NeurIPS 2022 LasUIE: Unifying Information Extraction with Latent Adaptive Structure-Aware Generative Language Model Hao Fei, Shengqiong Wu, Jingye Li, Bobo Li, Fei Li, Libo Qin, Meishan Zhang, Min Zhang, Tat-Seng Chua

AAAI 2022 Mastering the Explicit Opinion-Role Interaction: Syntax-Aided Neural Transition System for Unified Opinion Role Labeling Shengqiong Wu, Hao Fei, Fei Li, Meishan Zhang, Yijiang Liu, Chong Teng, Donghong Ji

ICML 2022 Matching Structure for Dual Learning Hao Fei, Shengqiong Wu, Yafeng Ren, Meishan Zhang

AAAI 2022 Unified Named Entity Recognition as Word-Word Relation Classification Jingye Li, Hao Fei, Jiang Liu, Shengqiong Wu, Meishan Zhang, Chong Teng, Donghong Ji, Fei Li

IJCAI 2021 Learn from Syntax: Improving Pair-Wise Aspect and Opinion Terms Extraction with Rich Syntactic Knowledge Shengqiong Wu, Hao Fei, Yafeng Ren, Donghong Ji, Jingye Li