Tang, Siliang

56 publications

CVPR 2025 AnyEdit: Mastering Unified High-Quality Image Editing for Any Idea Qifan Yu, Wei Chow, Zhongqi Yue, Kaihang Pan, Yang Wu, Xiaoyang Wan, Juncheng Li, Siliang Tang, Hanwang Zhang, Yueting Zhuang

ICCV 2025 Benchmarking Multimodal CoT Reward Model Stepwise by Visual Program Minghe Gao, Xuqi Liu, Zhongqi Yue, Yang Wu, Shuang Chen, Juncheng Li, Siliang Tang, Fei Wu, Tat-Seng Chua, Yueting Zhuang

ICML 2025 Boosting Virtual Agent Learning and Reasoning: A Step-Wise, Multi-Dimensional, and Generalist Reward Model with Benchmark Bingchen Miao, Yang Wu, Minghe Gao, Qifan Yu, Wendong Bu, Wenqiao Zhang, Yunfei Li, Siliang Tang, Tat-Seng Chua, Juncheng Li

AISTATS 2025 Choice Is What Matters After Attention Chenhan Fu, Guoming Wang, Juncheng Li, Rongxing Lu, Siliang Tang

NeurIPS 2025 Counterfactual Evolution of Multimodal Datasets via Visual Programming Minghe Gao, Zhongqi Yue, Wenjie Yan, Yihao Hu, Wei Ji, Siliang Tang, Jun Xiao, Tat-Seng Chua, Yueting Zhuang, Juncheng Li

NeurIPS 2025 EvolvedGRPO: Unlocking Reasoning in LVLMs via Progressive Instruction Evolution Zhebei Shen, Qifan Yu, Juncheng Li, Wei Ji, Qizhi Chen, Siliang Tang, Yueting Zhuang

CVPR 2025 Generative Multimodal Pretraining with Discrete Diffusion Timestep Tokens Kaihang Pan, Wang Lin, Zhongqi Yue, Tenglong Ao, Liyu Jia, Wei Zhao, Juncheng Li, Siliang Tang, Hanwang Zhang

ICML 2025 HealthGPT: A Medical Large Vision-Language Model for Unifying Comprehension and Generation via Heterogeneous Knowledge Adaptation Tianwei Lin, Wenqiao Zhang, Sijing Li, Yuqian Yuan, Binhe Yu, Haoyuan Li, Wanggui He, Hao Jiang, Mengze Li, Song Xiaohui, Siliang Tang, Jun Xiao, Hui Lin, Yueting Zhuang, Beng Chin Ooi

ICCV 2025 Iris: Breaking GUI Complexity with Adaptive Focus and Self-Refining Zhiqi Ge, Juncheng Li, Xinglei Pang, Minghe Gao, Kaihang Pan, Wang Lin, Hao Fei, Wenqiao Zhang, Siliang Tang, Yueting Zhuang

NeurIPS 2025 Janus-Pro-R1: Advancing Collaborative Visual Comprehension and Generation via Reinforcement Learning Kaihang Pan, Yang Wu, Wendong Bu, Kai Shen, Juncheng Li, Yingting Wang, Liyunfei, Siliang Tang, Jun Xiao, Fei Wu, ZhaoHang, Yueting Zhuang

IJCAI 2025 Logic Distillation: Learning from Code Function by Function for Decision-Making Tasks Dong Chen, Shilin Zhang, Fei Gao, Yueting Zhuang, Siliang Tang, Qidong Liu, Mingliang Xu

NeurIPS 2025 MERIT: Multilingual Semantic Retrieval with Interleaved Multi-Condition Query Wei Chow, Yuan Gao, Linfeng Li, Xian Wang, Qi Xu, Hang Song, Lingdong Kong, Ran Zhou, Yi Zeng, Yidong Cai, Botian Jiang, Shilin Xu, Jiajunzhang, Minghui Qiu, Xiangtai Li, Tianshu Yang, Siliang Tang, Juncheng Li

ICCV 2025 Mastering Collaborative Multi-Modal Data Selection: A Focus on Informativeness, Uniqueness, and Representativeness Qifan Yu, Zhebei Shen, Zhongqi Yue, Yang Wu, Bosheng Qin, Wenqiao Zhang, Yunfei Li, Juncheng Li, Siliang Tang, Yueting Zhuang

ICML 2025 On Path to Multimodal Generalist: General-Level and General-Bench Hao Fei, Yuan Zhou, Juncheng Li, Xiangtai Li, Qingshan Xu, Bobo Li, Shengqiong Wu, Yaoting Wang, Junbao Zhou, Jiahao Meng, Qingyu Shi, Zhiyuan Zhou, Liangtao Shi, Minghe Gao, Daoan Zhang, Zhiqi Ge, Siliang Tang, Kaihang Pan, Yaobo Ye, Haobo Yuan, Tao Zhang, Weiming Wu, Tianjie Ju, Zixiang Meng, Shilin Xu, Liyu Jia, Wentao Hu, Meng Luo, Jiebo Luo, Tat-Seng Chua, Shuicheng Yan, Hanwang Zhang

CVPR 2025 STEP: Enhancing Video-LLMs' Compositional Reasoning by Spatio-Temporal Graph-Guided Self-Training Haiyi Qiu, Minghe Gao, Long Qian, Kaihang Pan, Qifan Yu, Juncheng Li, Wenjie Wang, Siliang Tang, Yueting Zhuang, Tat-Seng Chua

ICCV 2025 The Best of Both Worlds: Integrating Language Models and Diffusion Models for Video Generation Aoxiong Yin, Xu Tan, Kai Shen, Yichong Leng, Xinyu Zhou, Juncheng Li, Siliang Tang

ICML 2025 What Limits Virtual Agent Application? OmniBench: A Scalable Multi-Dimensional Benchmark for Essential Virtual Agent Capabilities Wendong Bu, Yang Wu, Qifan Yu, Minghe Gao, Bingchen Miao, Zhenkui Zhang, Kaihang Pan, Yunfei Li, Mengze Li, Wei Ji, Juncheng Li, Siliang Tang, Yueting Zhuang

ICML 2024 Auto-Encoding Morph-Tokens for Multimodal LLM Kaihang Pan, Siliang Tang, Juncheng Li, Zhaoyu Fan, Wei Chow, Shuicheng Yan, Tat-Seng Chua, Yueting Zhuang, Hanwang Zhang

CVPR 2024 DIEM: Decomposition-Integration Enhancing Multimodal Insights Xinyi Jiang, Guoming Wang, Junhao Guo, Juncheng Li, Wenqiao Zhang, Rongxing Lu, Siliang Tang

AAAI 2024 Data Shunt: Collaboration of Small and Large Models for Lower Costs and Better Performance Dong Chen, Yueting Zhuang, Shuo Zhang, Jinfeng Liu, Su Dong, Siliang Tang

IJCAI 2024 Efficient Tuning and Inference for Large Language Models on Textual Graphs Yun Zhu, Yaoke Wang, Haizhou Shi, Siliang Tang

ICLR 2024 Fine-Tuning Multimodal LLMs to Follow Zero-Shot Demonstrative Instructions Juncheng Li, Kaihang Pan, Zhiqi Ge, Minghe Gao, Wei Ji, Wenqiao Zhang, Tat-Seng Chua, Siliang Tang, Hanwang Zhang, Yueting Zhuang

CVPR 2024 HalluciDoctor: Mitigating Hallucinatory Toxicity in Visual Instruction Data Qifan Yu, Juncheng Li, Longhui Wei, Liang Pang, Wentao Ye, Bosheng Qin, Siliang Tang, Qi Tian, Yueting Zhuang

ICML 2024 Momentor: Advancing Video Large Language Model with Fine-Grained Temporal Reasoning Long Qian, Juncheng Li, Yu Wu, Yaobo Ye, Hao Fei, Tat-Seng Chua, Yueting Zhuang, Siliang Tang

ICML 2024 NaturalSpeech 3: Zero-Shot Speech Synthesis with Factorized Codec and Diffusion Models Zeqian Ju, Yuancheng Wang, Kai Shen, Xu Tan, Detai Xin, Dongchao Yang, Eric Liu, Yichong Leng, Kaitao Song, Siliang Tang, Zhizheng Wu, Tao Qin, Xiangyang Li, Wei Ye, Shikun Zhang, Jiang Bian, Lei He, Jinyu Li, Sheng Zhao

CVPR 2024 Revisiting the Domain Shift and Sample Uncertainty in Multi-Source Active Domain Transfer Wenqiao Zhang, Zheqi Lv, Hao Zhou, Jia-Wei Liu, Juncheng Li, Mengze Li, Yunfei Li, Dongping Zhang, Yueting Zhuang, Siliang Tang

NeurIPS 2024 Towards Unified Multimodal Editing with Enhanced Knowledge Collaboration Kaihang Pan, Zhaoyu Fan, Juncheng Li, Qifan Yu, Hao Fei, Siliang Tang, Richang Hong, Hanwang Zhang, Qianru Sun

NeurIPS 2024 Unified Generative and Discriminative Training for Multi-Modal Large Language Models Wei Chow, Juncheng Li, Qifan Yu, Kaihang Pan, Hao Fei, Zhiqi Ge, Shuai Yang, Siliang Tang, Hanwang Zhang, Qianru Sun

ICML 2023 Continual Vision-Language Representation Learning with Off-Diagonal Information Zixuan Ni, Longhui Wei, Siliang Tang, Yueting Zhuang, Qi Tian

ICCV 2023 Gradient-Regulated Meta-Prompt Learning for Generalizable Vision-Language Models Juncheng Li, Minghe Gao, Longhui Wei, Siliang Tang, Wenqiao Zhang, Mengze Li, Wei Ji, Qi Tian, Tat-Seng Chua, Yueting Zhuang

AAAI 2023 KICE: A Knowledge Consolidation and Expansion Framework for Relation Extraction Yilin Lu, Xiaoqiang Wang, Haofeng Yang, Siliang Tang

ICCV 2023 Learning in Imperfect Environment: Multi-Label Classification with Long-Tailed Distribution and Partial Labels Wenqiao Zhang, Changshuo Liu, Lingze Zeng, Bengchin Ooi, Siliang Tang, Yueting Zhuang

IJCAI 2023 SmartBERT: A Promotion of Dynamic Early Exiting Mechanism for Accelerating BERT Inference Boren Hu, Yun Zhu, Jiacheng Li, Siliang Tang

ICCV 2023 Visually-Prompted Language Model for Fine-Grained Scene Graph Generation in an Open World Qifan Yu, Juncheng Li, Yu Wu, Siliang Tang, Wei Ji, Yueting Zhuang

CVPR 2022 Compositional Temporal Grounding with Structured Variational Cross-Graph Correspondence Learning Juncheng Li, Junlin Xie, Long Qian, Linchao Zhu, Siliang Tang, Fei Wu, Yi Yang, Yueting Zhuang, Xin Eric Wang

NeurIPS 2022 Fine-Grained Semantically Aligned Vision-Language Pre-Training Juncheng Li, Xin He, Longhui Wei, Long Qian, Linchao Zhu, Lingxi Xie, Yueting Zhuang, Qi Tian, Siliang Tang

CVPR 2022 Learning to Learn by Jointly Optimizing Neural Architecture and Weights Yadong Ding, Yu Wu, Chengyue Huang, Siliang Tang, Yi Yang, Longhui Wei, Yueting Zhuang, Qi Tian

AAAI 2022 On the Efficacy of Small Self-Supervised Contrastive Models Without Distillation Signals Haizhou Shi, Youcai Zhang, Siliang Tang, Wenjie Zhu, Yaqian Li, Yandong Guo, Yueting Zhuang

IJCAI 2022 RoSA: A Robust Self-Aligned Framework for Node-Node Graph Contrastive Learning Yun Zhu, Jianhao Guo, Fei Wu, Siliang Tang

ICML 2022 Robust Meta-Learning with Sampling Noise and Label Noise via Eigen-Reptile Dong Chen, Lingfei Wu, Siliang Tang, Xiao Yun, Bo Long, Yueting Zhuang

ICCV 2021 Adaptive Hierarchical Graph Reasoning with Semantic Coherence for Video-and-Language Inference Juncheng Li, Siliang Tang, Linchao Zhu, Haochen Shi, Xuanwen Huang, Fei Wu, Yi Yang, Yueting Zhuang

AAAI 2021 Consensus Graph Representation Learning for Better Grounded Image Captioning Wenqiao Zhang, Haochen Shi, Siliang Tang, Jun Xiao, Qiang Yu, Yueting Zhuang

AAAI 2021 Disentangled Motif-Aware Graph Learning for Phrase Grounding Zongshen Mu, Siliang Tang, Jie Tan, Qiang Yu, Yueting Zhuang

AAAI 2021 Empower Distantly Supervised Relation Extraction with Collaborative Adversarial Training Tao Chen, Haochen Shi, Liyuan Liu, Siliang Tang, Jian Shao, Zhigang Chen, Yueting Zhuang

CVPRW 2021 Grounded, Controllable and Debiased Image Completion with Lexical Semantics Shengyu Zhang, Tan Jiang, Qinghao Huang, Ziqi Tan, Kun Kuang, Zhou Zhao, Siliang Tang, Jin Yu, Hongxia Yang, Yi Yang, Fei Wu

NeurIPS 2021 Learning to Generate Visual Questions with Noisy Supervision Shen Kai, Lingfei Wu, Siliang Tang, Yueting Zhuang, Zhen He, Zhuoye Ding, Yun Xiao, Bo Long

ICCV 2021 Semi-Supervised Active Learning for Semi-Supervised Models: Exploit Adversarial Examples with Graph-Based Virtual Labels Jiannan Guo, Haochen Shi, Yangyang Kang, Kun Kuang, Siliang Tang, Zhuoren Jiang, Changlong Sun, Fei Wu, Yueting Zhuang

IJCAI 2020 Alleviate Dataset Shift Problem in Fine-Grained Entity Typing with Virtual Adversarial Training Haochen Shi, Siliang Tang, Xiaotao Gu, Bo Chen, Zhigang Chen, Jian Shao, Xiang Ren

IJCAI 2020 Hierarchical Attention Based Spatial-Temporal Graph-to-Sequence Learning for Grounded Video Description Kai Shen, Lingfei Wu, Fangli Xu, Siliang Tang, Jun Xiao, Yueting Zhuang

CVPRW 2020 NTIRE 2020 Challenge on Real Image Denoising: Dataset, Methods and Results Abdelrahman Abdelhamed, Mahmoud Afifi, Radu Timofte, Michael S. Brown, Yue Cao, Zhilu Zhang, Wangmeng Zuo, Xiaoling Zhang, Jiye Liu, Wendong Chen, Changyuan Wen, Meng Liu, Shuailin Lv, Yunchao Zhang, Zhihong Pan, Baopu Li, Teng Xi, Yanwen Fan, Xiyu Yu, Gang Zhang, Jingtuo Liu, Junyu Han, Errui Ding, Songhyun Yu, Bumjun Park, Jechang Jeong, Shuai Liu, Ziyao Zong, Nan Nan, Chenghua Li, Zengli Yang, Long Bao, Shuangquan Wang, Dongwoon Bai, Jungwon Lee, Youngjung Kim, Kyeongha Rho, Changyeop Shin, Sungho Kim, Pengliang Tang, Yiyun Zhao, Yuqian Zhou, Yuchen Fan, Thomas S. Huang, Zhihao Li, Nisarg A. Shah, Wei Liu, Qiong Yan, Yuzhi Zhao, Marcin Mozejko, Tomasz Latkowski, Lukasz Treszczotko, Michal Szafraniuk, Krzysztof Trojanowski, Yanhong Wu, Pablo Navarrete Michelini, Fengshuo Hu, Yunhua Lu, Sujin Kim, Wonjin Kim, Jaayeon Lee, Jang-Hwan Choi, Magauiya Zhussip, Azamat Khassenov, Jong Hyun Kim, Hwechul Cho, Priya Kansal, Sabari Nathan, Zhangyu Ye, Xiwen Lu, Yaqi Wu, Jiangxin Yang, Yanlong Cao, Siliang Tang, Yanpeng Cao, Matteo Maggioni, Ioannis Marras, Thomas Tanay, Gregory G. Slabaugh, Youliang Yan, Myungjoo Kang, Han-Soo Choi, Kyungmin Song, Shusong Xu, Xiaomu Lu, Tingniao Wang, Chunxia Lei, Bin Liu, Rajat Gupta, Vineet Kumar

AAAI 2020 Rethinking the Bottom-up Framework for Query-Based Video Localization Long Chen, Chujie Lu, Siliang Tang, Jun Xiao, Dong Zhang, Chilie Tan, Xiaolin Li

AAAI 2019 Cross-Relation Cross-Bag Attention for Distantly-Supervised Relation Extraction Yujin Yuan, Liyuan Liu, Siliang Tang, Zhongfei Zhang, Yueting Zhuang, Shiliang Pu, Fei Wu, Xiang Ren

CVPRW 2019 NTIRE 2019 Challenge on Real Image Super-Resolution: Methods and Results Jianrui Cai, Shuhang Gu, Radu Timofte, Lei Zhang, Xiao Liu, Yukang Ding, Dongliang He, Chao Li, Yi Fu, Shilei Wen, Ruicheng Feng, Jinjin Gu, Yu Qiao, Chao Dong, Dongwon Park, Se Young Chun, Sanghoon Yoon, Junhyung Kwak, Donghee Son, Syed Waqas Zamir, Aditya Arora, Salman H. Khan, Fahad Shahbaz Khan, Ling Shao, Zhengping Wei, Lei Liu, Hong Cai, Darui Li, Fujie Gao, Zheng Hui, Xiumei Wang, Xinbo Gao, Guoan Cheng, Ai Matsune, Qiuyu Li, Leilei Zhu, Huaijuan Zang, Shu Zhan, Yajun Qiu, Ruxin Wang, Jiawei Li, Yongcheng Jing, Mingli Song, Pengju Liu, Kai Zhang, Jingdong Liu, Jiye Liu, Hongzhi Zhang, Wangmeng Zuo, Wenyi Tang, Jing Liu, Youngjung Kim, Changyeop Shin, Minbeom Kim, Sungho Kim, Pablo Navarrete Michelini, Hanwen Liu, Dan Zhu, Xuan Xu, Xin Li, Furui Bai, Xiaopeng Sun, Lin Zha, Yuanfei Huang, Wen Lu, Yanpeng Cao, Du Chen, Zewei He, Anshun Sun, Siliang Tang, Hongfei Fan, Xiang Li, Guo Li, Wenjie Zhang, Yumei Zhang, Qingwen He, Jinghui Qin, Lishan Huang, Yukai Shi, Pengxu Wei, Wushao Wen, Liang Lin, Jun Yu, Guochen Xie, Mengyan Li, Rong Chen, Xiaotong Luo, Chen Hong, Yanyun Qu, Cuihua Li, Zhi-Song Liu, Li-Wen Wang, Chu-Tak Li, Can Zhao, Bowen Li, Chung-Chi Tsai, Shang-Chih Chuang, Joonhee Choi, Joonsoo Kim, Xiaoyun Jiang, Ze Pan, Qunbo Lv, Zheng Tan, Peidong He

CVPRW 2019 Orientation-Aware Deep Neural Network for Real Image Super-Resolution Du Chen, Zewei He, Anshun Sun, Jiangxin Yang, Yanlong Cao, Yanpeng Cao, Siliang Tang, Michael Ying Yang

IJCAI 2015 Sketch the Storyline with CHARCOAL: A Non-Parametric Approach Siliang Tang, Fei Wu, Si Li, Weiming Lu, Zhongfei Zhang, Yueting Zhuang

AAAI 2013 Supervised Nonnegative Tensor Factorization with Maximum-Margin Constraint Fei Wu, Xu Tan, Yi Yang, Dacheng Tao, Siliang Tang, Yueting Zhuang