Tang, Yansong

59 publications

CVPR 2025 ATP-LLaVA: Adaptive Token Pruning for Large Vision Language Models Xubing Ye, Yukang Gan, Yixiao Ge, Xiao-Ping Zhang, Yansong Tang

ICCV 2025 AnyBimanual: Transferring Unimanual Policy for General Bimanual Manipulation Guanxing Lu, Tengbo Yu, Haoyuan Deng, Season Si Chen, Yansong Tang, Ziwei Wang

CVPR 2025 Coarse Correspondences Boost Spatial-Temporal Reasoning in Multimodal Language Model Benlin Liu, Yuhao Dong, Yiqin Wang, Zixian Ma, Yansong Tang, Luming Tang, Yongming Rao, Wei-Chiu Ma, Ranjay Krishna

NeurIPS 2025 DreamLight: Towards Harmonious and Consistent Image Relighting Yong Liu, Wenpeng Xiao, Qianqian Wang, Junlin Chen, Shiyin Wang, Yitong Wang, Xinglong Wu, Yansong Tang

CVPR 2025 FADE: Frequency-Aware Diffusion Model Factorization for Video Editing Yixuan Zhu, Haolin Wang, Shilin Ma, Wenliang Zhao, Yansong Tang, Lei Chen, Jie Zhou

ICCV 2025 Flash-VStream: Efficient Real-Time Understanding for Long Video Streams Haoji Zhang, Yiqin Wang, Yansong Tang, Yong Liu, Jiashi Feng, Xiaojie Jin

ICCV 2025 GWM: Towards Scalable Gaussian World Models for Robotic Manipulation Guanxing Lu, Baoxiong Jia, Puhao Li, Yixin Chen, Ziwei Wang, Yansong Tang, Siyuan Huang

ICLR 2025 InstaRevive: One-Step Image Enhancement via Dynamic Score Matching Yixuan Zhu, Haolin Wang, Ao Li, Wenliang Zhao, Yansong Tang, Jingxuan Niu, Lei Chen, Jie Zhou, Jiwen Lu

AAAI 2025 IteRPrimE: Zero-Shot Referring Image Segmentation with Iterative Grad-CAM Refinement and Primary Word Emphasis Yuji Wang, Jingchen Ni, Yong Liu, Chun Yuan, Yansong Tang

ICCV 2025 KV-Edit: Training-Free Image Editing for Precise Background Preservation Tianrui Zhu, Shiyi Zhang, Jiawei Shao, Yansong Tang

ICCV 2025 Momentum-GS: Momentum Gaussian Self-Distillation for High-Quality Large Scene Reconstruction Jixuan Fan, Wanhua Li, Yifei Han, Tianru Dai, Yansong Tang

CVPR 2025 SAM2-LOVE: Segment Anything Model 2 in Language-Aided Audio-Visual Scenes Yuji Wang, Haoran Xu, Yong Liu, Jiaze Li, Yansong Tang

ICCV 2025 ScoreHOI: Physically Plausible Reconstruction of Human-Object Interaction via Score-Guided Diffusion Ao Li, Jinpeng Liu, Yixuan Zhu, Yansong Tang

ICCV 2025 Stepping Out of Similar Semantic Space for Open-Vocabulary Segmentation Yong Liu, Song-Li Wu, Sule Bai, Jiahao Wang, Yitong Wang, Yansong Tang

ICLR 2025 ThinkBot: Embodied Instruction Following with Thought Chain Reasoning Guanxing Lu, Ziwei Wang, Changliu Liu, Jiwen Lu, Yansong Tang

CVPR 2025 VoCo-Llama: Towards Vision Compression with Large Language Models Xubing Ye, Yukang Gan, Xiaoke Huang, Yixiao Ge, Yansong Tang

ICLR 2025 WizardMath: Empowering Mathematical Reasoning for Large Language Models via Reinforced Evol-Instruct Haipeng Luo, Qingfeng Sun, Can Xu, Pu Zhao, Jian-Guang Lou, Chongyang Tao, Xiubo Geng, Qingwei Lin, Shifeng Chen, Yansong Tang, Dongmei Zhang

AAAI 2024 CoSTA: End-to-End Comprehensive Space-Time Entanglement for Spatio-Temporal Video Grounding Yaoyuan Liang, Xiao Liang, Yansong Tang, Zhao Yang, Ziran Li, Jingang Wang, Wenbo Ding, Shao-Lun Huang

CVPR 2024 DPMesh: Exploiting Diffusion Prior for Occluded Human Mesh Recovery Yixuan Zhu, Ao Li, Yansong Tang, Wenliang Zhao, Jie Zhou, Jiwen Lu

CVPR 2024 FlowIE: Efficient Image Enhancement via Rectified Flow Yixuan Zhu, Wenliang Zhao, Ao Li, Yansong Tang, Jie Zhou, Jiwen Lu

NeurIPS 2024 GaussianCube: A Structured and Explicit Radiance Representation for 3D Generative Modeling Bowen Zhang, Yiji Cheng, Jiaolong Yang, Chunyu Wang, Feng Zhao, Yansong Tang, Dong Chen, Baining Guo

NeurIPS 2024 GeoLRM: Geometry-Aware Large Reconstruction Model for High-Quality 3D Gaussian Generation Chubin Zhang, Hongliang Song, Yi Wei, Yu Chen, Jiwen Lu, Yansong Tang

ECCV 2024 Learning Dual-Level Deformable Implicit Representation for Real-World Scale Arbitrary Super-Resolution Zhiheng Li, Muheng Li, Jixuan Fan, Lei Chen, Yansong Tang, Jiwen Lu, Jie Zhou

AAAI 2024 Learning Multi-Scale Video-Text Correspondence for Weakly Supervised Temporal Article Gronding Wenjia Geng, Yong Liu, Lei Chen, Sujia Wang, Jie Zhou, Yansong Tang

CVPR 2024 MADTP: Multimodal Alignment-Guided Dynamic Token Pruning for Accelerating Vision-Language Transformer Jianjian Cao, Peng Ye, Shengze Li, Chong Yu, Yansong Tang, Jiwen Lu, Tao Chen

ECCV 2024 ManiGaussian: Dynamic Gaussian Splatting for Multi-Task Robotic Manipulation Guanxing Lu, Shiyi Zhang, Ziwei Wang, Changliu Liu, Jiwen Lu, Yansong Tang

ECCV 2024 MotionLCM: Real-Time Controllable Motion Generation via Latent Consistency Model Wenxun Dai, Ling-Hao Chen, Jingbo Wang, Jinpeng Liu, Bo Dai, Yansong Tang

CVPR 2024 Narrative Action Evaluation with Prompt-Guided Multimodal Interaction Shiyi Zhang, Sule Bai, Guangyi Chen, Lei Chen, Jiwen Lu, Junle Wang, Yansong Tang

CVPR 2024 Once for Both: Single Stage of Importance and Sparsity Search for Vision Transformer Compression Hancheng Ye, Chong Yu, Peng Ye, Renqiu Xia, Yansong Tang, Jiwen Lu, Tao Chen, Bo Zhang

CVPR 2024 Open-Vocabulary Segmentation with Semantic-Assisted Calibration Yong Liu, Sule Bai, Guanbin Li, Yitong Wang, Yansong Tang

CVPR 2024 PTM-VQA: Efficient Video Quality Assessment Leveraging Diverse PreTrained Models from the Wild Kun Yuan, Hongbo Liu, Mading Li, Muyi Sun, Ming Sun, Jiachao Gong, Jinhua Hao, Chao Zhou, Yansong Tang

ECCV 2024 Plan, Posture and Go: Towards Open-Vocabulary Text-to-Motion Generation Jinpeng Liu, Wenxun Dai, Chunyu Wang, Yiji Cheng, Yansong Tang, Xin Tong

ECCV 2024 Post-Training Quantization with Progressive Calibration and Activation Relaxing for Text-to-Image Diffusion Models Siao Tang, Xin Wang, Hong Chen, Chaoyu Guan, Zewen Wu, Yansong Tang, Wenwu Zhu

NeurIPS 2024 Q-VLM: Post-Training Quantization for Large Vision-Language Models Changyuan Wang, Ziwei Wang, Xiuwei Xu, Yansong Tang, Jie Zhou, Jiwen Lu

ECCV 2024 RodinHD: High-Fidelity 3D Avatar Generation with Diffusion Models Bowen Zhang, Yiji Cheng, Chunyu Wang, Ting Zhang, Jiaolong Yang, Yansong Tang, Feng Zhao, Dong Chen, Baining Guo

CVPR 2024 Segment and Caption Anything Xiaoke Huang, Jianfeng Wang, Yansong Tang, Zheng Zhang, Han Hu, Jiwen Lu, Lijuan Wang, Zicheng Liu

CVPR 2024 Towards Accurate Post-Training Quantization for Diffusion Models Changyuan Wang, Ziwei Wang, Xiuwei Xu, Yansong Tang, Jie Zhou, Jiwen Lu

CVPR 2024 Universal Segmentation at Arbitrary Granularity with Language Instruction Yong Liu, Cairong Zhang, Yitong Wang, Jiahao Wang, Yujiu Yang, Yansong Tang

NeurIPS 2024 WizardArena: Post-Training Large Language Models via Simulated Offline Chatbot Arena Haipeng Luo, Qingfeng Sun, Can Xu, Pu Zhao, Qingwei Lin, Jianguang Lou, Shifeng Chen, Yansong Tang, Weizhu Chen

CVPR 2023 FLAG3D: A 3D Fitness Activity Dataset with Language Instruction Yansong Tang, Jinpeng Liu, Aoyang Liu, Bin Yang, Wenxun Dai, Yongming Rao, Jiwen Lu, Jie Zhou, Xiu Li

ICCV 2023 FineDance: A Fine-Grained Choreography Dataset for 3D Full Body Dance Generation Ronghui Li, Junfan Zhao, Yachao Zhang, Mingyang Su, Zeping Ren, Han Zhang, Yansong Tang, Xiu Li

ICLR 2023 GAIN: On the Generalization of Instructional Action Understanding Junlong Li, Guangyi Chen, Yansong Tang, Jinan Bao, Kun Zhang, Jie Zhou, Jiwen Lu

ICCV 2023 Global Knowledge Calibration for Fast Open-Vocabulary Segmentation Kunyang Han, Yong Liu, Jun Hao Liew, Henghui Ding, Jiajun Liu, Yitong Wang, Yansong Tang, Yujiu Yang, Jiashi Feng, Yao Zhao, Yunchao Wei

IJCAI 2023 HOI-Aware Adaptive Network for Weakly-Supervised Action Segmentation Runzhong Zhang, Suchen Wang, Yueqi Duan, Yansong Tang, Yue Zhang, Yap-Peng Tan

CVPR 2023 LOGO: A Long-Form Video Dataset for Group Action Quality Assessment Shiyi Zhang, Wenxun Dai, Sujia Wang, Xiangwei Shen, Jiwen Lu, Jie Zhou, Yansong Tang

NeurIPS 2023 MCUFormer: Deploying Vision Tranformers on Microcontrollers with Limited Memory Yinan Liang, Ziwei Wang, Xiuwei Xu, Yansong Tang, Jie Zhou, Jiwen Lu

NeurIPS 2023 SOC: Semantic-Assisted Object Cluster for Referring Video Object Segmentation Zhuoyan Luo, Yicheng Xiao, Yong Liu, Shuyan Li, Yitong Wang, Yansong Tang, Xiu Li, Yujiu Yang

AAAI 2023 Semantics-Aware Dynamic Localization and Refinement for Referring Image Segmentation Zhao Yang, Jiaqi Wang, Yansong Tang, Kai Chen, Hengshuang Zhao, Philip H. S. Torr

ICCV 2023 Skip-Plan: Procedure Planning in Instructional Videos via Condensed Action Space Learning Zhiheng Li, Wenjia Geng, Muheng Li, Lei Chen, Yansong Tang, Jiwen Lu, Jie Zhou

ICCV 2023 Tem-Adapter: Adapting Image-Text Pretraining for Video Question Answer Guangyi Chen, Xiao Liu, Guangrun Wang, Kun Zhang, Philip H.S. Torr, Xiao-Ping Zhang, Yansong Tang

CVPR 2022 BNV-Fusion: Dense 3D Reconstruction Using Bi-Level Neural Volume Fusion Kejie Li, Yansong Tang, Victor Adrian Prisacariu, Philip H.S. Torr

CVPR 2022 DenseCLIP: Language-Guided Dense Prediction with Context-Aware Prompting Yongming Rao, Wenliang Zhao, Guangyi Chen, Yansong Tang, Zheng Zhu, Guan Huang, Jie Zhou, Jiwen Lu

ECCV 2022 Global Spectral Filter Memory Network for Video Object Segmentation Yong Liu, Ran Yu, Jiahao Wang, Xinyuan Zhao, Yitong Wang, Yansong Tang, Yujiu Yang

NeurIPS 2022 HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions Yongming Rao, Wenliang Zhao, Yansong Tang, Jie Zhou, Ser Nam Lim, Jiwen Lu

CVPR 2022 LAVT: Language-Aware Vision Transformer for Referring Image Segmentation Zhao Yang, Jiaqi Wang, Yansong Tang, Kai Chen, Hengshuang Zhao, Philip H.S. Torr

NeurIPS 2022 OrdinalCLIP: Learning Rank Prompts for Language-Guided Ordinal Regression Wanhua Li, Xiaoke Huang, Zheng Zhu, Yansong Tang, Xiu Li, Jie Zhou, Jiwen Lu

ECCV 2022 ScalableViT: Rethinking the Context-Oriented Generalization of Vision Transformer Rui Yang, Hailong Ma, Jie Wu, Yansong Tang, Xuefeng Xiao, Min Zheng, Xiu Li

CVPR 2022 Semantic-Aware Auto-Encoders for Self-Supervised Representation Learning Guangrun Wang, Yansong Tang, Liang Lin, Philip H.S. Torr

CVPR 2022 YouMVOS: An Actor-Centric Multi-Shot Video Object Segmentation Dataset Donglai Wei, Siddhant Kharbanda, Sarthak Arora, Roshan Roy, Nishant Jain, Akash Palrecha, Tanav Shah, Shray Mathur, Ritik Mathur, Abhijay Kemkar, Anirudh Chakravarthy, Zudi Lin, Won-Dong Jang, Yansong Tang, Song Bai, James Tompkin, Philip H.S. Torr, Hanspeter Pfister