Song, Yibing

55 publications

NeurIPS 2025 $\textit{HiMaCon:}$ Discovering Hierarchical Manipulation Concepts from Unlabeled Multi-Modal Data Ruizhe Liu, Pei Zhou, Qian Luo, Li Sun, Jun Cen, Yibing Song, Yanchao Yang

CVPR 2025 A Stitch in Time Saves Nine: Small VLM Is a Precise Guidance for Accelerating Large VLMs Wangbo Zhao, Yizeng Han, Jiasheng Tang, Zhikai Li, Yibing Song, Kai Wang, Zhangyang Wang, Yang You

ICCV 2025 Advancing Textual Prompt Learning with Anchored Attributes Zheng Li, Yibing Song, Ming-Ming Cheng, Xiang Li, Jian Yang

ICLR 2025 AutoCGP: Closed-Loop Concept-Guided Policies from Unlabeled Demonstrations Pei Zhou, Ruizhe Liu, Qian Luo, Fan Wang, Yibing Song, Yanchao Yang

CVPR 2025 AvatarArtist: Open-Domain 4D Avatarization Hongyu Liu, Xuan Wang, Ziyu Wan, Yue Ma, Jingye Chen, Yanbo Fan, Yujun Shen, Yibing Song, Qifeng Chen

NeurIPS 2025 CoT-Lized Diffusion: Let's Reinforce T2I Generation Step-by-Step Zheyuan Liu, Munan Ning, Qihui Zhang, Shuo Yang, Zhongrui Wang, Yiwei Yang, Xianzhe Xu, Yibing Song, Weihua Chen, Fan Wang, Li Yuan

ICLR 2025 Dynamic Diffusion Transformer Wangbo Zhao, Yizeng Han, Jiasheng Tang, Kai Wang, Yibing Song, Gao Huang, Fan Wang, Yang You

CVPR 2025 Foley-Flow: Coordinated Video-to-Audio Generation with Masked Audio-Visual Alignment and Dynamic Conditional Flows Shentong Mo, Yibing Song

ICCV 2025 LLaVA-CoT: Let Vision Language Models Reason Step-by-Step Guowei Xu, Peng Jin, Ziang Wu, Hao Li, Yibing Song, Lichao Sun, Li Yuan

ICLR 2025 PiCO: Peer Review in LLMs Based on Consistency Optimization Kun-Peng Ning, Shuo Yang, Yuyang Liu, Jia-Yu Yao, Zhenhui Liu, Yonghong Tian, Yibing Song, Li Yuan

ICLR 2025 REMEDY: Recipe Merging Dynamics in Large Vision-Language Models Didi Zhu, Yibing Song, Tao Shen, Ziyu Zhao, Jinluan Yang, Min Zhang, Chao Wu

ICLR 2025 Re-Aligning Language to Visual Objects with an Agentic Workflow Yuming Chen, Jiangyan Feng, Haodong Zhang, Lijun Gong, Feng Zhu, Rui Zhao, Qibin Hou, Ming-Ming Cheng, Yibing Song

CVPR 2025 UPME: An Unsupervised Peer Review Framework for Multimodal Large Language Model Evaluation Qihui Zhang, Munan Ning, Zheyuan Liu, Yue Huang, Shuo Yang, Yanbo Wang, Jiayi Ye, Xiao Chen, Yibing Song, Li Yuan

NeurIPS 2024 Aligning Audio-Visual Joint Representations with an Agentic Workflow Shentong Mo, Yibing Song

NeurIPS 2024 Dynamic Tuning Towards Parameter and Inference Efficiency for ViT Adaptation Wangbo Zhao, Jiasheng Tang, Yizeng Han, Yibing Song, Kai Wang, Gao Huang, Fan Wang, Yang You

ICLR 2024 Image Inpainting via Iteratively Decoupled Probabilistic Modeling Wenbo Li, Xin Yu, Kun Zhou, Yibing Song, Zhe Lin

ICLR 2024 InstructDET: Diversifying Referring Object Detection with Generalized Instructions Ronghao Dang, Jiangyan Feng, Haodong Zhang, Chongjian Ge, Lin Song, Lijun Gong, Chengju Liu, Qijun Chen, Feng Zhu, Rui Zhao, Yibing Song

NeurIPS 2024 LFME: A Simple Framework for Learning from Multiple Experts in Domain Generalization Liang Chen, Yong Zhang, Yibing Song, Zhiqiang Shen, Lingqiao Liu

CVPR 2023 Advancing Visual Grounding with Scene Knowledge: Benchmark and Method Zhihong Chen, Ruifei Zhang, Yibing Song, Xiang Wan, Guanbin Li

ICCV 2023 Both Diverse and Realism Matter: Physical Attribute and Style Alignment for Rainy Image Generation Changfeng Yu, Shiming Chen, Yi Chang, Yibing Song, Luxin Yan

ICCV 2023 Bridging Vision and Language Encoders: Parameter-Efficient Tuning for Referring Image Segmentation Zunnan Xu, Zhihong Chen, Yong Zhang, Yibing Song, Xiang Wan, Guanbin Li

CVPR 2023 Delving StyleGAN Inversion for Image Editing: A Foundation Latent Space Viewpoint Hongyu Liu, Yibing Song, Qifeng Chen

ICCV 2023 DiffusionDet: Diffusion Model for Object Detection Shoufa Chen, Peize Sun, Yibing Song, Ping Luo

ICCV 2023 Domain Generalization via Rationale Invariance Liang Chen, Yong Zhang, Yibing Song, Anton van den Hengel, Lingqiao Liu

ICCV 2023 Efficient Video Action Detection with Token Dropout and Context Refinement Lei Chen, Zhan Tong, Yibing Song, Gangshan Wu, Limin Wang

ICML 2023 Evolving Semantic Prototype Improves Generative Zero-Shot Learning Shiming Chen, Wenjin Hou, Ziming Hong, Xiaohan Ding, Yibing Song, Xinge You, Tongliang Liu, Kun Zhang

ICLR 2023 Human MotionFormer: Transferring Human Motions with Vision Transformers Hongyu Liu, Xintong Han, Chenbin Jin, Lihui Qian, Huawei Wei, Zhe Lin, Faqiang Wang, Haoye Dong, Yibing Song, Jia Xu, Qifeng Chen

CVPR 2023 Improved Test-Time Adaptation for Domain Generalization Liang Chen, Yong Zhang, Yibing Song, Ying Shan, Lingqiao Liu

ICLR 2023 Soft Neighbors Are Positive Supporters in Contrastive Visual Representation Learning Chongjian Ge, Jiangliu Wang, Zhan Tong, Shoufa Chen, Yibing Song, Ping Luo

NeurIPS 2022 AdaptFormer: Adapting Vision Transformers for Scalable Visual Recognition Shoufa Chen, Chongjian Ge, Zhan Tong, Jiangliu Wang, Yibing Song, Jue Wang, Ping Luo

ICML 2022 DynaMixer: A Vision MLP Architecture with Dynamic Mixing Ziyu Wang, Wenhao Jiang, Yiming M Zhu, Li Yuan, Yibing Song, Wei Liu

ICLR 2022 EViT: Expediting Vision Transformers via Token Reorganizations Youwei Liang, Chongjian Ge, Zhan Tong, Yibing Song, Jue Wang, Pengtao Xie

NeurIPS 2022 OST: Improving Generalization of DeepFake Detection via One-Shot Test-Time Training Liang Chen, Yong Zhang, Yibing Song, Jue Wang, Lingqiao Liu

NeurIPS 2022 One Model to Edit Them All: Free-Form Text-Driven Image Manipulation with Semantic Modulations Yiming Zhu, Hongyu Liu, Yibing Song, Ziyang Yuan, Xintong Han, Chun Yuan, Qifeng Chen, Jue Wang

CVPR 2022 Self-Supervised Learning of Adversarial Example: Towards Good Generalizations for Deepfake Detection Liang Chen, Yong Zhang, Yibing Song, Lingqiao Liu, Jue Wang

NeurIPS 2022 VideoMAE: Masked Autoencoders Are Data-Efficient Learners for Self-Supervised Video Pre-Training Zhan Tong, Yibing Song, Jue Wang, Limin Wang

CVPR 2021 ArtFlow: Unbiased Image Style Transfer via Reversible Neural Flows Jie An, Siyu Huang, Yibing Song, Dejing Dou, Wei Liu, Jiebo Luo

CVPR 2021 DeFLOCNet: Deep Image Editing via Flexible Low-Level Controls Hongyu Liu, Ziyu Wan, Wei Huang, Yibing Song, Xintong Han, Jing Liao, Bin Jiang, Wei Liu

CVPR 2021 Disentangled Cycle Consistency for Highly-Realistic Virtual Try-on Chongjian Ge, Yibing Song, Yuying Ge, Han Yang, Wei Liu, Ping Luo

CVPR 2021 IoU Attack: Towards Temporally Coherent Black-Box Adversarial Attack for Visual Object Tracking Shuai Jia, Yibing Song, Chao Ma, Xiaokang Yang

CVPR 2021 PD-GAN: Probabilistic Diverse GAN for Image Inpainting Hongyu Liu, Ziyu Wan, Wei Huang, Yibing Song, Xintong Han, Jing Liao

CVPR 2021 Parser-Free Virtual Try-on via Distilling Appearance Flows Yuying Ge, Yibing Song, Ruimao Zhang, Chongjian Ge, Wei Liu, Ping Luo

NeurIPS 2021 Revitalizing CNN Attention via Transformers in Self-Supervised Visual Representation Learning Chongjian Ge, Youwei Liang, Yibing Song, Jianbo Jiao, Jue Wang, Ping Luo

ICLR 2021 Stabilized Medical Image Attacks Gege Qi, Lijun Gong, Yibing Song, Kai Ma, Yefeng Zheng

CVPR 2021 VideoMoCo: Contrastive Video Representation Learning with Temporally Adversarial Examples Tian Pan, Yibing Song, Tianyu Yang, Wenhao Jiang, Wei Liu

ECCV 2020 Rethinking Image Deraining via Rain Streaks and Vapors Yinglong Wang, Yibing Song, Chao Ma, Bing Zeng

ECCV 2020 Rethinking Image Inpainting via a Mutual Encoder-Decoder with Feature Equalizations Hongyu Liu, Bin Jiang, Yibing Song, Wei Huang, Chao Yang

ECCV 2020 Robust Tracking Against Adversarial Attacks Shuai Jia, Chao Ma, Yibing Song, Xiaokang Yang

NeurIPS 2018 Deep Attentive Tracking via Reciprocative Learning Shi Pu, Yibing Song, Chao Ma, Honggang Zhang, Ming-Hsuan Yang

ECCV 2018 Look Deeper into Depth: Monocular Depth Estimation with Semantic Booster and Attention-Driven Loss Jianbo Jiao, Ying Cao, Yibing Song, Rynson Lau

ICCV 2017 CREST: Convolutional Residual Learning for Visual Tracking Yibing Song, Chao Ma, Lijun Gong, Jiawei Zhang, Rynson W. H. Lau, Ming-Hsuan Yang

IJCAI 2017 Fast Preprocessing for Robust Face Sketch Synthesis Yibing Song, Jiawei Zhang, Linchao Bao, Qingxiong Yang

IJCAI 2017 Learning to Hallucinate Face Images via Component Generation and Enhancement Yibing Song, Jiawei Zhang, Shengfeng He, Linchao Bao, Qingxiong Yang

ECCV 2014 Real-Time Exemplar-Based Face Sketch Synthesis Yibing Song, Linchao Bao, Qingxiong Yang, Ming-Hsuan Yang

WACV 2014 Real-Time Video Decolorization Using Bilateral Filtering Yibing Song, Linchao Bao, Qingxiong Yang