Song, Guanglu

37 publications

ICML 2025 EasyRef: Omni-Generalized Group Image Reference for Diffusion Models via Multimodal LLM Zhuofan Zong, Dongzhi Jiang, Bingqi Ma, Guanglu Song, Hao Shao, Dazhong Shen, Yu Liu, Hongsheng Li

ICLR 2025 MMSearch: Unveiling the Potential of Large Models as Multi-Modal Search Engines Dongzhi Jiang, Renrui Zhang, Ziyu Guo, Yanmin Wu, Jiayi Lei, Pengshuo Qiu, Pan Lu, Zehui Chen, Guanglu Song, Peng Gao, Yu Liu, Chunyuan Li, Hongsheng Li

CVPR 2025 See Further When Clear: Curriculum Consistency Model Yunpeng Liu, Boxiao Liu, Yi Zhang, Xingzhong Hou, Guanglu Song, Yu Liu, Haihang You

NeurIPS 2025 VividFace: A Robost and High-Fidelity Video Face Swapping Framework Hao Shao, Shulun Wang, Yang Zhou, Guanglu Song, Dailan He, Zhuofan Zong, Shuo Qin, Yu Liu, Hongsheng Li

ECCV 2024 Be-Your-Outpainter: Mastering Video Outpainting Through Input-Specific Adaptation Fu-Yun Wang, Xiaoshi Wu, Zhaoyang Huang, Xiaoyu Shi, Dazhong Shen, Guanglu Song, Yu Liu, Hongsheng Li

NeurIPS 2024 CoMat: Aligning Text-to-Image Diffusion Model with Image-to-Text Concept Matching Dongzhi Jiang, Guanglu Song, Xiaoshi Wu, Renrui Zhang, Dazhong Shen, Zhuofan Zong, Yu Liu, Hongsheng Li

ECCV 2024 Deep Reward Supervisions for Tuning Text-to-Image Diffusion Models Xiaoshi Wu, Yiming Hao, Manyuan Zhang, Keqiang Sun, Zhaoyang Huang, Guanglu Song, Yu Liu, Hongsheng Li

NeurIPS 2024 Exploring the Role of Large Language Models in Prompt Encoding for Diffusion Models Bingqi Ma, Zhuofan Zong, Guanglu Song, Hongsheng Li, Yu Liu

ECCV 2024 FouriScale: A Frequency Perspective on Training-Free High-Resolution Image Synthesis Linjiang Huang, Rongyao Fang, Aiping Zhang, Guanglu Song, Si Liu, Yu Liu, Hongsheng Li

CVPR 2024 LMDrive: Closed-Loop End-to-End Driving with Large Language Models Hao Shao, Yuxuan Hu, Letian Wang, Guanglu Song, Steven L. Waslander, Yu Liu, Hongsheng Li

NeurIPS 2024 MoVA: Adapting Mixture of Vision Experts to Multimodal Context Zhuofan Zong, Bingqi Ma, Dazhong Shen, Guanglu Song, Hao Shao, Dongzhi Jiang, Hongsheng Li, Yu Liu

NeurIPS 2024 Phased Consistency Models Fu-Yun Wang, Zhaoyang Huang, Alexander William Bergman, Dazhong Shen, Peng Gao, Michael Lingelbach, Keqiang Sun, Weikang Bian, Guanglu Song, Yu Liu, Xiaogang Wang, Hongsheng Li

CVPR 2024 Rethinking the Spatial Inconsistency in Classifier-Free Diffusion Guidance Dazhong Shen, Guanglu Song, Zeyue Xue, Fu-Yun Wang, Yu Liu

NeurIPSW 2024 Robo-MUTUAL: Robotic Multimodal Task Specification via Unimodal Learning Jianxiong Li, Zhihao Wang, Jinliang Zheng, Xiaoai Zhou, Guanming Wang, Guanglu Song, Yu Liu, Jingjing Liu, Ya-Qin Zhang, Junzhi Yu, Xianyuan Zhan

ECCV 2024 Three Things We Need to Know About Transferring Stable Diffusion to Visual Dense Prediciton Tasks Manyuan Zhang, Guanglu Song, Xiaoyu Shi, Yu Liu, Hongsheng Li

NeurIPS 2024 Visual CoT: Advancing Multi-Modal Language Models with a Comprehensive Dataset and Benchmark for Chain-of-Thought Reasoning Hao Shao, Shengju Qian, Han Xiao, Guanglu Song, Zhuofan Zong, Letian Wang, Yu Liu, Hongsheng Li

ECCV 2024 ZoLA: Zero-Shot Creative Long Animation Generation with Short Video Model Fu-Yun Wang, Zhaoyang Huang, Qiang Ma, Guanglu Song, Xudong Lu, Weikang Bian, Yijin Li, Yu Liu, Hongsheng Li

ICCV 2023 DETRs with Collaborative Hybrid Assignments Training Zhuofan Zong, Guanglu Song, Yu Liu

ICCV 2023 Decoupled DETR: Spatially Disentangling Localization and Classification for Improved End-to-End Object Detection Manyuan Zhang, Guanglu Song, Yu Liu, Hongsheng Li

ICCV 2023 Masked Autoencoders Are Stronger Knowledge Distillers Shanshan Lao, Guanglu Song, Boxiao Liu, Yu Liu, Yujiu Yang

NeurIPS 2023 RAPHAEL: Text-to-Image Generation via Large Mixture of Diffusion Paths Zeyue Xue, Guanglu Song, Qiushan Guo, Boxiao Liu, Zhuofan Zong, Yu Liu, Ping Luo

ICCV 2023 Temporal Enhanced Training of Multi-View 3D Object Detector via Historical Object Prediction Zhuofan Zong, Dongzhi Jiang, Guanglu Song, Zeyue Xue, Jingyong Su, Hongsheng Li, Yu Liu

ICCV 2023 UniKD: Universal Knowledge Distillation for Mimicking Homogeneous or Heterogeneous Object Detectors Shanshan Lao, Guanglu Song, Boxiao Liu, Yu Liu, Yujiu Yang

NeurIPS 2022 Large-Batch Optimization for Dense Visual Predictions: Training Faster R-CNN in 4.2 Minutes Zeyue Xue, Jianming Liang, Guanglu Song, Zhuofan Zong, Liang Chen, Yu Liu, Ping Luo

ECCV 2022 Rethinking Robust Representation Learning Under Fine-Grained Noisy Faces Bingqi Ma, Guanglu Song, Boxiao Liu, Yu Liu

ECCV 2022 Self-Slimmed Vision Transformer Zhuofan Zong, Kunchang Li, Guanglu Song, Yali Wang, Yu Qiao, Biao Leng, Yu Liu

ECCV 2022 Towards Robust Face Recognition with Comprehensive Search Manyuan Zhang, Guanglu Song, Yu Liu, Hongsheng Li

ICLR 2022 UniFormer: Unified Transformer for Efficient Spatial-Temporal Representation Learning Kunchang Li, Yali Wang, Gao Peng, Guanglu Song, Yu Liu, Hongsheng Li, Yu Qiao

ECCV 2022 UniNet: Unified Architecture Search with Convolution, Transformer, and MLP Jihao Liu, Xin Huang, Guanglu Song, Hongsheng Li, Yu Liu

ECCV 2022 Unifying Visual Perception by Dispersible Points Learning Jianming Liang, Guanglu Song, Biao Leng, Yu Liu

ICCVW 2021 Rectifying the Data Bias in Knowledge Distillation Boxiao Liu, Shenghan Zhang, Guanglu Song, Haihang You, Yu Liu

ICCV 2021 Switchable K-Class Hyperplanes for Noise-Robust Representation Learning Boxiao Liu, Guanglu Song, Manyuan Zhang, Haihang You, Yu Liu

ECCV 2020 Discriminability Distillation in Group Representation Learning Manyuan Zhang, Guanglu Song, Hang Zhou, Yu Liu

AAAI 2020 KPNet: Towards Minimal Face Detector Guanglu Song, Yu Liu, Yuhang Zang, Xiaogang Wang, Biao Leng, Qingsheng Yuan

ICCVW 2019 Towards Flops-Constrained Face Recognition Yu Liu, Guanglu Song, Manyuan Zhang, Jihao Liu, Yucong Zhou, Junjie Yan

AAAI 2018 Region-Based Quality Estimation Network for Large-Scale Person Re-Identification Guanglu Song, Biao Leng, Yu Liu, Congrui Hetang, Shaofan Cai

ECCV 2018 Transductive Centroid Projection for Semi-Supervised Large-Scale Recognition Yu Liu, Guanglu Song, Jing Shao, Xiao Jin, Xiaogang Wang