Yue, Xiangyu

46 publications

ICCV 2025 Breaking the Encoder Barrier for Seamless Video-Language Understanding Handong Li, Yiyuan Zhang, Longteng Guo, Xiangyu Yue, Jing Liu

ICCV 2025 CMT: A Cascade MAR with Topology Predictor for Multimodal Conditional CAD Generation Jianyu Wu, Yizhou Wang, Xiangyu Yue, Xinzhu Ma, Jinyang Guo, Dongzhan Zhou, Wanli Ouyang, Shixiang Tang

ICCV 2025 Chimera: Improving Generalist Model with Domain-Specific Experts Tianshuo Peng, Mingsheng Li, Jiakang Yuan, Hongbin Zhou, Renqiu Xia, Renrui Zhang, Lei Bai, Song Mao, Bin Wang, Aojun Zhou, Botian Shi, Tao Chen, Bo Zhang, Xiangyu Yue

CVPR 2025 DiTCtrl: Exploring Attention Control in Multi-Modal Diffusion Transformer for Tuning-Free Multi-Prompt Longer Video Generation Minghong Cai, Xiaodong Cun, Xiaoyu Li, Wenze Liu, Zhaoyang Zhang, Yong Zhang, Ying Shan, Xiangyu Yue

ICML 2025 Divide and Conquer: Grounding LLMs as Efficient Decision-Making Agents via Offline Hierarchical Reinforcement Learning Zican Hu, Wei Liu, Xiaoye Qu, Xiangyu Yue, Chunlin Chen, Zhi Wang, Yu Cheng

ICCV 2025 FairGen: Enhancing Fairness in Text-to-Image Diffusion Models via Self-Discovering Latent Directions Yilei Jiang, Wei-Hong Li, Yiyuan Zhang, Minghong Cai, Xiangyu Yue

NeurIPS 2025 Fira: Can We Achieve Full-Rank Training of LLMs Under Low-Rank Constraint? Xi Chen, Kaituo Feng, Changsheng Li, Xunhao Lai, Xiangyu Yue, Ye Yuan, Guoren Wang

ICCV 2025 From Easy to Hard: Progressive Active Learning Framework for Infrared Small Target Detection with Single Point Supervision Chuang Yu, Jinmiao Zhao, Yunpeng Liu, Sicheng Zhao, Yimian Dai, Xiangyu Yue

ICCV 2025 HypDAE: Hyperbolic Diffusion Autoencoders for Hierarchical Few-Shot Image Generation Lingxiao Li, Kaixuan Fan, Boqing Gong, Xiangyu Yue

ICCV 2025 Learning Beyond Still Frames: Scaling Vision-Language Models with Video Yiyuan Zhang, Handong Li, Jing Liu, Xiangyu Yue

NeurIPS 2025 Learning to Integrate Diffusion ODEs by Averaging the Derivatives Wenze Liu, Xiangyu Yue

NeurIPS 2025 Native-Resolution Image Synthesis ZiDong Wang, Lei Bai, Xiangyu Yue, Wanli Ouyang, Yiyuan Zhang

CVPR 2025 RAP: Retrieval-Augmented Personalization for Multimodal Large Language Models Haoran Hao, Jiaming Han, Changsheng Li, Yu-Feng Li, Xiangyu Yue

NeurIPS 2025 ReSim: Reliable World Simulation for Autonomous Driving Jiazhi Yang, Kashyap Chitta, Shenyuan Gao, Long Chen, Yuqian Shao, Xiaosong Jia, Hongyang Li, Andreas Geiger, Xiangyu Yue, Li Chen

CoRL 2025 Reflective Planning: Vision-Language Models for Multi-Stage Long-Horizon Robotic Manipulation Yunhai Feng, Jiaming Han, Zhuoran Yang, Xiangyu Yue, Sergey Levine, Jianlan Luo

ICCV 2025 Scaling Omni-Modal Pretraining with Multimodal Context: Advancing Universal Representation Learning Across Modalities Yiyuan Zhang, Handong Li, Jing Liu, Xiangyu Yue

CVPR 2025 SemGeoMo: Dynamic Contextual Human Motion Generation with Semantic and Geometric Guidance Peishan Cong, Ziyi Wang, Yuexin Ma, Xiangyu Yue

ICCV 2025 SynFER: Towards Boosting Facial Expression Recognition with Synthetic Data Xilin He, Cheng Luo, Xiaole Xian, Bing Li, Muhammad Haris Khan, Zongyuan Ge, Weicheng Xie, Siyang Song, Linlin Shen, Bernard Ghanem, Xiangyu Yue

AAAI 2025 Training Matting Models Without Alpha Labels Wenze Liu, Zixuan Ye, Hao Lu, Zhiguo Cao, Xiangyu Yue

CVPR 2025 UniSTD: Towards Unified Spatio-Temporal Learning Across Diverse Disciplines Chen Tang, Xinzhu Ma, Encheng Su, Xiufeng Song, Xiaohong Liu, Wei-Hong Li, Lei Bai, Wanli Ouyang, Xiangyu Yue

ICCV 2025 Unleashing Vecset Diffusion Model for Fast Shape Generation Zeqiang Lai, Yunfei Zhao, Zibo Zhao, Haolin Liu, Fuyun Wang, Huiwen Shi, Xianghui Yang, Qingxiang Lin, Jingwei Huang, Yuhong Liu, Jie Jiang, Chunchao Guo, Xiangyu Yue

ICLR 2025 Unposed Sparse Views Room Layout Reconstruction in the Age of Pretrain Model Yaxuan Huang, Xili Dai, Jianan Wang, Xianbiao Qi, Yixing Yuan, Xiangyu Yue

NeurIPS 2025 Video-R1: Reinforcing Video Reasoning in MLLMs Kaituo Feng, Kaixiong Gong, Bohao Li, Zonghao Guo, Yibing Wang, Tianshuo Peng, Junfei Wu, Xiaoying Zhang, Benyou Wang, Xiangyu Yue

NeurIPS 2025 Vision as a Dialect: Unifying Visual Understanding and Generation via Text-Aligned Representations Jiaming Han, Hao Chen, Yang Zhao, Hanyu Wang, Qi Zhao, Ziyan Yang, Hao He, Xiangyu Yue, Lu Jiang

NeurIPS 2024 $\textit{Bifr\"ost}$: 3D-Aware Image Compositing with Language Instructions Lingxiao Li, Kaixiong Gong, Weihong Li, Xili Dai, Tao Chen, Xiaojun Yuan, Xiangyu Yue

ECCV 2024 Better Regression Makes Better Test-Time Adaptive 3D Object Detection Jiakang Yuan, Bo Zhang, Kaixiong Gong, Xiangyu Yue, Botian Shi, Yu Qiao, Tao Chen

NeurIPS 2024 EMR-Merging: Tuning-Free High-Performance Model Merging Chenyu Huang, Peng Ye, Tao Chen, Tong He, Xiangyu Yue, Wanli Ouyang

NeurIPS 2024 Lumina-Next : Making Lumina-T2X Stronger and Faster with Next-DiT Le Zhuo, Ruoyi Du, Han Xiao, Yangguang Li, Dongyang Liu, Rongjie Huang, Wenze Liu, Xiangyang Zhu, Fu-Yun Wang, Zhanyu Ma, Xu Luo, Zehan Wang, Kaipeng Zhang, Lirui Zhao, Si Liu, Xiangyu Yue, Wanli Ouyang, Yu Qiao, Hongsheng Li, Peng Gao

CVPR 2024 Multimodal Pathway: Improve Transformers with Irrelevant Data from Other Modalities Yiyuan Zhang, Xiaohan Ding, Kaixiong Gong, Yixiao Ge, Ying Shan, Xiangyu Yue

CVPR 2024 OneLLM: One Framework to Align All Modalities with Language Jiaming Han, Kaixiong Gong, Yiyuan Zhang, Jiaqi Wang, Kaipeng Zhang, Dahua Lin, Yu Qiao, Peng Gao, Xiangyu Yue

ECCV 2024 Online Vectorized HD mAP Construction Using Geometry Zhixin Zhang, Yiyuan Zhang, Xiaohan Ding, Fusheng Jin, Xiangyu Yue

CVPR 2024 UniRepLKNet: A Universal Perception Large-Kernel ConvNet for Audio Video Point Cloud Time-Series and Image Recognition Xiaohan Ding, Yiyuan Zhang, Yixiao Ge, Sijie Zhao, Lin Song, Xiangyu Yue, Ying Shan

ICCV 2023 Beating Backdoor Attack at Its Own Game Min Liu, Alberto Sangiovanni-Vincentelli, Xiangyu Yue

ICCV 2023 Preventing Zero-Shot Transfer Degradation in Continual Learning of Vision-Language Models Zangwei Zheng, Mingyuan Ma, Kai Wang, Ziheng Qin, Xiangyu Yue, Yang You

MLJ 2023 Scenic: A Language for Scenario Specification and Data Generation Daniel J. Fremont, Edward Kim, Tommaso Dreossi, Shromona Ghosh, Xiangyu Yue, Alberto L. Sangiovanni-Vincentelli, Sanjit A. Seshia

ICCV 2023 Space Engage: Collaborative Space Supervision for Contrastive-Based Semi-Supervised Semantic Segmentation Changqi Wang, Haoyu Xie, Yuhui Yuan, Chong Fu, Xiangyu Yue

AAAI 2022 Conditional Synthetic Data Generation for Robust Machine Learning Applications with Limited Pandemic Data Hari Prasanna Das, Ryan Tran, Japjot Singh, Xiangyu Yue, Geoffrey H. Tison, Alberto L. Sangiovanni-Vincentelli, Costas J. Spanos

ECCV 2022 Image2Point: 3D Point-Cloud Understanding with 2D Image Pretrained Models Chenfeng Xu, Shijia Yang, Tomer Galanti, Bichen Wu, Xiangyu Yue, Bohan Zhai, Wei Zhan, Peter Vajda, Kurt Keutzer, Masayoshi Tomizuka

ECCV 2022 RankSeg: Adaptive Pixel Classification with Image Category Ranking for Segmentation Haodi He, Yuhui Yuan, Xiangyu Yue, Han Hu

WACV 2022 Self-Supervised Pretraining Improves Self-Supervised Pretraining Colorado J Reed, Xiangyu Yue, Ani Nrusimha, Sayna Ebrahimi, Vivek Vijaykumar, Richard Mao, Bo Li, Shanghang Zhang, Devin Guillory, Sean Metzger, Kurt Keutzer, Trevor Darrell

NeurIPSW 2021 Domain-Agnostic Test-Time Adaptation by Prototypical Training with Auxiliary Data Qilong Wu, Xiangyu Yue, Alberto Sangiovanni-Vincentelli

CVPR 2021 Prototypical Cross-Domain Self-Supervised Learning for Few-Shot Unsupervised Domain Adaptation Xiangyu Yue, Zangwei Zheng, Shanghang Zhang, Yang Gao, Trevor Darrell, Kurt Keutzer, Alberto Sangiovanni Vincentelli

ICCV 2021 Unsupervised Point Cloud Pre-Training via Occlusion Completion Hanchen Wang, Qi Liu, Xiangyu Yue, Joan Lasenby, Matt J. Kusner

NeurIPS 2019 Multi-Source Domain Adaptation for Semantic Segmentation Sicheng Zhao, Bo Li, Xiangyu Yue, Yang Gu, Pengfei Xu, Runbo Hu, Hua Chai, Kurt Keutzer

IJCAI 2018 Counterexample-Guided Data Augmentation Tommaso Dreossi, Shromona Ghosh, Xiangyu Yue, Kurt Keutzer, Alberto L. Sangiovanni-Vincentelli, Sanjit A. Seshia

CVPRW 2018 SqueezeNext: Hardware-Aware Neural Network Design Amir Gholami, Kiseok Kwon, Bichen Wu, Zizheng Tai, Xiangyu Yue, Peter H. Jin, Sicheng Zhao, Kurt Keutzer