Yin, Yuhui

7 publications

AAAI 2025 Bridge Diffusion Model: Bridge Chinese Text-to-Image Diffusion Model with English Communities Shanyuan Liu, Bo Cheng, Yuhang Ma, Liebucha Wu, Ao Ma, Xiaoyu Wu, Dawei Leng, Yuhui Yin

ICML 2025 FG-CLIP: Fine-Grained Visual and Textual Alignment Chunyu Xie, Bin Wang, Fanjing Kong, Jincheng Li, Dawei Liang, Gengshen Zhang, Dawei Leng, Yuhui Yin

AAAI 2025 IAA: Inner-Adaptor Architecture Empowers Frozen Large Language Model with Multimodal Capabilities Bin Wang, Chunyu Xie, Dawei Leng, Yuhui Yin

ICCV 2025 LMM-Det: Make Large Multimodal Models Excel in Object Detection Jincheng Li, Chunyu Xie, Ji Ao, Dawei Leng, Yuhui Yin

ICLR 2025 PT-T2I/V: An Efficient Proxy-Tokenized Diffusion Transformer for Text-to-Image/Video-Task Jing Wang, Ao Ma, Jiasong Feng, Dawei Leng, Yuhui Yin, Xiaodan Liang

ICCV 2025 PlanGen: Towards Unified Layout Planning and Image Generation in Auto-Regressive Vision Language Models Runze He, Bo Cheng, Yuhang Ma, Qingxiang Jia, Shanyuan Liu, Ao Ma, Xiaoyu Wu, Liebucha Wu, Dawei Leng, Yuhui Yin

NeurIPS 2024 HiCo: Hierarchical Controllable Diffusion Model for Layout-to-Image Generation Bo Cheng, Yuhang Ma, Liebucha Wu, Shanyuan Liu, Ao Ma, Xiaoyu Wu, Dawei Leng, Yuhui Yin