InfoBridge: Balanced Multimodal Integration Through Conditional Dependency Modeling

Chenxin Li, Yifan Liu, Panwang Pan, Hengyu Liu, Xinyu Liu, Wuyang Li, Cheng Wang, Weihao Yu, Yiyang Lin, Yixuan Yuan

ICCV 2025 pp. 393-404

/iccv/2025/li2025iccv-infobridge/

Abstract

Developing systems that interpret diverse real-world signals remains a fundamental challenge in multimodal learning. Current approaches face significant obstacles from inherent modal heterogeneity. While existing methods attempt to enhance fusion through cross-modal alignment or interaction mechanisms, they often struggle to balance effective integration with preserving modality-specific information. We introduce InfoBridge, a novel framework grounded in conditional information maximization principles addressing these limitations. Our approach reframes multimodal fusion through two key innovations: (i) we formulate fusion as conditional mutual information optimization with integrated protective margin that simultaneously encourages cross-modal information sharing while safeguarding against over-fusion eliminating modal characteristics; and (ii) we enable fine-grained contextual fusion by leveraging modality-specific conditions to guide integration. Extensive evaluations across benchmarks demonstrate that InfoBridge consistently outperforms state-of-the-art multimodal architectures, establishing a principled approach that better captures complementary information across input signals. Project page: https://cuhk-aim-group.github.io/InfoBridge/.

PDF ICCV Semantic Scholar

Cite

Text

Li et al. "InfoBridge: Balanced Multimodal Integration Through Conditional Dependency Modeling." International Conference on Computer Vision, 2025.

Markdown

[Li et al. "InfoBridge: Balanced Multimodal Integration Through Conditional Dependency Modeling." International Conference on Computer Vision, 2025.](https://mlanthology.org/iccv/2025/li2025iccv-infobridge/)

BibTeX

@inproceedings{li2025iccv-infobridge,
  title     = {{InfoBridge: Balanced Multimodal Integration Through Conditional Dependency Modeling}},
  author    = {Li, Chenxin and Liu, Yifan and Pan, Panwang and Liu, Hengyu and Liu, Xinyu and Li, Wuyang and Wang, Cheng and Yu, Weihao and Lin, Yiyang and Yuan, Yixuan},
  booktitle = {International Conference on Computer Vision},
  year      = {2025},
  pages     = {393-404},
  url       = {https://mlanthology.org/iccv/2025/li2025iccv-infobridge/}
}