MODfinity: Unsupervised Domain Adaptation with Multimodal Information Flow Intertwining

Liu, Shanglin; Lv, Jianming; Kang, Jingdan; Zhang, Huaidong; Liang, Zequan; He, Shengfeng

doi:10.1109/CVPR52734.2025.00480

MODfinity: Unsupervised Domain Adaptation with Multimodal Information Flow Intertwining

Shanglin Liu, Jianming Lv, Jingdan Kang, Huaidong Zhang, Zequan Liang, Shengfeng He

CVPR 2025 pp. 5092-5101

doi:10.1109/CVPR52734.2025.00480 /cvpr/2025/liu2025cvpr-modfinity/

Abstract

Multimodal unsupervised domain adaptation leverages unlabeled data in the target domain to enhance multimodal systems continuously. While current state-of-the-art methods encourage interaction between sub-models of different modalities through pseudo-labeling and feature-level exchange, varying sample quality across modalities can lead to the propagation of inaccurate information, resulting in error accumulation. To address this, we propose Modal-Affinity Multimodal Domain Adaptation (MODfinity), a method that dynamically manages multimodal information flow through fine-grained control over teacher model selection, guiding information intertwining at both feature and label levels. By treating labels as an independent modality, MODfinity enables balanced performance assessment across modalities, employing a novel modal-affinity measurement to evaluate information quality. Additionally, we introduce a modal-affinity distillation technique to control sample-level information exchange, ensuring reliable multimodal interaction based on affinity evaluations within the feature space. Extensive experiments on three multimodal datasets demonstrate that our framework consistently outperforms state-of-the-art methods, particularly in high-noise environments.

PDF CVPR Semantic Scholar

Cite

Text

Liu et al. "MODfinity: Unsupervised Domain Adaptation with Multimodal Information Flow Intertwining." Conference on Computer Vision and Pattern Recognition, 2025. doi:10.1109/CVPR52734.2025.00480

Markdown

[Liu et al. "MODfinity: Unsupervised Domain Adaptation with Multimodal Information Flow Intertwining." Conference on Computer Vision and Pattern Recognition, 2025.](https://mlanthology.org/cvpr/2025/liu2025cvpr-modfinity/) doi:10.1109/CVPR52734.2025.00480

BibTeX

@inproceedings{liu2025cvpr-modfinity,
  title     = {{MODfinity: Unsupervised Domain Adaptation with Multimodal Information Flow Intertwining}},
  author    = {Liu, Shanglin and Lv, Jianming and Kang, Jingdan and Zhang, Huaidong and Liang, Zequan and He, Shengfeng},
  booktitle = {Conference on Computer Vision and Pattern Recognition},
  year      = {2025},
  pages     = {5092-5101},
  doi       = {10.1109/CVPR52734.2025.00480},
  url       = {https://mlanthology.org/cvpr/2025/liu2025cvpr-modfinity/}
}