[일:] 2024년 01월 12일

Posted in Paper X-Review

[CVPR 2022] Unsupervised Vision-and-Language Pre-training via Retrieval-based Multi-Granular Alignment

이 논문의 주요 키워드 Weakly Supervised Vision-Language Pre-training (UVLP, WVLP) Non-parallel Image-Text Data 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Multi-modal contrastive learning에 대한 이해…

Continue Reading