[일:] 2023년 12월 01일

Posted in Paper X-Review

[CVPR 2023] Clover: Towards A Unified Video-Language Alignment and Fusion Model

이 논문의 주요 키워드 Universal Video-Language Pre-training Multi-modal Fusion & Alignment Semantic Enhanced Masked Language Modeling 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Multi-modal contrastive…

Continue Reading