[일:] 2023년 12월 01일
[CVPR 2023] Clover: Towards A Unified Video-Language Alignment and Fusion Model
rcvlab 12/01/2023 [CVPR 2023] Clover: Towards A Unified Video-Language Alignment and Fusion Model에 댓글 2개
이 논문의 주요 키워드 Universal Video-Language Pre-training Multi-modal Fusion & Alignment Semantic Enhanced Masked Language Modeling 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Multi-modal contrastive…
최신 댓글