[일:] 2023년 09월 23일
[ICLR 2023] CLIP-VIP: Adapting Pre-Trained Image-Text Model to Video-Language Alignment
rcvlab 09/23/2023 [ICLR 2023] CLIP-VIP: Adapting Pre-Trained Image-Text Model to Video-Language Alignment에 댓글 6개
이런 분들께 이 논문을 추천드립니다. CLIP과 같은 이미지 사전학습 모델을 대규모 비디오 데이터셋에서 추가 사전학습 시키는 방법이 궁굼하신 분 Subtitle과 Caption으로 다른 성질의 text 데이터…
[CVPR2023] Trap Attention: Monocular Depth Estimation with Manual Traps
이번에 소개드릴 논문은 CVPR2023에 게재된 단안 영상 깊이 추정 방법론입니다. 제가 주로 self-supervised learning 방법론들에 관심이 많아서 리뷰도 그 분야 위주로 보는 편이지만, 이번에 소개드릴…
최신 댓글