[일:] 2023년 09월 23일

Posted in Paper X-Review

[ICLR 2023] CLIP-VIP: Adapting Pre-Trained Image-Text Model to Video-Language Alignment

이런 분들께 이 논문을 추천드립니다. CLIP과 같은 이미지 사전학습 모델을 대규모 비디오 데이터셋에서 추가 사전학습 시키는 방법이 궁굼하신 분 Subtitle과 Caption으로 다른 성질의 text 데이터…

Continue Reading
Posted in Conference X-Review

[CVPR2023] Trap Attention: Monocular Depth Estimation with Manual Traps

이번에 소개드릴 논문은 CVPR2023에 게재된 단안 영상 깊이 추정 방법론입니다. 제가 주로 self-supervised learning 방법론들에 관심이 많아서 리뷰도 그 분야 위주로 보는 편이지만, 이번에 소개드릴…

Continue Reading