[일:] 2021년 08월 09일
[CVPR2021] Spatiotemporal Contrastive Video Representation Learning
해당 논문은 spatio, temporal 정보를 이용한 video augmentation을 통해 contrastive learning을 진행한는 방식을 소개한 논문이다. Temporal Augmentation하나의 비디오에서 두개의 clip을 positive pair로 사용하는 방식이다. 이때…
[2019]Towards Scene Understanding: Unsupervised Monocular Depth Estimation with Semantic-aware Representation
이 승현 08/09/2021 Leave a Comment on [2019]Towards Scene Understanding: Unsupervised Monocular Depth Estimation with Semantic-aware Representation
제가 이번에 리뷰할 논문도 depth estimation에 semantic segmentation을 이용하여 scene을 조금 더 잘 이해하기 위한 논문입니다. 우선 인간의 경우 depth를 추정할 때 geometric 단서와 semantic…
[ICML 2018] CyCADA: Cycle-Consistent Adversarial Domain Adaptation
홍 주영 08/09/2021 Leave a Comment on [ICML 2018] CyCADA: Cycle-Consistent Adversarial Domain Adaptation
이번에 제가 리뷰할 논문은 저번주에 리뷰한 논문( ADDA: Adversarial Discriminative Domain Adaptation )의 동일 저자의 후속 연구입니다. ADDA를 기반으로 작성된 논문으로 저번주 리뷰를 함께 읽으면…
Understanding SSIM
Pixel Level prediction 방법론에서 영상과 영상을 비교할때 제일 많이 사용되고 있는 방법론인 SSIM을 좀 더 자세히 이해하고 문제를 찾기 위해서 이 논문을 읽게 되었습니다. Self…
[CVPR2021] T2VLAD: Global-Local Sequence Alignment for Text-Video Retrieval
이전부터 컴퓨터 비전에서는 특정 Center의 의미를 부여하고 local descriptor를 할당해 global descriptor를 기술하는 VLAD 기반 방법론들이 좋은 성능을 보였었습니다. 딥러닝이 발달하기 시작하며, Center까지 학습하는 NetVLAD라는…
최신 댓글