[카테고리:] Paper

Paper Review

Posted in Paper X-Review

[arXiv 2021] CLIP4Clip: An Empirical Study of CLIP for End to End Video Clip Retrieval

Abstract Multi-modal 분야의 Video-Text Retrieval 을 위한 CLIP4Clip 이라는 end-to-end 모델을 제안합니다. 본 논문의 메인 아이디어는, 기존의 image-language pretraining 모델인 CLIP 을 video-language 분야로 knowledge…

Continue Reading
Posted in Paper X-Review

[CVPR2021] Unsupervised Degradation Representation Learning for Blind Super-Resolution

이번에 소개드릴 논문은 CVPR2021 에서 발표된 Super resolution(SR)에 관한 논문입니다. 일단 이 논문을 찾게된 이유에 대해 먼저 말씀드리겠습니다. 전 현재 Thermal영상을 이용해서 Depth 를 생성하거나…

Continue Reading
Posted in Paper X-Review

STRNN: End-to-end deep learning framework for video partial copy detection

최근에는 비디오 정렬과 관련된 논문을 읽었습니다. 비디오 정렬도 논문을 검색해보면 크게 두가지로 나뉘어집니다. 영어로는 똑같은 alignment를 공유해서 사용하고는 있지만, Video Syncronization에 가까운 (비디오 프레임을 조정해서…

Continue Reading
Posted in Paper X-Review

[ICLR2022](Spotlight) How Do Vision Transformer Work?

네 이번에 리뷰할 논문은 Transformer와 CNN을 비교하여 각각의 특성을 분석한 논문을 가져왔습니다. 조원 연구원님이 공유해주셔서 알게되었는데 생각보다 매우 내용이 알차고 좋은 논문이었습니다. 얼핏 내용만 봤을…

Continue Reading
Posted in Paper X-Review

[CVPR2021] Motion-Focused Contrastive Learning of Video Representations

오늘 소개 드릴 논문은 Video Representation을 위해 Motion 정보에 초점을 맞춘 “Motion-Focused Contrastive Learning of Video Representation” 이라는 논문 입니다. 기존 여러 Video Representation 연구들에서는…

Continue Reading
Posted in Conference Paper X-Review

[2017 WACV] T-LESS: An RGB-D Dataset for 6D Pose Estimation of Texture-less Objects

본 논문은 현재 연구실에서 제안서 작업중인 프로젝트에서 서베이하던 중 발견한 6D Pose Estimation을 위해 제안된 데이터셋 논문으로 RGB-D카메라로 수십된 Textureless object 데이터들을 포함하고 있습니다. 해당…

Continue Reading
Posted in Paper X-Review

[TPAMI 2021] Background-Click Supervision for Temporal Action Localization

Before Review 이번 논문 리뷰는 Temporal Action Localization으로 준비했습니다. 그 중 Supervised 방식이 아니라, Weakly Supervised 방식으로 논문을 선택했습니다. 지난 CVPR에 작성했던 논문을 저널로 돌리는데…

Continue Reading
Posted in Paper X-Review

[WACV 2021] Temporal Context Aggregation for Video Retrieval with Contrastive Learning

비디오 검색 관련 논문 리뷰입니다! 오늘은 self-attention 기법을 사용하여 frame-level features 간의 시간 정보를 통합해서, 좀 더 긴 정보를 가진 video representation 을 학습해내는 framework,…

Continue Reading
Posted in Paper X-Review

Learning from Noisy Data with Robust Representation Learning

요약:본 논문은 모델의 representation 능력을 강인하게 하여 noise가 포함된 데이터에서 학습을 진행할 수 있도록한다. Introduction 기존의 DNNs은 noise에 민감하였다. 또한 real world data는 주로 noise가…

Continue Reading
Posted in Paper X-Review

[CVPR 2021]Semi-Supervised Semantic Segmentation with Cross Pseudo Supervision

Abstract labeled와 unlabeled 데이터를 모두 탐색하여 semi-supervised semantic segmentation문제를 연구한다. consistency regularization 방식으로 동일한 입력 이미지에 대해 서로 다른 초기화된 두 segmentation 네트워크에 일관성을 부여하는…

Continue Reading