[월:] 2020년 11월
SuperThermal: Matching Thermal as Visible Through Thermal Feature Exploration
이번 리뷰 글은 논문 리뷰 연습을 위해 읽은 논문으로 해당 X-review는 예약설정을 통해 올릴 예정입니다. 해당 논문의 주제는 논문 제목에도 나와있듯이 열화상 영상의 feature extraction…
[arXiv2019] ViSiL: Fine-grained Spatio-Temporal Video Similarity Learning
해당 논문은 video들 간의 similarity를 계산하기 위해 방법론인 ViSiL을 제안한 논문입니다. 주로 video-to-video retrieval시 video의 전체 frame에서 spatio-temporal한 정보를 추출하고 이를 aggregate하여 하나의 vector로 만들게…
[NeurIPS 2017]”Attention is all you need” – Transformer
현재 이미지 분류 분야에서 SOTA를 달성한 “AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE “(ViT)는 NLP의 “Attention is all you need”…
Particular object retrieval with integral max-pooling of CNN activations
NAVER Europe에서 공개한 AP loss 코드를 살펴보니, feature를 추출하는 모델이 R-MAC 인것을 확인할 수 있었습니다. 처음보는 이름의 모델이라 해당 모델의 논문을 찾아 읽어보았습니다. R-MAC을 설명하기…
Data Augmentation
이번주차에서는 Data augmentation에 대해서 다루어보겠습니다. Data augmentation을 통해 엄청난 성능의 향상 효과를 가져오기는 사실상 힘들지만, 그래도 어느정도 robust성을 향상시키는데 도움을 줄 수 있습니다. 특히나 training…
[CVPR2020]Unsupervised Learning from Video with Deep Neural Embeddings
Chengxu Zhuang Tianwei She Alex Andonian Max Sobol Mark Daniel Yamins Stanford University MIT Introduction 1.비디오의 temporal sequence엔 (그것이 무질서한 형태로 존재했을 대 보다 더…
[ICCV2019] Digging Into Self-Supervised Monocular Depth Estimation
1. Introduction RGB를 Depth로 변환 시킬때는 그림 1 의 왼쪽 처럼 Texture copy 가 발생 한다. 이 Texture Copy는 RGB의 특성을 Depth가 따라 가는 것으로…
NLP- RNN, LSTM, Seq2Seq, Attention Mechanism
해당 리뷰는 현재 Image Classification task에서 SOTA를 달성한 ViT를 이해와 attention에 대한 이해, ViT를 보고 타 task와 vision task의 접목이 연구 방향성과 결과에 큰 영향을…
Visual Localization methods list
해당 글은 Visual Localization 관련 방법론들을 survey하면서 다 읽지는 않았지만 찾아놓은 논문들 리스트입니다. 1. 2D Image-based Localization 영상 기반 위치인식 방식(또는 Image retrieval methods)은 쿼리…
[CVPR2020]BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation
BlendMask는 빠른 segmentation을 가능하게 한 [ICCV2019]YOLACT 을 안다면 빠르게 이해할 수 있을 것이다. YOLACT 은 Real-time Instance Segmentation 즉, instance segmentation 문제를 real-time으로 해결하기 위한…
최신 댓글