Category: Paper
Paper Review
[CVPR2018] InLoc: Indoor Visual Localization with Dense Matching and View Synthesis
리뷰에 앞서 간단하게 해당 논문에 대해 소개하자면 large scale indoor dataset (InLoc)과 large scale indoor visual localization에 대해서도 제안을 했습니다. 이번 x-review로 InLoc을 결정한 이유는…
[ICCV 2019] Learning with Average Precision: Training Image Retrieval with a Listwise Loss
Image Retrieval Tesk를 하다보니 Triplet loss 외에 어떠한 loss가 최근 Metric learning으로 나오고 있나 싶어서 서칭하다 보니 작년 ICCV 에 R2D2 저자의 좋은 논문이 있어서…
Pedestrian Detection: The Elephant In The Room
실험부분에 대해서는 도표에 대한 설명이 주를 이루고있어 생략하고 있습니다. 본 논문을 읽으면서 도표를 이해하시는것을 추천하며 주말동안 도표에 따른 설명부분도 추가하겠습니다. https://arxiv.org/abs/2003.08799 Abstract 보행자은 매우 중요한…
PARTICULAR OBJECT RETRIEVAL WITH INTEGRAL MAX-POOLING OF CNN ACTIVATIONS (R-MAX)
논문 요약 : CNN을 통해 search와 re-ranking을 했다. (Oxford5k와 Paris6K datasets으로 검증) Main idea CNN을 통해서 multiple image region을 추론할때 re-feed 없이 encode한다. Max-pooling을 사용한다….
[TPAMI 2018] Fine-tuning CNN Image Retrieval with No Human Annotation
해당 논문은 CVPR 2019 workshop – Google Landmark Challenge 상위 수상작들 대부분이 사용한 방법을 제시한 논문입니다. 특히 trainable Pooling인 GeM(Generalize-mean Pooling)을 제안한 논문으로 한번쯤 정리하면…
[ECCV 2016]NetVLAD: CNN architecture for weakly supervised place recognition
영상만으로 위치를 인식하는 place recognition에서 현재까지 활발히 활용되고 있는 NetVLAD입니다. 기존 VLAD 와 BoW, FV 등 영상을 대표적으로 표현할 수 있는 Global Descriptor를 생성하는 모델로…
[CVPR2019] High-level Semantic Feature Detection: A New Perspective for Pedestrian Detection
[github] https://github.com/liuwei16/CSP 컨셉은 간단하다. 이미지의 입력에서 보행자의 Center Point와 Scale을 찾아서 박스를 그리는 모델이다. Anchor-free object detection의 방법이다. Preliminary CNN기반 Object Detector는 Backbone network에 의존하는…
[Explainable AI]Interpretable Text-to-Image Synthesis with Hierarchical Semantic Layout Generation
이미지와 text 매칭에 관련한 논문이다. 기존의 방식은 텍스트와 이미지를 직접 매칭 했다면, 이 제안 방식은 위의 그림에서 확인할 수 있듯이 먼저 box generation으로 위치를 매칭…
Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories
with The Pyramid Match Kernel: Discriminative Classification with Sets of Image Features Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories 는…
[CVPR2019] D2-Net: A Trainable CNN for Joint Detection and Description of Local Features
전통적으로 SIFT와 같은 알고리즘은 이미지에서 distinctive한 point를 “detect” 한 후 이 point들의 descriptor를 뽑는 “describe” 순서의 과정을 거쳤습니다. 그러나 이러한 방법을 사용할 시, descriptor의 경우…
안녕하세요, 영규님 좋은 리뷰 감사합니다. 리뷰를 읽으며 특히 인상 깊었던 점은, 단일 이미지로부터 로봇의 action뿐 아니라 visual observation까지 포함된 시퀀스를…