Category: Paper
Paper Review
[CVPR2018] InLoc: Indoor Visual Localization with Dense Matching and View Synthesis
리뷰에 앞서 간단하게 해당 논문에 대해 소개하자면 large scale indoor dataset (InLoc)과 large scale indoor visual localization에 대해서도 제안을 했습니다. 이번 x-review로 InLoc을 결정한 이유는…
[ICCV 2019] Learning with Average Precision: Training Image Retrieval with a Listwise Loss
Image Retrieval Tesk를 하다보니 Triplet loss 외에 어떠한 loss가 최근 Metric learning으로 나오고 있나 싶어서 서칭하다 보니 작년 ICCV 에 R2D2 저자의 좋은 논문이 있어서…
Pedestrian Detection: The Elephant In The Room
실험부분에 대해서는 도표에 대한 설명이 주를 이루고있어 생략하고 있습니다. 본 논문을 읽으면서 도표를 이해하시는것을 추천하며 주말동안 도표에 따른 설명부분도 추가하겠습니다. https://arxiv.org/abs/2003.08799 Abstract 보행자은 매우 중요한…
PARTICULAR OBJECT RETRIEVAL WITH INTEGRAL MAX-POOLING OF CNN ACTIVATIONS (R-MAX)
논문 요약 : CNN을 통해 search와 re-ranking을 했다. (Oxford5k와 Paris6K datasets으로 검증) Main idea CNN을 통해서 multiple image region을 추론할때 re-feed 없이 encode한다. Max-pooling을 사용한다….
[TPAMI 2018] Fine-tuning CNN Image Retrieval with No Human Annotation
해당 논문은 CVPR 2019 workshop – Google Landmark Challenge 상위 수상작들 대부분이 사용한 방법을 제시한 논문입니다. 특히 trainable Pooling인 GeM(Generalize-mean Pooling)을 제안한 논문으로 한번쯤 정리하면…
[ECCV 2016]NetVLAD: CNN architecture for weakly supervised place recognition
영상만으로 위치를 인식하는 place recognition에서 현재까지 활발히 활용되고 있는 NetVLAD입니다. 기존 VLAD 와 BoW, FV 등 영상을 대표적으로 표현할 수 있는 Global Descriptor를 생성하는 모델로…
[CVPR2019] High-level Semantic Feature Detection: A New Perspective for Pedestrian Detection
[github] https://github.com/liuwei16/CSP 컨셉은 간단하다. 이미지의 입력에서 보행자의 Center Point와 Scale을 찾아서 박스를 그리는 모델이다. Anchor-free object detection의 방법이다. Preliminary CNN기반 Object Detector는 Backbone network에 의존하는…
[Explainable AI]Interpretable Text-to-Image Synthesis with Hierarchical Semantic Layout Generation
이미지와 text 매칭에 관련한 논문이다. 기존의 방식은 텍스트와 이미지를 직접 매칭 했다면, 이 제안 방식은 위의 그림에서 확인할 수 있듯이 먼저 box generation으로 위치를 매칭…
Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories
with The Pyramid Match Kernel: Discriminative Classification with Sets of Image Features Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories 는…
[CVPR2019] D2-Net: A Trainable CNN for Joint Detection and Description of Local Features
전통적으로 SIFT와 같은 알고리즘은 이미지에서 distinctive한 point를 “detect” 한 후 이 point들의 descriptor를 뽑는 “describe” 순서의 과정을 거쳤습니다. 그러나 이러한 방법을 사용할 시, descriptor의 경우…
안녕하세요 인택님, 리뷰 잘 읽었습니다. AVQA task에 대해 조금이나마 알아갈 수 있는(?) 시간이었던 것 같습니다. 정말 간단한 질문 두 가지만…