[카테고리:] Paper
Paper Review
Scale-aware Fast R-CNN for Pedestrian Detection
해당 논문은 보행자가 속하는 박스의 pixels의 scale에 따라 다른 경향성을 나타나는 feature를 사용해서 학습결과를 조금더 좋게 만들어 보자는 컨셉이다. 아래의 사진을 보면 육안으로 확인 가능하다….
Character Region Awareness for Text Detection
Youngmin Baek, Bado Lee, Dongyoon Han, Sangdoo Yun, and Hwalsuk Lee∗ Clova AI Research, NAVER Corp. Abstract 이전 논문들은 엄격한 word-level로 박스를 만드는 것이 때문에…
[CVPR2018] InLoc: Indoor Visual Localization with Dense Matching and View Synthesis
리뷰에 앞서 간단하게 해당 논문에 대해 소개하자면 large scale indoor dataset (InLoc)과 large scale indoor visual localization에 대해서도 제안을 했습니다. 이번 x-review로 InLoc을 결정한 이유는…
[ICCV 2019] Learning with Average Precision: Training Image Retrieval with a Listwise Loss
Image Retrieval Tesk를 하다보니 Triplet loss 외에 어떠한 loss가 최근 Metric learning으로 나오고 있나 싶어서 서칭하다 보니 작년 ICCV 에 R2D2 저자의 좋은 논문이 있어서…
Pedestrian Detection: The Elephant In The Room
실험부분에 대해서는 도표에 대한 설명이 주를 이루고있어 생략하고 있습니다. 본 논문을 읽으면서 도표를 이해하시는것을 추천하며 주말동안 도표에 따른 설명부분도 추가하겠습니다. https://arxiv.org/abs/2003.08799 Abstract 보행자은 매우 중요한…
PARTICULAR OBJECT RETRIEVAL WITH INTEGRAL MAX-POOLING OF CNN ACTIVATIONS (R-MAX)
논문 요약 : CNN을 통해 search와 re-ranking을 했다. (Oxford5k와 Paris6K datasets으로 검증) Main idea CNN을 통해서 multiple image region을 추론할때 re-feed 없이 encode한다. Max-pooling을 사용한다….
[TPAMI 2018] Fine-tuning CNN Image Retrieval with No Human Annotation
해당 논문은 CVPR 2019 workshop – Google Landmark Challenge 상위 수상작들 대부분이 사용한 방법을 제시한 논문입니다. 특히 trainable Pooling인 GeM(Generalize-mean Pooling)을 제안한 논문으로 한번쯤 정리하면…
[ECCV 2016]NetVLAD: CNN architecture for weakly supervised place recognition
영상만으로 위치를 인식하는 place recognition에서 현재까지 활발히 활용되고 있는 NetVLAD입니다. 기존 VLAD 와 BoW, FV 등 영상을 대표적으로 표현할 수 있는 Global Descriptor를 생성하는 모델로…
[CVPR2019] High-level Semantic Feature Detection: A New Perspective for Pedestrian Detection
[github] https://github.com/liuwei16/CSP 컨셉은 간단하다. 이미지의 입력에서 보행자의 Center Point와 Scale을 찾아서 박스를 그리는 모델이다. Anchor-free object detection의 방법이다. Preliminary CNN기반 Object Detector는 Backbone network에 의존하는…
[Explainable AI]Interpretable Text-to-Image Synthesis with Hierarchical Semantic Layout Generation
이미지와 text 매칭에 관련한 논문이다. 기존의 방식은 텍스트와 이미지를 직접 매칭 했다면, 이 제안 방식은 위의 그림에서 확인할 수 있듯이 먼저 box generation으로 위치를 매칭…
최신 댓글