[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[ICCV 2019] Learning with Average Precision: Training Image Retrieval with a Listwise Loss
Image Retrieval Tesk를 하다보니 Triplet loss 외에 어떠한 loss가 최근 Metric learning으로 나오고 있나 싶어서 서칭하다 보니 작년 ICCV 에 R2D2 저자의 좋은 논문이 있어서…
Pedestrian Detection: The Elephant In The Room
실험부분에 대해서는 도표에 대한 설명이 주를 이루고있어 생략하고 있습니다. 본 논문을 읽으면서 도표를 이해하시는것을 추천하며 주말동안 도표에 따른 설명부분도 추가하겠습니다. https://arxiv.org/abs/2003.08799 Abstract 보행자은 매우 중요한…
PARTICULAR OBJECT RETRIEVAL WITH INTEGRAL MAX-POOLING OF CNN ACTIVATIONS (R-MAX)
논문 요약 : CNN을 통해 search와 re-ranking을 했다. (Oxford5k와 Paris6K datasets으로 검증) Main idea CNN을 통해서 multiple image region을 추론할때 re-feed 없이 encode한다. Max-pooling을 사용한다….
[CVPR Workshop Deep Vision 2020]Top-Down Networks: A coarse-to-fine reimagination of CNNs
생물학적 vision에서는 보통 물체를 인식할 때 Coarse-to-fine방식으로 진행됩니다. 이와 반대로 CNN 방법들은 보통 Fine-to- coarse 방식(=BottomUp)으로 물체를 인식합니다.이 논문은 생물학적으로 볼때와 같이 Coarse-to-fine 방식(=TopDown)으로 집중하게…
CornerNet: Detecting Objects as Paired Keypoints
Hei Law · Jia Deng Abstract 기존 SSD와 같은 detector의 경우 bounding box기반으로 anchor box를 만들어야 하는 등 (ex SSD에서 8732가량의 prior)의 과정이 필요 했지만…
[arXiv] Adversarial Feature Selection for Training AutoML
논문: Adversarial Validation Approach to Concept Drift Problem in Automated Machine Learning System 이번 논문은 AutoML을 훈련시킬 때 training dataset과 test dataset의 분포와 특징이 달라서…
Illuminating Pedestrains via Simultaneous Detection & Segmentation
Abstract&Introduction간단하게 요약을 하자면, 보행자 검출에서 크게 두 가지 방식으로 접근을 하는데, 하나는 object-detection, 다른 하나는 semantic segmentation 입니다. 각각은 모두 장단점이 존재하는데 다음과 같습니다. Object-Detection…
GFD-SSD Gated Fusion Double SSD for Multispectral Pedestrian Detection
GFD-SSD 논문 요약 선 3줄 요약1. RGB와 Thermal의 feature를 합치는 방법 제안 (GFU_v1, GFU_v2)2. GFU를 적용하는 방법 제안 (GFD-SSD : Gared Fusion Double SSD, MFD-SSD…
[TPAMI 2018] Fine-tuning CNN Image Retrieval with No Human Annotation
해당 논문은 CVPR 2019 workshop – Google Landmark Challenge 상위 수상작들 대부분이 사용한 방법을 제시한 논문입니다. 특히 trainable Pooling인 GeM(Generalize-mean Pooling)을 제안한 논문으로 한번쯤 정리하면…
[ECCV 2016]NetVLAD: CNN architecture for weakly supervised place recognition
영상만으로 위치를 인식하는 place recognition에서 현재까지 활발히 활용되고 있는 NetVLAD입니다. 기존 VLAD 와 BoW, FV 등 영상을 대표적으로 표현할 수 있는 Global Descriptor를 생성하는 모델로…
최신 댓글