Category: X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
Illuminating Pedestrains via Simultaneous Detection & Segmentation
Abstract&Introduction간단하게 요약을 하자면, 보행자 검출에서 크게 두 가지 방식으로 접근을 하는데, 하나는 object-detection, 다른 하나는 semantic segmentation 입니다. 각각은 모두 장단점이 존재하는데 다음과 같습니다. Object-Detection…
GFD-SSD Gated Fusion Double SSD for Multispectral Pedestrian Detection
GFD-SSD 논문 요약 선 3줄 요약1. RGB와 Thermal의 feature를 합치는 방법 제안 (GFU_v1, GFU_v2)2. GFU를 적용하는 방법 제안 (GFD-SSD : Gared Fusion Double SSD, MFD-SSD…
[TPAMI 2018] Fine-tuning CNN Image Retrieval with No Human Annotation
해당 논문은 CVPR 2019 workshop – Google Landmark Challenge 상위 수상작들 대부분이 사용한 방법을 제시한 논문입니다. 특히 trainable Pooling인 GeM(Generalize-mean Pooling)을 제안한 논문으로 한번쯤 정리하면…
[ECCV 2016]NetVLAD: CNN architecture for weakly supervised place recognition
영상만으로 위치를 인식하는 place recognition에서 현재까지 활발히 활용되고 있는 NetVLAD입니다. 기존 VLAD 와 BoW, FV 등 영상을 대표적으로 표현할 수 있는 Global Descriptor를 생성하는 모델로…
[CVPR2019] High-level Semantic Feature Detection: A New Perspective for Pedestrian Detection
[github] https://github.com/liuwei16/CSP 컨셉은 간단하다. 이미지의 입력에서 보행자의 Center Point와 Scale을 찾아서 박스를 그리는 모델이다. Anchor-free object detection의 방법이다. Preliminary CNN기반 Object Detector는 Backbone network에 의존하는…
[ICARA2020] OneShot Global Localization: Instant LiDAR-Visual Pose Estimation
이전 부터 LiDAR를 이용한 Localizaion에 대한 연구가 궁금했었습니다. 때마침 아카이브에 올라오기도 했고 Vision base와도 결합한 방식이라고 하여 친숙하게 접근할 수 있을거라 생각해 리뷰를 해보도록 결정했습니다….
[Explainable AI]Interpretable Text-to-Image Synthesis with Hierarchical Semantic Layout Generation
이미지와 text 매칭에 관련한 논문이다. 기존의 방식은 텍스트와 이미지를 직접 매칭 했다면, 이 제안 방식은 위의 그림에서 확인할 수 있듯이 먼저 box generation으로 위치를 매칭…
Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories
with The Pyramid Match Kernel: Discriminative Classification with Sets of Image Features Beyond Bags of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories 는…
[CVPR2019] D2-Net: A Trainable CNN for Joint Detection and Description of Local Features
전통적으로 SIFT와 같은 알고리즘은 이미지에서 distinctive한 point를 “detect” 한 후 이 point들의 descriptor를 뽑는 “describe” 순서의 과정을 거쳤습니다. 그러나 이러한 방법을 사용할 시, descriptor의 경우…
[arXiv] PPBA: Progressive Population Based Augmentation
논문: Improving 3D Object Detection through Progressive Population Based Augmentation 머신러닝 모델을 훈련할 때 성능을 높이기 위한 방법은 model structure 뿐만 아니라 data augmentation, optimizing,…
유진님 좋은 리뷰 감사합니다. 기존의 video 연구에서 어떻게 샘플링을 해야 하는지에 관한 논문으로, 해당 논문은 NSD를 고려한 샘플링 전략을 제안하며,…