Category: Paper
Paper Review
What’s in my Room? Object Recognition on Indoor Panoramic Images
해당 논문은 360도 full-view의 카메라의 등장으로 카메라 종류에 따른 외곡을 효율적인 파노라마 이미지 처리기법을 제안한다. 360도 파노라마 이미지에서 Recognition을 하는데 이미지의 상황을 통한 정보의 정확도향상과…
EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
Mingxing Tan, Quoc V. Le 이번 리뷰에는 2020 PD 에서 제가 backbone으로 사용했던 efficientNet에 관련해서 정리해보도록 하겠습니다. 제가 이해한 이 논문의 핵심에 대해서 요약하면 다음과…
Image-to-Image Translation with Conditional Adversarial Networks.
GAN에 대한 논문을 종종 읽어보면 자주 참조되던 논문이라, 이번 기회에 읽고 정리해보고자 가져왔습니다. Introduction GAN은 정말 다양한 task에 사용되는 모델입니다. 하지만 이런 GAN의 고질적인 문제가…
[arXiv] D2D: Keypoint Extraction with Describe to Detect Approach
이전부터 Computer vision에서 영상의 keypoint 를 추출하는 것은 자주 풀어오던 문제였습니다. 주로 handcraft 알고리즘이라고 불리우는 전통적인 알고리즘들은 keypoint 의 위치를 detect 한 뒤, 특징을 표현하는…
[ECCV 2018]Learning Efficient Single-stage Pedestrian Detection by Asymptotic Localization Fitting
해당 논문은 Pedestrian detection에 특화된 SSD 계열(1stage detection)의 방법을 제안했다. 또한 RetinaNet의 컨셉을 anchor box를 통한 regression과 class에 대한 confidence score에 적용함(Asymptotic Localization Fitting, 이하…
[ICCV2020]DE⫶TR: End-to-End Object Detection with Transformers
깃허브 및 페이퍼 Github : https://github.com/facebookresearch/detr?fbclid=IwAR3I28-rB6EPrPlqqQw8VWoy2Zhw61IdOCUxnP5le126F8WNHNaMPX-Y7sg Paper : https://scontent-ssn1-1.xx.fbcdn.net/v/t39.8562-6/101177000_245125840263462_1160672288488554496_n.pdf?_nc_cat=104&_nc_sid=ae5e01&_nc_ohc=r3D77RQVlCQAX8wVJy0&_nc_ht=scontent-ssn1-1.xx&oh=0d5852afa2dfc7c90774646d9439dee0&oe=5EFEDF47 배경지식 https://nlpinkorean.github.io/illustrated-transformer/ 헝가리안 알고리즘 : https://m.blog.naver.com/PostView.nhn?blogId=ehddml1229&logNo=220984824462&proxyReferer=https:%2F%2Fwww.google.com%2F 설명 이번에 페이스북AI에서 제안하는 DE:TR 모델은 기존 Object Detection의 프레임과는…
EfficientDet: Scalable and Efficient Object Detection
Mingxing Tan, Ruoming Pang, Quoc V. Le 1. EfficientDet 은 “EfficientNet : Improbing Accuracy and Efficiency through AutoML and Model Scaling” 의 저자들이 속한 Google…
[ICCV2019]Human uncertainty makes classification more robust
이 논문은 인간의 불확실성을 담은 데이터의 효용성에 대해 다루었다. 보면서 Knowledge Distillation(모델증류) 기법이 떠올랐는데, 논문에서는 모델 증류기법은 soft label을 위해 network를 사용하기 때문에 확실한 기준이…
[arXiv 2019] Combination of Multiple Global Descriptors for Image Retrieval
네이버에서 주최하는 Mapping & Localization challenge에 참여하여 서베이를 하던 도중 이 논문에 대해 알게되었습니다. 당시에는 image retrieval 이라는 task를 처음 시도하였기에 전체적인 틀 잡기에 급급하여…
[ECCV 2014]Microsoft COCO: Common Objects in Context
COCO DATASET(MS COCO) – 2017년 기준(최신). train2017 (19G) val2017 (788M) test2017 (6.3G) annotations (808M) 330K 영상과 250만개의 label Object segmentation Recognition in context Superpixel stuff…
태주님 좋은 리뷰 감사합니다. frame에 대한 변인을 하나 줄이는 방식으로 조금 더 효율적으로 표현하고자 한 것으로 이해하였습니다. 2가지 타입에서 평가한다고…