[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
Mingxing Tan, Quoc V. Le 이번 리뷰에는 2020 PD 에서 제가 backbone으로 사용했던 efficientNet에 관련해서 정리해보도록 하겠습니다. 제가 이해한 이 논문의 핵심에 대해서 요약하면 다음과…
Image-to-Image Translation with Conditional Adversarial Networks.
GAN에 대한 논문을 종종 읽어보면 자주 참조되던 논문이라, 이번 기회에 읽고 정리해보고자 가져왔습니다. Introduction GAN은 정말 다양한 task에 사용되는 모델입니다. 하지만 이런 GAN의 고질적인 문제가…
[arXiv] D2D: Keypoint Extraction with Describe to Detect Approach
이전부터 Computer vision에서 영상의 keypoint 를 추출하는 것은 자주 풀어오던 문제였습니다. 주로 handcraft 알고리즘이라고 불리우는 전통적인 알고리즘들은 keypoint 의 위치를 detect 한 뒤, 특징을 표현하는…
Energy base models
ICRA의 Plenary Talk 였던 Self-Supervised Learning & World Models를 이해하기 앞서 영상에서 많이 등장했지만 이해되지 않았던 개념을 정리하고자 합니다. 1. Energy base model (EBM) 접근법EBM은…
[ECCV 2018]Learning Efficient Single-stage Pedestrian Detection by Asymptotic Localization Fitting
해당 논문은 Pedestrian detection에 특화된 SSD 계열(1stage detection)의 방법을 제안했다. 또한 RetinaNet의 컨셉을 anchor box를 통한 regression과 class에 대한 confidence score에 적용함(Asymptotic Localization Fitting, 이하…
[CVPR 2017] What Can Help Pedestrian Detection?
AbstractCNNs기반의 PD는 2가지 큰 문제에 봉착한다. 첫쨰,보행자 일반적인 물체 분류와 비교하여 보행자는 배경과의 구분이 힘들다.따라서 낮은 해상도에서 사람도 구분하기 힘든 positive와 비슷하게 생긴 negative들이 존재한다….
[DCC17] Compact Deep Invariant Descriptors for Video Retrieval
논문: Compact Deep Invariant Descriptors for Video Retrieval 2014년 Motion Picture Experts Group (MPEG)은 Compact Descriptor for Video Analysis (CDVA) 표준화 작업을 시작했습니다. 이 작업을…
[ICCV2020]DE⫶TR: End-to-End Object Detection with Transformers
깃허브 및 페이퍼 Github : https://github.com/facebookresearch/detr?fbclid=IwAR3I28-rB6EPrPlqqQw8VWoy2Zhw61IdOCUxnP5le126F8WNHNaMPX-Y7sg Paper : https://scontent-ssn1-1.xx.fbcdn.net/v/t39.8562-6/101177000_245125840263462_1160672288488554496_n.pdf?_nc_cat=104&_nc_sid=ae5e01&_nc_ohc=r3D77RQVlCQAX8wVJy0&_nc_ht=scontent-ssn1-1.xx&oh=0d5852afa2dfc7c90774646d9439dee0&oe=5EFEDF47 배경지식 https://nlpinkorean.github.io/illustrated-transformer/ 헝가리안 알고리즘 : https://m.blog.naver.com/PostView.nhn?blogId=ehddml1229&logNo=220984824462&proxyReferer=https:%2F%2Fwww.google.com%2F 설명 이번에 페이스북AI에서 제안하는 DE:TR 모델은 기존 Object Detection의 프레임과는…
EfficientDet: Scalable and Efficient Object Detection
Mingxing Tan, Ruoming Pang, Quoc V. Le 1. EfficientDet 은 “EfficientNet : Improbing Accuracy and Efficiency through AutoML and Model Scaling” 의 저자들이 속한 Google…
Underwater Image Super-Resolution using Deep Residual Multipliers
향후 새로운 연구를 할 때도 혹시나 도움이 될 겸 ICRA에 올라온 논문 한편을 가져와봤습니다. Introduction 해당 논문의 주제는 GAN을 통하여 고화질의 해저 영상을 만들자는 내용입니다.수중…
최신 댓글