[CVPR 2017] What Can Help Pedestrian Detection?
AbstractCNNs기반의 PD는 2가지 큰 문제에 봉착한다. 첫쨰,보행자 일반적인 물체 분류와 비교하여 보행자는 배경과의 구분이 힘들다.따라서 낮은 해상도에서 사람도 구분하기 힘든 positive와 비슷하게 생긴 negative들이 존재한다….
[DCC17] Compact Deep Invariant Descriptors for Video Retrieval
논문: Compact Deep Invariant Descriptors for Video Retrieval 2014년 Motion Picture Experts Group (MPEG)은 Compact Descriptor for Video Analysis (CDVA) 표준화 작업을 시작했습니다. 이 작업을…
[ICCV2020]DE⫶TR: End-to-End Object Detection with Transformers
깃허브 및 페이퍼 Github : https://github.com/facebookresearch/detr?fbclid=IwAR3I28-rB6EPrPlqqQw8VWoy2Zhw61IdOCUxnP5le126F8WNHNaMPX-Y7sg Paper : https://scontent-ssn1-1.xx.fbcdn.net/v/t39.8562-6/101177000_245125840263462_1160672288488554496_n.pdf?_nc_cat=104&_nc_sid=ae5e01&_nc_ohc=r3D77RQVlCQAX8wVJy0&_nc_ht=scontent-ssn1-1.xx&oh=0d5852afa2dfc7c90774646d9439dee0&oe=5EFEDF47 배경지식 https://nlpinkorean.github.io/illustrated-transformer/ 헝가리안 알고리즘 : https://m.blog.naver.com/PostView.nhn?blogId=ehddml1229&logNo=220984824462&proxyReferer=https:%2F%2Fwww.google.com%2F 설명 이번에 페이스북AI에서 제안하는 DE:TR 모델은 기존 Object Detection의 프레임과는…
EfficientDet: Scalable and Efficient Object Detection
Mingxing Tan, Ruoming Pang, Quoc V. Le 1. EfficientDet 은 “EfficientNet : Improbing Accuracy and Efficiency through AutoML and Model Scaling” 의 저자들이 속한 Google…
Pedestrain Detection(정찬호)
1,2차:SSD 논문 원복 하며 디버깅하면서 코드 오류 잡기 3차:backbone을 VGGNet에서 EfficientNet으로 바꾸어 backbone변화에 따른 성능 변화 리포팅 시도한 step 1. normalize&width scaling 2. resolution scaling…
Underwater Image Super-Resolution using Deep Residual Multipliers
향후 새로운 연구를 할 때도 혹시나 도움이 될 겸 ICRA에 올라온 논문 한편을 가져와봤습니다. Introduction 해당 논문의 주제는 GAN을 통하여 고화질의 해저 영상을 만들자는 내용입니다.수중…
[ICCV2019]Human uncertainty makes classification more robust
이 논문은 인간의 불확실성을 담은 데이터의 효용성에 대해 다루었다. 보면서 Knowledge Distillation(모델증류) 기법이 떠올랐는데, 논문에서는 모델 증류기법은 soft label을 위해 network를 사용하기 때문에 확실한 기준이…
[arXiv 2019] Combination of Multiple Global Descriptors for Image Retrieval
네이버에서 주최하는 Mapping & Localization challenge에 참여하여 서베이를 하던 도중 이 논문에 대해 알게되었습니다. 당시에는 image retrieval 이라는 task를 처음 시도하였기에 전체적인 틀 잡기에 급급하여…
[CVPR] Deep Residual Learning for Image Recognition
ResNet은 레이어를 깊게 쌓을때, 레이어의 층의 깊이 때문에 발생하는 gradient vanishing/exploding 로 인해 역전파가 제대로 진행되지않아 학습 성능을 떨어뜨리는 경우를 완화하는 Shortcut(Skip) connection방법을 적용하여 VGG-16(19)보다…
안녕하세요. 리뷰 잘 읽었습니다. 리뷰 내용 중에 때 "object query는 일반적으로 하나의 작은 피처만을 포함하므로, LLM 내부에 cross-attention layer를 새로…