[ICCV2020]DE⫶TR: End-to-End Object Detection with Transformers
깃허브 및 페이퍼 Github : https://github.com/facebookresearch/detr?fbclid=IwAR3I28-rB6EPrPlqqQw8VWoy2Zhw61IdOCUxnP5le126F8WNHNaMPX-Y7sg Paper : https://scontent-ssn1-1.xx.fbcdn.net/v/t39.8562-6/101177000_245125840263462_1160672288488554496_n.pdf?_nc_cat=104&_nc_sid=ae5e01&_nc_ohc=r3D77RQVlCQAX8wVJy0&_nc_ht=scontent-ssn1-1.xx&oh=0d5852afa2dfc7c90774646d9439dee0&oe=5EFEDF47 배경지식 https://nlpinkorean.github.io/illustrated-transformer/ 헝가리안 알고리즘 : https://m.blog.naver.com/PostView.nhn?blogId=ehddml1229&logNo=220984824462&proxyReferer=https:%2F%2Fwww.google.com%2F 설명 이번에 페이스북AI에서 제안하는 DE:TR 모델은 기존 Object Detection의 프레임과는…
EfficientDet: Scalable and Efficient Object Detection
Mingxing Tan, Ruoming Pang, Quoc V. Le 1. EfficientDet 은 “EfficientNet : Improbing Accuracy and Efficiency through AutoML and Model Scaling” 의 저자들이 속한 Google…
Pedestrain Detection(정찬호)
1,2차:SSD 논문 원복 하며 디버깅하면서 코드 오류 잡기 3차:backbone을 VGGNet에서 EfficientNet으로 바꾸어 backbone변화에 따른 성능 변화 리포팅 시도한 step 1. normalize&width scaling 2. resolution scaling…
Underwater Image Super-Resolution using Deep Residual Multipliers
향후 새로운 연구를 할 때도 혹시나 도움이 될 겸 ICRA에 올라온 논문 한편을 가져와봤습니다. Introduction 해당 논문의 주제는 GAN을 통하여 고화질의 해저 영상을 만들자는 내용입니다.수중…
[ICCV2019]Human uncertainty makes classification more robust
이 논문은 인간의 불확실성을 담은 데이터의 효용성에 대해 다루었다. 보면서 Knowledge Distillation(모델증류) 기법이 떠올랐는데, 논문에서는 모델 증류기법은 soft label을 위해 network를 사용하기 때문에 확실한 기준이…
[arXiv 2019] Combination of Multiple Global Descriptors for Image Retrieval
네이버에서 주최하는 Mapping & Localization challenge에 참여하여 서베이를 하던 도중 이 논문에 대해 알게되었습니다. 당시에는 image retrieval 이라는 task를 처음 시도하였기에 전체적인 틀 잡기에 급급하여…
[CVPR] Deep Residual Learning for Image Recognition
ResNet은 레이어를 깊게 쌓을때, 레이어의 층의 깊이 때문에 발생하는 gradient vanishing/exploding 로 인해 역전파가 제대로 진행되지않아 학습 성능을 떨어뜨리는 경우를 완화하는 Shortcut(Skip) connection방법을 적용하여 VGG-16(19)보다…
[2020.ICRA] 첫 국제학회 참관기
안녕하세요. 세종 RCV 한대찬 입니다. ICRA2020 에 Domain Adaptation 관련 논문이 Accept이 되고, 코로나로 인한 온라인 학회에 동영상까지 제출한 후 github 용 코드 정리를 하며…
[ECCV 2014]Microsoft COCO: Common Objects in Context
COCO DATASET(MS COCO) – 2017년 기준(최신). train2017 (19G) val2017 (788M) test2017 (6.3G) annotations (808M) 330K 영상과 250만개의 label Object segmentation Recognition in context Superpixel stuff…
1. CTC 기반의 텍스트 인식 모델의 학습 과정에 대해 설명을 드리면 대답이 될 것 같네요! 입력된 텍스트 이미지[H x W…