[arXiv 2019] Combination of Multiple Global Descriptors for Image Retrieval
네이버에서 주최하는 Mapping & Localization challenge에 참여하여 서베이를 하던 도중 이 논문에 대해 알게되었습니다. 당시에는 image retrieval 이라는 task를 처음 시도하였기에 전체적인 틀 잡기에 급급하여…
[CVPR] Deep Residual Learning for Image Recognition
ResNet은 레이어를 깊게 쌓을때, 레이어의 층의 깊이 때문에 발생하는 gradient vanishing/exploding 로 인해 역전파가 제대로 진행되지않아 학습 성능을 떨어뜨리는 경우를 완화하는 Shortcut(Skip) connection방법을 적용하여 VGG-16(19)보다…
[2020.ICRA] 첫 국제학회 참관기
안녕하세요. 세종 RCV 한대찬 입니다. ICRA2020 에 Domain Adaptation 관련 논문이 Accept이 되고, 코로나로 인한 온라인 학회에 동영상까지 제출한 후 github 용 코드 정리를 하며…
[ECCV 2014]Microsoft COCO: Common Objects in Context
COCO DATASET(MS COCO) – 2017년 기준(최신). train2017 (19G) val2017 (788M) test2017 (6.3G) annotations (808M) 330K 영상과 250만개의 label Object segmentation Recognition in context Superpixel stuff…
[NIPS2017] Attention Is All You Need
논문: Attention Is All You Need Facebook AI Research에서 DETR: End-to-End Object Detection with Transformers 논문[1], 블로그[2], 코드[3]를 동시에 공개하면서 attention 혹은 Transformer라는 방법에 대해…
[IEEE] Discriminative Frequent Pattern Analysis for Effective
1. Frequent 패턴이 분류문제에서 더 효과적인 이유는 무엇일까? 저자는 논문에서 Frequent 패턴이 single feature와 비교해 분류문제에 있어 더 유용한 이유를 설명하고 실험을 통해 나타낸다. Frequent…
Distinctive Image Features from Scale-Invariant Keypoints
ETRI 과제 진행에 있어 SIFT 코드의 진행과정 이해가 필요해 본 논문을 선택해 리뷰합니다. 본 논문은 SIFT를 설명하는 논문이다. SIFT가 keypoint 를 추출하는 알고리즘의 순서에 맞게…
[2020]학부연구생의 연구한바퀴
ICRA 2020 동영상 녹화를 마무리하며, 학부연구생으로서 경험한 연구원 생활을 정리하려 합니다. 사실 아직 발표 공개도, 질의도 받지 않아 한바퀴를 돌았다고 할 수 는 없고, 전에…
M2Det: A Single-Shot Object Detector based on Multi-Level Feature Pyramid Network
Scale의 변화는 object detection분야에서 중요한 요소중 하나이며 다양한 방법론들이 제안되고 있다. Proposed Method backbone과 Multi-Level Feature Pyramid Network(MLFPN)에서 features를 추출한다. SSD와 유사하게 bounding box와 class에…
[CVPR 2019]Feature Selective Anchor-Free Module for Single-Shot Object Detection
git : https://github.com/hdjang/Feature-Selective-Anchor-Free-Module-for-Single-Shot-Object-Detection 해당 논문은 anchor-base 방식(SSD, YOLO, RetinaNet…)에 FPN과 anchor-free 모듈을 이용합니다. anchor-free 모듈을 통해 box regression과 classification에 최적화된 pyramid feature를 선택하여 성능을 향상시키는…
안녕하세요 재윤님 답글 감사합니다. 우선 "is playing" 이라는 질문이 있는지는 모르겠으나 전체 질문 문장을 모델에 입력으로 줬을때, video, audio 에…