Author: rcvlab
[CVPR2017] PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation
논문: PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation 이번 논문은 point clouds data만을 사용하여 classification과 segmentation을 성공적으로 선보였던 PointNet입니다. 이 논문의…
EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
Mingxing Tan, Quoc V. Le 이번 리뷰에는 2020 PD 에서 제가 backbone으로 사용했던 efficientNet에 관련해서 정리해보도록 하겠습니다. 제가 이해한 이 논문의 핵심에 대해서 요약하면 다음과…
[CVPR 2017] What Can Help Pedestrian Detection?
AbstractCNNs기반의 PD는 2가지 큰 문제에 봉착한다. 첫쨰,보행자 일반적인 물체 분류와 비교하여 보행자는 배경과의 구분이 힘들다.따라서 낮은 해상도에서 사람도 구분하기 힘든 positive와 비슷하게 생긴 negative들이 존재한다….
[DCC17] Compact Deep Invariant Descriptors for Video Retrieval
논문: Compact Deep Invariant Descriptors for Video Retrieval 2014년 Motion Picture Experts Group (MPEG)은 Compact Descriptor for Video Analysis (CDVA) 표준화 작업을 시작했습니다. 이 작업을…
EfficientDet: Scalable and Efficient Object Detection
Mingxing Tan, Ruoming Pang, Quoc V. Le 1. EfficientDet 은 “EfficientNet : Improbing Accuracy and Efficiency through AutoML and Model Scaling” 의 저자들이 속한 Google…
Pedestrain Detection(정찬호)
1,2차:SSD 논문 원복 하며 디버깅하면서 코드 오류 잡기 3차:backbone을 VGGNet에서 EfficientNet으로 바꾸어 backbone변화에 따른 성능 변화 리포팅 시도한 step 1. normalize&width scaling 2. resolution scaling…
[CVPR] Deep Residual Learning for Image Recognition
ResNet은 레이어를 깊게 쌓을때, 레이어의 층의 깊이 때문에 발생하는 gradient vanishing/exploding 로 인해 역전파가 제대로 진행되지않아 학습 성능을 떨어뜨리는 경우를 완화하는 Shortcut(Skip) connection방법을 적용하여 VGG-16(19)보다…
[NIPS2017] Attention Is All You Need
논문: Attention Is All You Need Facebook AI Research에서 DETR: End-to-End Object Detection with Transformers 논문[1], 블로그[2], 코드[3]를 동시에 공개하면서 attention 혹은 Transformer라는 방법에 대해…
Distinctive Image Features from Scale-Invariant Keypoints
ETRI 과제 진행에 있어 SIFT 코드의 진행과정 이해가 필요해 본 논문을 선택해 리뷰합니다. 본 논문은 SIFT를 설명하는 논문이다. SIFT가 keypoint 를 추출하는 알고리즘의 순서에 맞게…
M2Det: A Single-Shot Object Detector based on Multi-Level Feature Pyramid Network
Scale의 변화는 object detection분야에서 중요한 요소중 하나이며 다양한 방법론들이 제안되고 있다. Proposed Method backbone과 Multi-Level Feature Pyramid Network(MLFPN)에서 features를 추출한다. SSD와 유사하게 bounding box와 class에…
안녕하세요. 현우님 좋은 댓글 감사합니다. 네, 현우님이 댓글에 남겨주신 것처럼 Table 3에서 A와 B는 샘플링하는 프레임수가 32개와 4개로 sparse하게 샘플링했을…