Category: X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[NIPS] Cascade RPN: Delving into High-Quality Region Proposal Network with Adaptive Convolution
지난 KCCV 학회에서 찾아본 논문들 중 하나 인 Cascade RPN에 대해서 소개해드리겠습니다. 우선 3줄 요약을 통해 논문의 내용을 설명드리겠습니다. 2-Stage의 Object Detection 모델은 first stage인…
CornerNet: Detecting Objects as Paired Keypoints
최근에 Object Detection의 대표격인 SSD와 Faster-RCNN에 대해 공부를 했었습니다. 이를 기반으로 새로운 detection 모델 논문들을 조금씩 읽고 있었는데, 모두 Anchor box 기반 모델이더군요. 그래서 이번…
Video Dataset Analysis
이번에는 우리에게는 조금 생소할 수 있는 비디오 데이터셋에 대해서 공유하도록 하겠습니다. 보통 이미지 데이터 셋을 이용해서 작업을 많이 해왔는데 이번에 비디오 데이터셋 을 분석할 기회가…
Better to Follow, Follow to Be Better: Towards Precise Supervision of Feature Super-Resolution for Small Object Detection
ICCV2019에서도 발표된 논문으로 KCCV를 통해 알게됐고, 저자에게 직접 질문하며 논문의 Contribution을 이해할 수 있었던 논문입니다. (영어가 모국어였거나,내가 원어민처럼 잘했다면 국제학회는 이런느낌이겠구나를 간접적으로 체험할 수 있던…
Latex
이번 리뷰는 논문, 서적, 메뉴얼과 같은 다양한 문서 작업에 사용되는 Latex를 다뤄보고자 합니다. Latex는 어떠한 운영 시스템 및 문서 양식과 호환이 가능하며, 문서의 표준화가 쉬워…
Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation
1. 서문Image-level의 weakly supervised semantic segmentation은 cost가 큰 segmentation dataset을 사용하지 않아도 된다는 장점이 있어 연구 주제로써 인기가 있다. 최근에 관련한 방법으로서 class activation map(CAM)기법이…
[KCCV/CVPR2020] Cylindrical Convolutional Networks for Joint Object Detection and Viewpoint Estimation
이번 리뷰는 KCCV OE-03( 8/18 )에서 발표된 논문이며, 라이브로 해당 연구의 발표를 들으면서도 많은 흥미를 가지고 본 논문이기도 합니다. 최근 챌린지를 통해 3D object에 대한…
Sequential Video VLAD: Training the Aggregation Locally and Temporally
I. INTRODUCTION Sequential Vidio VLAD layer를 제안한다. 학습 가능한 VLAD layer와 RCN 네트워크가 전체 framework에 다 들어 가 있다. Sequence한 VLAD layer를 RCN에 넣음으로 써…
Image Retrieval Tutorial (2)
1.DNN(Deep Neural Network) 방식의 Global Descriptor DNN 방식의 Global descritptor로 Tutorial 2번째를 채우도록하겠다. DNN 방식 이전 방법론의 형태를 가져가서 Network를 구성한 NetVLAD부터 Network를 다른 DNN…
Faster R-CNN tutorial
예전에 한번 Faster R-CNN 논문을 읽고 리뷰를 적었지만, 그 당시 내용을 지금 보니 많이 부족하다고 느꼈습니다. 그래서 이번 기회에 Faster R-CNN에 대한 code level까지 설명하는…
1. CTC 기반의 텍스트 인식 모델의 학습 과정에 대해 설명을 드리면 대답이 될 것 같네요! 입력된 텍스트 이미지[H x W…