Image Retrieval Tutorial (2)
1.DNN(Deep Neural Network) 방식의 Global Descriptor DNN 방식의 Global descritptor로 Tutorial 2번째를 채우도록하겠다. DNN 방식 이전 방법론의 형태를 가져가서 Network를 구성한 NetVLAD부터 Network를 다른 DNN…
Faster R-CNN tutorial
예전에 한번 Faster R-CNN 논문을 읽고 리뷰를 적었지만, 그 당시 내용을 지금 보니 많이 부족하다고 느꼈습니다. 그래서 이번 기회에 Faster R-CNN에 대한 code level까지 설명하는…
[arXiv14] Learning Spatiotemporal Features with 3D Convolutional Networks
6년 전에 처음으로 나왔지만, 이번 video retrieval task 를 하며 자세히 읽게 되어 리뷰를 하게 되었습니다. 이전이나 현재까지도 주로 Convolution Network, input에 움직이는 방향이 2D인…
Faster RCNN
Faster R-CNN은 2-stage object detection의 대표적인 기술 입니다.Faster R-CNN의 학습부터 테스트까지의 과정을 순서대로 설명하겠습니다.논문에 나와있지 않은 디테일은 제 임의로 작성했습니다. 1. Preprocessing 우선 학습을 위한…
CAN : Creative Adversarial Networks Generating “Art” by Learning About Styles and Deviating from Style Norms
이번 리뷰는 오랜만에 GAN 논문을 들고 왔습니다. GAN은 정말 다양하고 창의적인 영상을 만들어냄으로써 여러 분야에 사용할 수 있는데, 해당 논문은 예술작품을 주제로 삼았습니다. 좀 더…
Visual SLAM algorithms: a survey from 2010 to 2016 – part 2
이전 리뷰에서 기초적인 visual SLAM을 구성하는 모듈들을 통해 소개를 하고, 영상에서 추출한 feature detector, descriptor를 이용한 feature-base visual SLAM을 소개했습니다. 이번 리뷰에서는 feature가 아닌 영상…
[arXiv2017] Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset
Action classification 분야에서는 이전에 주로 UCF101, HMDB51와 같은 작은 규모의 데이터 셋을 사용하곤 했습니다. 그런데 다른 task에서 마찬가지로 학습을 시킬 때 충분히 큰 규모의 데이터셋으로…
Object-Contextual Representations for Semantic Segmentation
논문: https://arxiv.org/pdf/1909.11065.pdf Object-Contextual Representations for Semantic Segmentation (이하 OCRNet)은 context schemes와 관련된 흐름의 연구이다. 이전에 리뷰했던 논문은 multi-scale context로 성능을 높였다면(PSPNet, DeepLab) 이 논문은 relational…
[ICCV2019]TextPlace: Visual Place Recognition and Topological Localization Through Reading Scene Texts
1 Abstract Text정보 Descriptor로 활용해 Place Recognition을 하는 첫번째 방법론, Text정보는 환경이 바뀌더라도 똑같은 정보를 갖는다. Metric localization을 제시함 Visual localization 방법론으로 방법론의 타당성을 증명한다….
[서울대학교 AI 여름학교] 리뷰
서울대학교에서 진행한 AI여름학교 모든 발표를 듣고 정리하는것을 목표로 하였으나, 네이버랩스 챌린지 발표등의 이유로 모든 강연을 듣지 못하였습니다. 그래서 가장 인상깊었던 강연들 위주로 작성하고자 합니다. 1일차…
![[arXiv14] Learning Spatiotemporal Features with 3D Convolutional Networks](http://server.rcv.sejong.ac.kr:8080/wp-content/uploads/2020/08/image-104-480x51.png)

![[arXiv2017] Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset](http://server.rcv.sejong.ac.kr:8080/wp-content/uploads/2020/08/image-82.png)
안녕하세요 태주님 댓글 감사합니다. 답변을 드리자면, A1. 저자가 real data 수를 바꿔가며 실험을 진행할 때, Real data가 150개일땐 Real data…