[카테고리:] X-Review

Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.

Posted in Paper X-Review

Sequential Video VLAD: Training the Aggregation Locally and Temporally

I. INTRODUCTION Sequential Vidio VLAD layer를 제안한다. 학습 가능한 VLAD layer와 RCN 네트워크가 전체 framework에 다 들어 가 있다. Sequence한 VLAD layer를 RCN에 넣음으로 써…

Continue Reading
Posted in X-Review

Image Retrieval Tutorial (2)

1.DNN(Deep Neural Network) 방식의 Global Descriptor DNN 방식의 Global descritptor로 Tutorial 2번째를 채우도록하겠다. DNN 방식 이전 방법론의 형태를 가져가서 Network를 구성한 NetVLAD부터 Network를 다른 DNN…

Continue Reading
Posted in Paper X-Review 미분류

Faster R-CNN tutorial

예전에 한번 Faster R-CNN 논문을 읽고 리뷰를 적었지만, 그 당시 내용을 지금 보니 많이 부족하다고 느꼈습니다. 그래서 이번 기회에 Faster R-CNN에 대한 code level까지 설명하는…

Continue Reading
Posted in Paper X-Review

[arXiv14] Learning Spatiotemporal Features with 3D Convolutional Networks

6년 전에 처음으로 나왔지만, 이번 video retrieval task 를 하며 자세히 읽게 되어 리뷰를 하게 되었습니다. 이전이나 현재까지도 주로 Convolution Network, input에 움직이는 방향이 2D인…

Continue Reading
Posted in X-Review 미분류

Faster RCNN

Faster R-CNN은 2-stage object detection의 대표적인 기술 입니다.Faster R-CNN의 학습부터 테스트까지의 과정을 순서대로 설명하겠습니다.논문에 나와있지 않은 디테일은 제 임의로 작성했습니다. 1. Preprocessing 우선 학습을 위한…

Continue Reading
Posted in Paper X-Review 미분류

CAN : Creative Adversarial Networks Generating “Art” by Learning About Styles and Deviating from Style Norms

이번 리뷰는 오랜만에 GAN 논문을 들고 왔습니다. GAN은 정말 다양하고 창의적인 영상을 만들어냄으로써 여러 분야에 사용할 수 있는데, 해당 논문은 예술작품을 주제로 삼았습니다. 좀 더…

Continue Reading
Posted in X-Review

Visual SLAM algorithms: a survey from 2010 to 2016 – part 2

이전 리뷰에서 기초적인 visual SLAM을 구성하는 모듈들을 통해 소개를 하고, 영상에서 추출한 feature detector, descriptor를 이용한 feature-base visual SLAM을 소개했습니다. 이번 리뷰에서는 feature가 아닌 영상…

Continue Reading
Posted in Paper X-Review

[arXiv2017] Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

Action classification 분야에서는 이전에 주로 UCF101, HMDB51와 같은 작은 규모의 데이터 셋을 사용하곤 했습니다. 그런데 다른 task에서 마찬가지로 학습을 시킬 때 충분히 큰 규모의 데이터셋으로…

Continue Reading
Posted in Paper X-Review

Object-Contextual Representations for Semantic Segmentation

논문: https://arxiv.org/pdf/1909.11065.pdf Object-Contextual Representations for Semantic Segmentation (이하 OCRNet)은 context schemes와 관련된 흐름의 연구이다. 이전에 리뷰했던 논문은 multi-scale context로 성능을 높였다면(PSPNet, DeepLab) 이 논문은 relational…

Continue Reading
Posted in Paper X-Review 미분류

[ICCV2019]TextPlace: Visual Place Recognition and Topological Localization Through Reading Scene Texts

1 Abstract Text정보 Descriptor로 활용해 Place Recognition을 하는 첫번째 방법론, Text정보는 환경이 바뀌더라도 똑같은 정보를 갖는다. Metric localization을 제시함 Visual localization 방법론으로 방법론의 타당성을 증명한다….

Continue Reading