[카테고리:] X-Review

Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.

Posted in Paper X-Review

Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation

1. 서문Image-level의 weakly supervised semantic segmentation은 cost가 큰 segmentation dataset을 사용하지 않아도 된다는 장점이 있어 연구 주제로써 인기가 있다. 최근에 관련한 방법으로서 class activation map(CAM)기법이…

Continue Reading
Posted in Conference Paper X-Review 미분류

[KCCV/CVPR2020] Cylindrical Convolutional Networks for Joint Object Detection and Viewpoint Estimation

이번 리뷰는 KCCV OE-03( 8/18 )에서 발표된 논문이며, 라이브로 해당 연구의 발표를 들으면서도 많은 흥미를 가지고 본 논문이기도 합니다. 최근 챌린지를 통해 3D object에 대한…

Continue Reading
Posted in Paper X-Review

Sequential Video VLAD: Training the Aggregation Locally and Temporally

I. INTRODUCTION Sequential Vidio VLAD layer를 제안한다. 학습 가능한 VLAD layer와 RCN 네트워크가 전체 framework에 다 들어 가 있다. Sequence한 VLAD layer를 RCN에 넣음으로 써…

Continue Reading
Posted in X-Review

Image Retrieval Tutorial (2)

1.DNN(Deep Neural Network) 방식의 Global Descriptor DNN 방식의 Global descritptor로 Tutorial 2번째를 채우도록하겠다. DNN 방식 이전 방법론의 형태를 가져가서 Network를 구성한 NetVLAD부터 Network를 다른 DNN…

Continue Reading
Posted in Paper X-Review 미분류

Faster R-CNN tutorial

예전에 한번 Faster R-CNN 논문을 읽고 리뷰를 적었지만, 그 당시 내용을 지금 보니 많이 부족하다고 느꼈습니다. 그래서 이번 기회에 Faster R-CNN에 대한 code level까지 설명하는…

Continue Reading
Posted in Paper X-Review

[arXiv14] Learning Spatiotemporal Features with 3D Convolutional Networks

6년 전에 처음으로 나왔지만, 이번 video retrieval task 를 하며 자세히 읽게 되어 리뷰를 하게 되었습니다. 이전이나 현재까지도 주로 Convolution Network, input에 움직이는 방향이 2D인…

Continue Reading
Posted in X-Review 미분류

Faster RCNN

Faster R-CNN은 2-stage object detection의 대표적인 기술 입니다.Faster R-CNN의 학습부터 테스트까지의 과정을 순서대로 설명하겠습니다.논문에 나와있지 않은 디테일은 제 임의로 작성했습니다. 1. Preprocessing 우선 학습을 위한…

Continue Reading
Posted in Paper X-Review 미분류

CAN : Creative Adversarial Networks Generating “Art” by Learning About Styles and Deviating from Style Norms

이번 리뷰는 오랜만에 GAN 논문을 들고 왔습니다. GAN은 정말 다양하고 창의적인 영상을 만들어냄으로써 여러 분야에 사용할 수 있는데, 해당 논문은 예술작품을 주제로 삼았습니다. 좀 더…

Continue Reading
Posted in X-Review

Visual SLAM algorithms: a survey from 2010 to 2016 – part 2

이전 리뷰에서 기초적인 visual SLAM을 구성하는 모듈들을 통해 소개를 하고, 영상에서 추출한 feature detector, descriptor를 이용한 feature-base visual SLAM을 소개했습니다. 이번 리뷰에서는 feature가 아닌 영상…

Continue Reading
Posted in Paper X-Review

[arXiv2017] Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

Action classification 분야에서는 이전에 주로 UCF101, HMDB51와 같은 작은 규모의 데이터 셋을 사용하곤 했습니다. 그런데 다른 task에서 마찬가지로 학습을 시킬 때 충분히 큰 규모의 데이터셋으로…

Continue Reading