Category: Paper
Paper Review
Better to Follow, Follow to Be Better: Towards Precise Supervision of Feature Super-Resolution for Small Object Detection
ICCV2019에서도 발표된 논문으로 KCCV를 통해 알게됐고, 저자에게 직접 질문하며 논문의 Contribution을 이해할 수 있었던 논문입니다. (영어가 모국어였거나,내가 원어민처럼 잘했다면 국제학회는 이런느낌이겠구나를 간접적으로 체험할 수 있던…
Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation
1. 서문Image-level의 weakly supervised semantic segmentation은 cost가 큰 segmentation dataset을 사용하지 않아도 된다는 장점이 있어 연구 주제로써 인기가 있다. 최근에 관련한 방법으로서 class activation map(CAM)기법이…
[KCCV/CVPR2020] Cylindrical Convolutional Networks for Joint Object Detection and Viewpoint Estimation
이번 리뷰는 KCCV OE-03( 8/18 )에서 발표된 논문이며, 라이브로 해당 연구의 발표를 들으면서도 많은 흥미를 가지고 본 논문이기도 합니다. 최근 챌린지를 통해 3D object에 대한…
Sequential Video VLAD: Training the Aggregation Locally and Temporally
I. INTRODUCTION Sequential Vidio VLAD layer를 제안한다. 학습 가능한 VLAD layer와 RCN 네트워크가 전체 framework에 다 들어 가 있다. Sequence한 VLAD layer를 RCN에 넣음으로 써…
Faster R-CNN tutorial
예전에 한번 Faster R-CNN 논문을 읽고 리뷰를 적었지만, 그 당시 내용을 지금 보니 많이 부족하다고 느꼈습니다. 그래서 이번 기회에 Faster R-CNN에 대한 code level까지 설명하는…
[arXiv14] Learning Spatiotemporal Features with 3D Convolutional Networks
6년 전에 처음으로 나왔지만, 이번 video retrieval task 를 하며 자세히 읽게 되어 리뷰를 하게 되었습니다. 이전이나 현재까지도 주로 Convolution Network, input에 움직이는 방향이 2D인…
CAN : Creative Adversarial Networks Generating “Art” by Learning About Styles and Deviating from Style Norms
이번 리뷰는 오랜만에 GAN 논문을 들고 왔습니다. GAN은 정말 다양하고 창의적인 영상을 만들어냄으로써 여러 분야에 사용할 수 있는데, 해당 논문은 예술작품을 주제로 삼았습니다. 좀 더…
[arXiv2017] Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset
Action classification 분야에서는 이전에 주로 UCF101, HMDB51와 같은 작은 규모의 데이터 셋을 사용하곤 했습니다. 그런데 다른 task에서 마찬가지로 학습을 시킬 때 충분히 큰 규모의 데이터셋으로…
Object-Contextual Representations for Semantic Segmentation
논문: https://arxiv.org/pdf/1909.11065.pdf Object-Contextual Representations for Semantic Segmentation (이하 OCRNet)은 context schemes와 관련된 흐름의 연구이다. 이전에 리뷰했던 논문은 multi-scale context로 성능을 높였다면(PSPNet, DeepLab) 이 논문은 relational…
[ICCV2019]TextPlace: Visual Place Recognition and Topological Localization Through Reading Scene Texts
1 Abstract Text정보 Descriptor로 활용해 Place Recognition을 하는 첫번째 방법론, Text정보는 환경이 바뀌더라도 똑같은 정보를 갖는다. Metric localization을 제시함 Visual localization 방법론으로 방법론의 타당성을 증명한다….
![[arXiv14] Learning Spatiotemporal Features with 3D Convolutional Networks](https://server.rcv.sejong.ac.kr/wp-content/uploads/2020/08/image-104-480x51.png)

![[arXiv2017] Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset](https://server.rcv.sejong.ac.kr/wp-content/uploads/2020/08/image-82.png)
예은님 좋은 질문 감사합니다! 논문에서는 VLM 자체가 sub-step을 나누는 것을 학습하는데요, 이러한 sub-step instruction이 reasoning token으로 action expert에 condtion으로 들어가…