Author: 김 태주
[NeurIPS 2017]”Attention is all you need” – Transformer
현재 이미지 분류 분야에서 SOTA를 달성한 “AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE “(ViT)는 NLP의 “Attention is all you need”…
NLP- RNN, LSTM, Seq2Seq, Attention Mechanism
해당 리뷰는 현재 Image Classification task에서 SOTA를 달성한 ViT를 이해와 attention에 대한 이해, ViT를 보고 타 task와 vision task의 접목이 연구 방향성과 결과에 큰 영향을…
MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications
해당 논문은 모바일이나 비전이 사용되는 임베디드 어플리케이션에서 효율적인 사용이 가능하도록 설계된 딥러닝 모델을 제안합니다. Intro 기기의 성능 향상과 함께 AlexNet이나 VGG-16 같은 딥러닝 모델이 등장하면서…
[KCCV 2020 ICCV 2019]Joint Learning of Semantic Alignment and Object Landmark Detection
해당 논문은 최종적으로는 같은 클래스이지만 다른 사례가 담겨진 영상으로부터 같은 부분을 찾을 수 있도록하는 semantic correspondence를 찾는 방법론입니다. semantic correspondence에 대한 예를 들자면 다양한 인종의…
[스터디] From Fully-Connected Layers to Convolutions
작성 중 해당 리뷰는 Dive into Deep Learning(https://d2l.ai/index.html)의 6장 Convolutional Neural Networks의 1절 From Fully-Connected Layers to Convolutions의 내용을 가져왔습니다. fcn에서 conv layer로 변경시키며 설명해주는…
[CVPR 2020]Learning Architectures for Binary Networks
해당 논문은 연산량과 메모리를 극단적으로 줄여주는 방법 중인 하나인 precision을 Binary로 사용하는 Binary network에 모델의 구조와 하이퍼 파라미터를 학습하여 모델을 만드는 Neural Architectures Search(NAS)를 적용하여…
[KCCV/CVPR2020] Cylindrical Convolutional Networks for Joint Object Detection and Viewpoint Estimation
이번 리뷰는 KCCV OE-03( 8/18 )에서 발표된 논문이며, 라이브로 해당 연구의 발표를 들으면서도 많은 흥미를 가지고 본 논문이기도 합니다. 최근 챌린지를 통해 3D object에 대한…
Visual SLAM algorithms: a survey from 2010 to 2016 – part 2
이전 리뷰에서 기초적인 visual SLAM을 구성하는 모듈들을 통해 소개를 하고, 영상에서 추출한 feature detector, descriptor를 이용한 feature-base visual SLAM을 소개했습니다. 이번 리뷰에서는 feature가 아닌 영상…
Visual SLAM algorithms: a survey from 2010 to 2016 – part 1
이번 리뷰는 이전부터 하고 싶었던 비전 기반의 Simultaneous localization and mapping(SLAM)에 대한 전반적인 흐름과 종류에 대해 알아보려고 합니다. ++내용이 생각보다 길어 part 1 과 part…
최신 댓글