Author: 황 유진
Object-Contextual Representations for Semantic Segmentation
논문: https://arxiv.org/pdf/1909.11065.pdf Object-Contextual Representations for Semantic Segmentation (이하 OCRNet)은 context schemes와 관련된 흐름의 연구이다. 이전에 리뷰했던 논문은 multi-scale context로 성능을 높였다면(PSPNet, DeepLab) 이 논문은 relational…
X-Diary
1. 통상적인 학사과정과 석사과정 박사과정의 차이, 각 과정동안 배워야 할 것은 어떻게 다른가.학사과정:전공에 대해 탐색하나, 전공보다는 전체적인 학문의 넓이와 깊이를 갖고, 사고의 능력을 기르는 과정석사과정:전공에…
PSPNet & DeepLab
7월 27일 세미나시 발표한 PSPNet과 DeepLab을 정리한 내용입니다. ##PSPNet : Pyramid Scene Parsing NetworkPSPNet은 피라미드 구조를 적용하여 모델이 주변의 정보를 이용해 더 정확하게 예측할 수…
Fully Convolutional Network
21일 월요일 세미나때 설명드렸던 FCN에 관한 내용입니다! 혹시 세미나시 질문을 받지 못한 부분 여기에 질문해 주시면 감사드리겠습니다. FCN은 간단히 말하자면 그림 1에서 확인할 수 있듯이…
데이터 전처리와 가공법
이 게시물은 Dive into deep Learning 을 공부하며 정리한 것 입니다. 실습은 아마존이 선택하여 유명한 새로운(?)딥러닝 인터페이스 MXNet을 이용하나, Pytorch와 Tensorflow도 제공합니다.데이터 전처리 관련하여 mxnet의…
Smooth Adversarial Training
Abstract일반적으로 네트워크는 accurate(정교함)와 robust특성을 함께 갖을 수 없다고 알려져있다. 예를 들어 adversarial example에 robust한 특성을 갖기 위하여 clear한 input에 어려운 예제를 학습시켜 네트워크의 margin을 키운다….
NASTransfer: Analyzing Architecture Transferability in Large Scale Neural Architecture Search
https://arxiv.org/pdf/2006.13314.pdf Introduction NAS(Neural Architecture Search)는 automatic design of deep learning network를 위한 연구분야이다. 이는 몇몇 데이터셋에서는 인상깊으리만큼 좋은 결과를 내었지만, 어마어마한 연산량 때문에 large-scale tasks…
VirTex: Learning Visual Representations from Textual Annotations
Keywords: Image captioning, pretraining, transfer learning [논문링크] introduction시각적 표현을 학습하는데 있어 일반적으로 pretrain된 CNN을 이용한다. 이러한 접근법은 성공적이나, human workers에 의한 정보이므로 pretrain을 위한 데이터셋을…
[CVPR2020]PolarMask: Single Shot Instance Segmentation with Polar Representation
1. Abstract제안하는 Polar mask는 anchor-box free 방식의 single shot instance segmentation 기법이다. PolarMask는 instance segmentation 문제를 instance center분류 및 윤곽선을 예측하는 문제로 바꾸어 해결하였다. 그…
Energy base models
ICRA의 Plenary Talk 였던 Self-Supervised Learning & World Models를 이해하기 앞서 영상에서 많이 등장했지만 이해되지 않았던 개념을 정리하고자 합니다. 1. Energy base model (EBM) 접근법EBM은…
안녕하세요 재연님, 좋은 댓글 감사드립니다. 주신 질문이 단순한 기술 구현을 넘어서 왜 Detection 과 Segmentation을 명시적으로 분리해서 학습하고 예측하려고 하는지Perception…