Author: 황 유진
PSPNet & DeepLab
7월 27일 세미나시 발표한 PSPNet과 DeepLab을 정리한 내용입니다. ##PSPNet : Pyramid Scene Parsing NetworkPSPNet은 피라미드 구조를 적용하여 모델이 주변의 정보를 이용해 더 정확하게 예측할 수…
Fully Convolutional Network
21일 월요일 세미나때 설명드렸던 FCN에 관한 내용입니다! 혹시 세미나시 질문을 받지 못한 부분 여기에 질문해 주시면 감사드리겠습니다. FCN은 간단히 말하자면 그림 1에서 확인할 수 있듯이…
데이터 전처리와 가공법
이 게시물은 Dive into deep Learning 을 공부하며 정리한 것 입니다. 실습은 아마존이 선택하여 유명한 새로운(?)딥러닝 인터페이스 MXNet을 이용하나, Pytorch와 Tensorflow도 제공합니다.데이터 전처리 관련하여 mxnet의…
Smooth Adversarial Training
Abstract일반적으로 네트워크는 accurate(정교함)와 robust특성을 함께 갖을 수 없다고 알려져있다. 예를 들어 adversarial example에 robust한 특성을 갖기 위하여 clear한 input에 어려운 예제를 학습시켜 네트워크의 margin을 키운다….
NASTransfer: Analyzing Architecture Transferability in Large Scale Neural Architecture Search
https://arxiv.org/pdf/2006.13314.pdf Introduction NAS(Neural Architecture Search)는 automatic design of deep learning network를 위한 연구분야이다. 이는 몇몇 데이터셋에서는 인상깊으리만큼 좋은 결과를 내었지만, 어마어마한 연산량 때문에 large-scale tasks…
VirTex: Learning Visual Representations from Textual Annotations
Keywords: Image captioning, pretraining, transfer learning [논문링크] introduction시각적 표현을 학습하는데 있어 일반적으로 pretrain된 CNN을 이용한다. 이러한 접근법은 성공적이나, human workers에 의한 정보이므로 pretrain을 위한 데이터셋을…
[CVPR2020]PolarMask: Single Shot Instance Segmentation with Polar Representation
1. Abstract제안하는 Polar mask는 anchor-box free 방식의 single shot instance segmentation 기법이다. PolarMask는 instance segmentation 문제를 instance center분류 및 윤곽선을 예측하는 문제로 바꾸어 해결하였다. 그…
Energy base models
ICRA의 Plenary Talk 였던 Self-Supervised Learning & World Models를 이해하기 앞서 영상에서 많이 등장했지만 이해되지 않았던 개념을 정리하고자 합니다. 1. Energy base model (EBM) 접근법EBM은…
[ICCV2019]Human uncertainty makes classification more robust
이 논문은 인간의 불확실성을 담은 데이터의 효용성에 대해 다루었다. 보면서 Knowledge Distillation(모델증류) 기법이 떠올랐는데, 논문에서는 모델 증류기법은 soft label을 위해 network를 사용하기 때문에 확실한 기준이…
[2020]학부연구생의 연구한바퀴
ICRA 2020 동영상 녹화를 마무리하며, 학부연구생으로서 경험한 연구원 생활을 정리하려 합니다. 사실 아직 발표 공개도, 질의도 받지 않아 한바퀴를 돌았다고 할 수 는 없고, 전에…
질문 감사합니다. 우선 action encoder로 사용한 RenderNet을 찾아보니, 일관성 있는 캐릭터와 고품질 이미지를 생성하고 제어할 수 있는 강력한 AI 이미지…