Author: 천 혜원
[ICLR 2021] An Image is Worth 16×16 Words: Transformers for Image Recognition at Scale
Abstract nlp에서 transformer가 등장하고 해당 분야의 standard한 모델이 되었다. 이에 computer vision 에서도 이를 응용한 연구가 진행되었다. vision task에 attention을 사용한 것이 그 예이며, convolution…
[CVPR 2015] Fully Convolutional Networks for Semantic Segmentation
Introduction intro에서는 이 당시 등장했던 cnn classification모델인 alexnet, vgg, googlenet을 설명하며 이들의 구조에 관해 이야기합니다. 기존 cnn모델은 [그림 1]과 같이 convolution을 이용해 특징을 추출하고, 이를…
[CVPR 2018] Non-local Neural Networks
Introduction convolution은 연산 방식이 일정 크기의 커널을 이미지에 windowing하면서 연산을 진행하기 때문에, local한 관계에 집중합니다. 그러다 보니 [ 그림1 ]과 같이 멀리 떨어진 픽셀은 좀…
<2022년 RCV 연구실 생활을 마무리 하며>
안녕하세요. 이 글에서는 2022년 RCV 생활을 돌아보며 2023년의 목표를 정리하고자 합니다. urp를 마치고 연구실에 들어온 지 4개월이란 시간이 흘렀습니다. 그 동안의 활동을 돌아보니 정말 시간이…
[NeurIPS 2019] Stand-Alone Self-Attention in Vision Models
Introduction CNN은 강한 inductive bias와 translation equivariance와 같은 특성으로 이미지 관련 task에서 엄청난 성능 향상을 불러일으나, 큰 receptive fields에 대한 scaling properties가 좋지 않아 long range…
[ICASSP 2021] MarbleNet: Deep 1D Time-Channel Separable Convolutional Neural Network for Voice Activity Detection
1. Introduction Voice activity detection이란 입력 오디오를 speech segment와 non-speech segment로 분류하는 Task입니다. [그림 1]과 같이 신호에서 음성 구간이 어디인지를 찾는 것이라고 생각 하시면 됩니다….
[2019 IEEE TASLP] Speech Emotion Classification Using Attention-Based LSTM
Introduction Speech Emotion Recognition 분야에서는 음성 신호로부터 감정을 분류하기 위해 많은 연구가 진행되었고 최근에는 딥러닝이 발전하면서 SER에 CNN 같은 기법을 사용하기 시작했습니다. 위의 알고리즘이 감정인식…
안녕하세요. 리뷰 읽어주셔서 감사합니다. 아, 네 제가 여태 몇 번 리뷰와 세미나를 이 주제로 하며 새로운 Pruning 전략이 아니면 짚고…