Author: 천 혜원
[CVPR 2015] Fully Convolutional Networks for Semantic Segmentation
Introduction intro에서는 이 당시 등장했던 cnn classification모델인 alexnet, vgg, googlenet을 설명하며 이들의 구조에 관해 이야기합니다. 기존 cnn모델은 [그림 1]과 같이 convolution을 이용해 특징을 추출하고, 이를…
[CVPR 2018] Non-local Neural Networks
Introduction convolution은 연산 방식이 일정 크기의 커널을 이미지에 windowing하면서 연산을 진행하기 때문에, local한 관계에 집중합니다. 그러다 보니 [ 그림1 ]과 같이 멀리 떨어진 픽셀은 좀…
<2022년 RCV 연구실 생활을 마무리 하며>
안녕하세요. 이 글에서는 2022년 RCV 생활을 돌아보며 2023년의 목표를 정리하고자 합니다. urp를 마치고 연구실에 들어온 지 4개월이란 시간이 흘렀습니다. 그 동안의 활동을 돌아보니 정말 시간이…
[NeurIPS 2019] Stand-Alone Self-Attention in Vision Models
Introduction CNN은 강한 inductive bias와 translation equivariance와 같은 특성으로 이미지 관련 task에서 엄청난 성능 향상을 불러일으나, 큰 receptive fields에 대한 scaling properties가 좋지 않아 long range…
[ICASSP 2021] MarbleNet: Deep 1D Time-Channel Separable Convolutional Neural Network for Voice Activity Detection
1. Introduction Voice activity detection이란 입력 오디오를 speech segment와 non-speech segment로 분류하는 Task입니다. [그림 1]과 같이 신호에서 음성 구간이 어디인지를 찾는 것이라고 생각 하시면 됩니다….
[2019 IEEE TASLP] Speech Emotion Classification Using Attention-Based LSTM
Introduction Speech Emotion Recognition 분야에서는 음성 신호로부터 감정을 분류하기 위해 많은 연구가 진행되었고 최근에는 딥러닝이 발전하면서 SER에 CNN 같은 기법을 사용하기 시작했습니다. 위의 알고리즘이 감정인식…
최신 댓글