Author: rcvlab
[2022-하계][이상인] URP를 마치며
안녕하세요. 저는 소프트웨어학과 3학년 재학 중이며, 이번 URP를 마치고 9월부터 RCV Lab에 합류할 예정인 이상인입니다. 현재 제 텍스트를 보시는 분들은 이미 URP 프로그램에 지원하셨거나 혹은…
[2022-하계][김주연] URP를 마치며
안녕하세요! 2022년 URP 하계 과정을 마친 데이터사이언스학과 4학년 김주연입니다. 이 글을 읽고 계신분은 분명 URP에 관심이 있거나, 대학원에 관심이 있으신 분이겠죠? 저는 고민끝에 학부연구생을 계속하기로…
[arXiv 2021] Multimodal End-to-End Sparse Model for Emotion Recognition
감정인식 관련 논문입니다. 저번 리뷰의 음성 인식처럼 한 가지 모달리티가 아니라, 총 세 가지의 모달리티 (video, audio, text) 를 이용하여 감정을 인식하는 task 에 대해…
[ICASSP 2020] Multi-Conditioning and Data Augmentation Using Generative Noise Model for Speech Emotion Recognition in Noisy Conditions
이번에도 Speech Emotion Recognition (SER) 관련 논문입니다. 음성 인식 분야에서는 노이즈(잡음)가 모델의 성능에 영향을 끼치는 중요한 요인 중 하나입니다. 본 논문은 ‘생성 모델’을 사용하여 만든…
[EAIS 2020] Emotions Understanding Model from Spoken Language using Deep Neural Networks and Mel-Frequency Cepstral Coefficients
음성으로부터 사람의 감정을 인식하는 문제, Speech Emotion Recognition (SER) 관련 논문입니다. 본 논문의 핵심 아이디어는 CNN 기반 모델을 이용하여 SER 문제를 해결하는 것입니다. 해당 모델은…
[arXiv 2022] Cross Modal Retrieval with Querybank Normalisation
Text-to-Video Retrieval 을 위한 모델의 성능을 ‘추가적인 학습 없이’ 향상 시켜줄 수 있는 방법이라 읽게 되었습니다. 이전에 리뷰했던 TVR 방법론인 DRL 같은 경우도, 해당 프레임워크에…
[arXiv 2022] Disentangled Representation Learning for Text-Video Retrieval
현재 Text-to-video retrieval 에서 SOTA 를 달성하고 있는 논문입니다. 중국의 유명한 인터넷 플랫폼 서비스 기업인 ‘alibaba’에 속한 인공지능 연구기관 ‘DAMO academy’에서 나온 논문이에요. 리뷰 시작하도록…
[ECCV 2018] A Joint Sequence Fusion Model for Video Question Answering and Retrieval
우선, 요즘 MSR-VTT 데이터셋을 이용하는 원복 실험을 하는 중인데, text-clip retrieval 의 경우 해당 논문에서 사용한 방법으로 evaluate 를 하길래 읽게 되었습니다. (이 내용이 핵심은…
[ICCV 2019] HowTo100M: Learning a Text-Video Embedding by Watching Hundred Million Narrated Video Clips
Text-Video 데이터셋으로 많이 쓰이는 HowTo100M 에 대한 리뷰입니다. 본 논문의 주요 컨트리뷰션은 아래의 세 가지 입니다. 기존 데이터셋들보다 Large-scale 인, Text-Video 데이터셋 HowTo100M 제안 HowTo100M을…
[PMLR 2021] Learning Transferable Visual Models From Natural Language Supervision
image가 주어졌을 때, 그에 대한 text 를 prdict 하는 것을 목적으로 pretrained 된 모델, CLIP에 대한 리뷰입니다. 우선 CLIP은 Contrastive Language-Image Pretraining 의 약자인데요. 이…
최신 댓글