Author: rcvlab
[2022-하계][천혜원] URP를 마치며
안녕하세요 2022 하계 URP 프로그램을 이수한 지능기전공학부 무인이동체공학전공 천혜원입니다. 이 후기를 통해 제 생각을 정리하였고, 저와 비슷한 고민거리를 안고 계신 분들에게 미약한 도움이나마 될 수…
[2022-하계][이현우] URP를 마치며
안녕하세요 건축공학과에서 전과하여 현재는 전자정보통신공학과에 재학 중인 18학번 이현우라고 합니다. 이후에 URP 프로그램을 참여할지 고민하시는 분들께 조금이나마 참고할 수 있는 글이 되었으면 하는 바람으로 RCV연구실에서…
[2022-하계][이상인] URP를 마치며
안녕하세요. 저는 소프트웨어학과 3학년 재학 중이며, 이번 URP를 마치고 9월부터 RCV Lab에 합류할 예정인 이상인입니다. 현재 제 텍스트를 보시는 분들은 이미 URP 프로그램에 지원하셨거나 혹은…
[2022-하계][김주연] URP를 마치며
안녕하세요! 2022년 URP 하계 과정을 마친 데이터사이언스학과 4학년 김주연입니다. 이 글을 읽고 계신분은 분명 URP에 관심이 있거나, 대학원에 관심이 있으신 분이겠죠? 저는 고민끝에 학부연구생을 계속하기로…
[arXiv 2021] Multimodal End-to-End Sparse Model for Emotion Recognition
감정인식 관련 논문입니다. 저번 리뷰의 음성 인식처럼 한 가지 모달리티가 아니라, 총 세 가지의 모달리티 (video, audio, text) 를 이용하여 감정을 인식하는 task 에 대해…
[ICASSP 2020] Multi-Conditioning and Data Augmentation Using Generative Noise Model for Speech Emotion Recognition in Noisy Conditions
이번에도 Speech Emotion Recognition (SER) 관련 논문입니다. 음성 인식 분야에서는 노이즈(잡음)가 모델의 성능에 영향을 끼치는 중요한 요인 중 하나입니다. 본 논문은 ‘생성 모델’을 사용하여 만든…
[EAIS 2020] Emotions Understanding Model from Spoken Language using Deep Neural Networks and Mel-Frequency Cepstral Coefficients
음성으로부터 사람의 감정을 인식하는 문제, Speech Emotion Recognition (SER) 관련 논문입니다. 본 논문의 핵심 아이디어는 CNN 기반 모델을 이용하여 SER 문제를 해결하는 것입니다. 해당 모델은…
[arXiv 2022] Cross Modal Retrieval with Querybank Normalisation
Text-to-Video Retrieval 을 위한 모델의 성능을 ‘추가적인 학습 없이’ 향상 시켜줄 수 있는 방법이라 읽게 되었습니다. 이전에 리뷰했던 TVR 방법론인 DRL 같은 경우도, 해당 프레임워크에…
[arXiv 2022] Disentangled Representation Learning for Text-Video Retrieval
현재 Text-to-video retrieval 에서 SOTA 를 달성하고 있는 논문입니다. 중국의 유명한 인터넷 플랫폼 서비스 기업인 ‘alibaba’에 속한 인공지능 연구기관 ‘DAMO academy’에서 나온 논문이에요. 리뷰 시작하도록…
[ECCV 2018] A Joint Sequence Fusion Model for Video Question Answering and Retrieval
우선, 요즘 MSR-VTT 데이터셋을 이용하는 원복 실험을 하는 중인데, text-clip retrieval 의 경우 해당 논문에서 사용한 방법으로 evaluate 를 하길래 읽게 되었습니다. (이 내용이 핵심은…
최신 댓글