Author: 김 주연

Posted in X-Review

[NeurIPS 2019] RUBi:Reducing Unimodal Biases for Visual Question Answering

안녕하세요. 이번 리뷰는 감정인식 분야가 아닌 생소한 VQA 논문을 가져와봤는데요. 이전에 김동진 교수님의 초청 세미나에서 debiasing 분야가 굉장히 흥미로워 이 논문을 일게 되었고, 이 논문을…

Continue Reading
Posted in X-Diary

KCCV 2023 참관기

안녕하세요. 이번에는 KCCV 2023 참관기에 대해서 작성해보자 합니다. <첫 느낌> KCCV에 대해서 가장 첫번째 느낀 점은 KCCV가 이전에 제가 참가했던 학회와 다른 성향의 학회 였다는…

Continue Reading
Posted in X-Review

[EMNLP 2022] UniMSE: Towards Unified Multimodal Sentiment Analysis and Emotion Recognitio

안녕하세요. 이번 리뷰는 조금 독특한 논문을 가져와봤습니다. ERC에 sentiment task도 같이 결합하여 해결하는 방법론인데요. 방법론이 조금 특이해서 읽는데 어려웠던 기억이 있습니다. 그럼 리뷰 시작하도록 하겠습니다….

Continue Reading
Posted in X-Review

[ICASSP 2022] AudioCLIP : Extending CLIP To Image, Text And Audio

23.07.19 : train 파트 내용 추가 안녕하세요. 제가 이전에 CLIP 논문을 리뷰하면서 text, visual modality을 audio, text, visual modality로 확장할 수는 없을까 생각한 적이 있는데요….

Continue Reading
Posted in X-Review

[ACL 2020] Don’t Stop Pretraining: Adapt Language Models to Domains and Tasks – Part1

안녕하세요. 오랜만에 자연어처리 분야 논문을 가져와봤는데요. 아이디어가 흥미로워서 가져와봤습니다. 이 논문은 놀랍게도 논문 속에서 수식이 한번도 등장 하지 않은데요. 근데 무려 Best Overall Paper 상을…

Continue Reading
Posted in X-Diary

<2023년도 상반기를 정리한다>

시간이 정말 빠르다는 것을 느끼는 한 주 입니다. 벌써 상반기가 지났내요. 아직 머릿속이 복잡한 상태여서 제가 잘 정리해서 말할 수 있을지 걱정은 되지만 한번 정리해보도록…

Continue Reading
Posted in X-Review

[ACL 2019] Multimodal Transformer for Unaligned Multimodal Language Sequences

안녕하세요. 이번에도 멀티모달 감정인식 논문입니다. 최신 논문이 아닌 2019년도 논문을 왜 들고 왔느냐 했을 때 이 논문이 multimodal transforemr 방법을 처음 제안한 논문이라고 봐도 무방하기…

Continue Reading
Posted in X-Review

[ICASSP 2023] Exploring Wav2Vec 2.0 fine tuning for improved speech emotion recognition

안녕하세요. 이번에는 음성 감정인식 논문을 가지고 와봤습니다. 제가 이번에 논문 작업에 들어가게 되는데 멀티모달 감정인식 논문에서 대부분 사전학습 모델을 사용하는 것을 알게 되어서 이 논문을…

Continue Reading
Posted in X-Review

[CVPR 2023] Decoupled Multimodal Distilling for Emotion Recognition

드디어 저도 CVPR 2023 논문 리뷰를 하네요. 오랜만에 감정인식 논문인거 같습니다. 그럼 논문 리뷰 시작하겠습니다. <Introduction> introduction에서는 여타 논문과 마찬가지로 Multimodal Emotion Recognition (여기에서는 MER로…

Continue Reading
Posted in X-Review

[ICML 2021] Learning Transferable Visual Models From Natural Language Supervision

<1. Introduction and motivating work> raw text로부터 직접적으로 학습하는 사전학습 방법들은 지난 몇년동안 NLP 분야에서 진화되어왔습니다. standardized input-output inference으로 “text-to-text”가 발전하면서 작업에 구애받지 않는 다운스트림…

Continue Reading