Author: 천 혜원

Posted in X-Review

[AAAI 2021] Robust Lightweight Facial Expression Recognition Network with Label Distribution Training

최근에 distilation 기반 모델 경량화 논문을 읽으면서 모델의 knowledge를 학습에 활용하는 방법론에 관심이 생겼는데요, 논문 서베이를 진행하다 Label distribution Training이라는 task가 있어 한 번 공부해볼…

Continue Reading
Posted in X-Review

[NeurIPS 2021] VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and Text

오늘 리뷰할 논문은 transformers for multi model sept supervised to learning from low video, adeo and text라는 papar입니다. 본격적인 리뷰에 앞서 본 논문을 간단하게 소개하자면…

Continue Reading
Posted in X-Review

[ICASSP 2023] Fast Yet Effective Speech Emotion Recognition with Self-Distillation

이번에 리뷰할 논문은 ICASSP 2023의 Fast Yet Effective Speech Emotion Recognition with Self-Distillation으로 이전에 리뷰했던 self-distilation 기법을 음성 감정인식 분야에 적용한 논문입니다. 최신 논문 중…

Continue Reading
Posted in X-Review

[AAAI 2020] M3ER: Multiplicative Multimodal Emotion Recognition using Facial, Textual, and Speech Cues

Introduction 여느 논문처럼 감정인식 task의 중요성을 언급하는 것으로 시작하는데요, human-interactive에는 감정인식이 중요하며, 인간이 다른 사람의 감정을 유추할 때 그 사람의 표정, 말투, 행동 등을 종합적으로…

Continue Reading
Posted in X-Review

[ICCV 2019] Be Your Own Teacher: Improve the Performance of Convolutional Neural Networks via Self Distillation

Abstract 모델의 정확도가 중요한 도메인에서는 보다 깊고 넓게 레이어를 쌓는 방향으로 진행된다. 그러나 이러한 방식의 접근은 문제점이 있는데 바로 복잡한 모델 구조에 의해 연산량과 필요…

Continue Reading
Posted in News X-Review

[ICML 2021] EfficientNetV2: Smaller Models and Faster Training

Introduction 딥러닝 모델과 사용되는 데이터의 크기가 커짐에 따라 딥러닝의 training efficiency의 중요성 또한 증가하였으며, 관련 연구 또한 활발히 진행되었습니다. 대표적으로 CNN기반 모델에는 불필요한 batch norm을…

Continue Reading
Posted in X-Diary

<2023년도 상반기를 정리하며>

벌써 2023년도 상반기가 지나 새로운 x-diary를 작성할 시기가 왔습니다. 지난 6개월을 돌아보기 위해 개인적으로 노션에 작성해 둔 데일리 리포트를 찬찬히 읽어 보았고, 다 읽고 나서…

Continue Reading
Posted in X-Review

[TPAMI 2018]Fine-tuning CNN Image Retrieval with No Human Annotation

Introduction Instance image retrieval task는 query에 나타난 특정 object를 데이터베이스에 존재하는 large/unordered 이미지에서 찾는 것을 의미합니다. 이 과정은 주로 CNN을 통해 이루어지는데요, 적은 메모리 사용과…

Continue Reading
Posted in X-Review

[ICLR 2016]Particular object retrieval with integral max-pooling of CNN activations

image retrieval의 근본이라고 할 수 있는 r-mac 논문 리뷰입니다. VPR 논문을 읽고 보니 retrieval의 기본적인 방법론에 대해 정리해야겠다 싶어 2주간 해당 분야의 논문을 리뷰하고자 합니다….

Continue Reading
Posted in X-Review

[CVPR 2016] NetVLAD: CNN architecture for weakly supervised place recognition

Visual Place Recognition 분야의 논문을 읽어보려고 하다 Place Recognition의 베이스 논문이라고 할 수 있는 NetVLAD에 관한 이해가 우선되어야 할 것 같아 NetVLAD 논문을 읽게 되었습니다….

Continue Reading