[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
Speech Recognition Domain 정리
안녕하세요. URP를 마치고 3주가 지나고 이렇게 첫 X-REVIEW를 작성하는 시기가 왔네요. 이번 X-REVIEW는 논문 리뷰가 아닌 음성 도메인과 관련하여 공부한 것을 정리한 글입니다. 간략하게 목차를…
[ICCV 2021] Foreground-Action Consistency Network for Weakly Supervised Temporal Action Localization
이번 X-Review에서 제가 소개해드릴 논문은 2021년 ICCV에 게재된 ‘Foreground-Action Consistency Network for Weakly Supervised Temporal Action Localization’ 이라는 논문입니다. 편의 상 줄여서 ‘FACNet’이라고 칭하겠습니다. 이…
[CIKM 2022] e-CLIP: Large-Scale Vision-Language Representation Learning in E-commerce
갑자기 멀티모달을 왜 읽었느냐….에 대해서는 이번에는 감정인식 때문은 아니고요. 네이버 쇼핑에서 데이터를 수집해서 논문을 쓰고있는데… 갑자기 네이버 쇼핑에서 멀티모달로 무엇인가를 하는 논문을 냈다고 홍보하는 네이버…
[CVPR2022]Align Representations with Base: A New Approach to Self-Supervised Learning
논문 소개 본 논문은 self-supervised learning의 메인스트림중 하나인 contrastive learning에서 발생하는 collapse 문제를 해결하기 위한 논문이다. 인공지능 모델의 학습에서 collapse 현상이란 모델의 출력이 하나의 형태로 수렴하게되는 경우인데,…
[CVPR2022]A Simple Data Mixing Prior for Improving Self-Supervised Learning
한줄 소개: Self supervised learning에 적용하기 위한 최고의 Data Mixing 기술 본 논문은 self-supervised setting에 적용하여 데이터 증폭을 통해 학습의 효율성을 높일 수 있는 새로운…
[ICASSP 2020] Multi-Conditioning and Data Augmentation Using Generative Noise Model For Speech Emotion Recognition in Noisy Conditions
저 역시 이광진 연구원과 마찬가지로 기존에 리뷰하지 않던 “음성 도메인”의 논문을 읽어봤습니다. 해당 논문은 감정인식 과제 중 1차년도 베이스라인으로 선정한 논문입니다. 해당 논문은 음성 감정인식에서의…
[arXiv 2022]Efficient Deep Visual and Inertial Odometry with Adaptive Visual Modality Selection
제가 이번에 리뷰 할 논문은 카메라 센서(Visual 정보)와 IMU 센서(Inertial 정보)를 활용하여 움직임의 변화 정도를 측정하는 task인 VIO(visual-inertial odometry) 논문으로 ECCV 2022에 제출되었다고 합니다. 딥러닝…
[CVPR 2022] Weakly Supervised Temporal Action Localization via Representative Snippet Knowledge Propagation (Part.2)
Before Review 지난 논문 리뷰에 이어서 나머지 부분을 작성하도록 하겠습니다. Part를 나누어 리뷰하는 이유는 Supplementary에 더 자세한 내용이 담겨져 있어 이를 리뷰에 포함해야하는 데 하나의…
[AAAI 2021] Weakly-supervised Temporal Action Localization by Uncertainty Modeling
안녕하세요. 오늘 제가 리뷰할 논문은 21년도 AAAI에 게재된 ‘Weakly-supervised Temporal Action Localization by Uncertainty Modeling’ 이라는 논문입니다. 이전에 작성한 리뷰에서 제가 비디오 분야의 Weakly-supervised Temporal…
[ICASSP-2018] A Wavenet for Speech Denoising
안녕하세요. 왜 갑자기 안읽던 분야의 논문을 들고왔는지 의아해하시는 분들이 있을 것 같습니다만… 감정인식 과제의 1차년도가 제 아이디어가 많이 들어가서 그에 대한 책임감으로… 해당 논문을 읽어볼…
최신 댓글