[월:] 2022년 09월
[CVPR2022]Learning Where to Learn in Cross-View Self-Supervised Learning
간단 소개:Self-supervised learning(SSL)은 모델의 학습을 위해 이미지에서 물체의 불변성을 활용한다. 특히 이미지에 서로 다른 augmentations을 적용하여 학습에 사용하는데, 이때 random crop 등으로 object가 손실되거나 misalignment가…
[2019 IROS] DeepVIO: Self-supervised Deep Learning of Monocular Visual Inertial Odometry using 3D Geometric Constraints
제가 이번에 리뷰할 논문은 VIO 논문입니다. 여러 VIO 논문들이 DeepVIO 방법론과의 비교를 하고 있어 읽어보게 된 논문입니다. VIO를 지도학습으로 할 경우 좋은 성능을 얻을 수…
[CVPR 2022] Motion-aware Contrastive Video Representation Learning via Foreground-Background Merging
Before Review 이번 논문은 Self-Supervised 기반의 Video Representation Learning 논문을 읽게 되었습니다. 지난 리뷰랑 비슷한 점이 많습니다. 지난 리뷰 Background Erasing은 background를 추가하여 오히려 motion…
Speech Recognition Domain 정리
안녕하세요. URP를 마치고 3주가 지나고 이렇게 첫 X-REVIEW를 작성하는 시기가 왔네요. 이번 X-REVIEW는 논문 리뷰가 아닌 음성 도메인과 관련하여 공부한 것을 정리한 글입니다. 간략하게 목차를…
[ICCV 2021] Foreground-Action Consistency Network for Weakly Supervised Temporal Action Localization
이번 X-Review에서 제가 소개해드릴 논문은 2021년 ICCV에 게재된 ‘Foreground-Action Consistency Network for Weakly Supervised Temporal Action Localization’ 이라는 논문입니다. 편의 상 줄여서 ‘FACNet’이라고 칭하겠습니다. 이…
[CIKM 2022] e-CLIP: Large-Scale Vision-Language Representation Learning in E-commerce
갑자기 멀티모달을 왜 읽었느냐….에 대해서는 이번에는 감정인식 때문은 아니고요. 네이버 쇼핑에서 데이터를 수집해서 논문을 쓰고있는데… 갑자기 네이버 쇼핑에서 멀티모달로 무엇인가를 하는 논문을 냈다고 홍보하는 네이버…
[CVPR2022]Align Representations with Base: A New Approach to Self-Supervised Learning
논문 소개 본 논문은 self-supervised learning의 메인스트림중 하나인 contrastive learning에서 발생하는 collapse 문제를 해결하기 위한 논문이다. 인공지능 모델의 학습에서 collapse 현상이란 모델의 출력이 하나의 형태로 수렴하게되는 경우인데,…
[CVPR2022]A Simple Data Mixing Prior for Improving Self-Supervised Learning
한줄 소개: Self supervised learning에 적용하기 위한 최고의 Data Mixing 기술 본 논문은 self-supervised setting에 적용하여 데이터 증폭을 통해 학습의 효율성을 높일 수 있는 새로운…
[ICASSP 2020] Multi-Conditioning and Data Augmentation Using Generative Noise Model For Speech Emotion Recognition in Noisy Conditions
저 역시 이광진 연구원과 마찬가지로 기존에 리뷰하지 않던 “음성 도메인”의 논문을 읽어봤습니다. 해당 논문은 감정인식 과제 중 1차년도 베이스라인으로 선정한 논문입니다. 해당 논문은 음성 감정인식에서의…
[arXiv 2022]Efficient Deep Visual and Inertial Odometry with Adaptive Visual Modality Selection
제가 이번에 리뷰 할 논문은 카메라 센서(Visual 정보)와 IMU 센서(Inertial 정보)를 활용하여 움직임의 변화 정도를 측정하는 task인 VIO(visual-inertial odometry) 논문으로 ECCV 2022에 제출되었다고 합니다. 딥러닝…
최신 댓글