[월:] 2022년 11월
[ICASSP 2021] MarbleNet: Deep 1D Time-Channel Separable Convolutional Neural Network for Voice Activity Detection
1. Introduction Voice activity detection이란 입력 오디오를 speech segment와 non-speech segment로 분류하는 Task입니다. [그림 1]과 같이 신호에서 음성 구간이 어디인지를 찾는 것이라고 생각 하시면 됩니다….
[TR 2018] Robust Intrinsic and Extrinsic Calibration of RGB-D Cameras
이번 리뷰 논문은 RGBD 카메라 캘리브레이션 방법론을 다룬 논문입니다. Intro RGBD는 크게 Structure-of-Light (SL)과 Time-of-Flight (ToF) 두 가지 타입의 센서로 구분이 됩니다. SL은 스테레오 방식을…
[WACV2022]Class-Balanced Active Learning for Image Classification
Abstract class-balance가 무너진 long-tail data문제는 deep learning 모델의 학습을 어렵게 하는 문제 중 하나이다. Active learning에서도 data imbalnce문제는 큰 학습 성능 저하를 발생시키는데, 본 논문은…
[ICML 2022] Active Learning on a Budget: Opposite Strategies Suit High and Low Budgets
바로 직전에 Active Learning 과 Self-supervised learning 을 결합한 논문을 읽어보며 새로 알게된 지식이 있다면 바로 initial labeled dataset size에 대한 것입니다. 해당 논문에서는 AL의…
[ICRA 2019]BooM-VIO: Bootstrapped Monocular Visual-Inertial Odometry with Absolute Trajectory Estimation through Unsupervised Deep Learning
Abstract 전통적인 model-based 방법론이 딥러닝 기반의 방법론보다 당시에 좋은 성능을 나타냈다고 합니다. 해당 논문은 Bootstrapped Monocular VIO(BooM)이라는 방법론을 제안하여 전통적인 방법론을 통해 얻을 수 있는…
[TPAMI 2020] Deep High-Resolution Representation Learning for Visual Recognition
오늘 제가 리뷰한 논문은 HRNet이라고 잘 알려진 backbone 논문입니다. 저번주에 리뷰한 segmentation 논문에서 pseudo label을 생성하는 모델로 바로 이 HRNet을 사용 했었습니다.그래서 전 단순히 segmentation을…
[ECCV 2018] CBAM: Convolutional Block Attention Module
CBAM: Convolutional Block Attention Module 안녕하세요. 첫 X-Review 글입니다. 해당 논문은 이번 KRoC 2023을 준비하며 읽은 논문으로, 어떤 아이디어를 토대로 실험했는지는 마지막 문단에서 왜 해당…
최신 댓글