Optimization Theory (Convex Optimization Problems)
이제 본격적으로 최적화에 대해서 알아보도록 하겠습니다. 이전까지는 Convex Set이 무엇인지 그리고 Convex Function이 무엇인지 알아보는 과정을 거쳤습니다. 그러한 지식을 바탕으로 이제 최적화가 무엇이고 그 중…
[AAAI2017] Unsupervised Deep Learning for Optical Flow
이번에 소개드릴 논문은 Optical Flow 관련 논문입니다. 해당 논문은 2017년도에 나온 논문이기도 하며 제목도 Optical Flow를 Unsupervised 방식으로 학습한다는 것을 미루어보았을 때 매우 기초가 되는…
[EAIS 2020] Emotions Understanding Model from Spoken Language using Deep Neural Networks and Mel-Frequency Cepstral Coefficients
음성으로부터 사람의 감정을 인식하는 문제, Speech Emotion Recognition (SER) 관련 논문입니다. 본 논문의 핵심 아이디어는 CNN 기반 모델을 이용하여 SER 문제를 해결하는 것입니다. 해당 모델은…
[arXiv2015]Particular object retrieval with integral max-pooling of CNN activations
Abstract CNN feature를 이용한 이미지 representation 은 기존의 short-vector represnetation방식보다 좋은 성능을 낸다. 그러나 기하학적 정보가 필요한 re-ranking방식과 호환되지 않으며, 정확한 descriptor매칭, 기하학적 re-ranking, 또는…
[CVPR2022] MonoDTR: Monocular 3D Object Detection with Depth-Aware Transformer
TransDSSL 논문을 작성하면서 다음 연구주제로 생각하고 있던 것은 Self-supervised 로 Depth estimation을 한 후, 예측한 Depth를 Pseudo-LiDAR로 사용해서 3D object detection을 하는 것입니다. 따라서 현재…
[CVPR 2022] End-to-End Compressed Video Representation Learning for Generic Event Boundary Detection
이번에 가져온 리뷰는 “Event boundary detection”입니다. CVPR 2022 논문들 중에서 딱 보이길래… 눈길이 가서 읽었습니다. 이 “Event boundary detection”는 일반적인 이벤트의 경계를 찾는 task입니다. CVPR…
LEA-Net: Layer-wise External Attention Network for Efficient Color Anomaly Detection
안녕하세요. 이번에는 LEA-Net이라고 불리는 color reconstruction 기반 anomaly detection 논문에 대해서 리뷰해보겠습니다. 먼저 해당 논문을 읽게된 계기는 현재 작물질병검출 관련하여 논문을 작성중인데 작물질병검출 분야에서는 color…
[ACMM2017] Multispectral Object Detection for Autonomous Vehicles
4 종류의 스펙트럼 카메라(Visible, NIR, MIR, FIR) 를 이용해 촬영한 데이터셋 논문 입니다. 굉장히 투박해 보이지만 RGB, NIR, MIR, FIR 파장을 촬영할 수 있는 막강한(?)…
Boosting Contrastive Self-Supervised Learning with False Negative Cancellation
요약: 본 논문은 self-supervised의 발전을 이끈 contrastive learning의 positive, negative pair의 구성에서 False Negative의 존재에 대해 집중한 논문이다. Introduction: False negative 란 그림에서 보는 repel…
[arXiv 2022] Cross Modal Retrieval with Querybank Normalisation
Text-to-Video Retrieval 을 위한 모델의 성능을 ‘추가적인 학습 없이’ 향상 시켜줄 수 있는 방법이라 읽게 되었습니다. 이전에 리뷰했던 TVR 방법론인 DRL 같은 경우도, 해당 프레임워크에…
안녕하세요 건화님 댓글 감사합니다. 제가 설명을 부정확하게 한 것 같습니다. 단일 RGB 이미지를 통해 3D mesh를 만들어내는 image to 3D모델을…