[일:] 2021년 03월 22일
[arXiv2021] Is Space-Time Attention All You Need for Video Understanding?
최근 NLP 분야에서 CNN이나 RNN과는 구조가 아예 다른 self-attention 기반 방법론인 Transformer가 등장했고 좋은 성능을 내며 SOTA를 달성하고 있습니다. 더불어 컴퓨터비전 분야에서도 이러한 Transformer 구조를…
Revisiting the LossWeight Adjustment in Object Detection
딥러닝을 학습 시키기 위해서는 정답과 추정된 무언가를 비교한 Loss가 매우 중요하다. 우리는 이 Loss를 모델의 원하는 학습 방향성으로 두고 있기 때문이다. 그리고 좀 더 원하는…
ACTION-Net: Multipath Excitation for Action Recognition
논문 소개본 논문은 video understanding의 핵심적인 문제인 video action recognition task를 해결하기 위한 모델을 2D CNNs, 3D CNNs으로 나눈다. 본 논문은 2D CNNs는 비디오의 시간적…
[ICCV 2017] Mask R-CNN
2017년에 발표된 Mask R-CNN에 대해 리뷰하겠습니다. Instance Segmentation 는 Semantic Segmentation과 달리 아래 그림처럼 같은 class 중에서도 instance 별로 구별하는 task 입니다. 본 논문에서는 instance…
[CVPR 2021] Semantic Segmentation for Real Point Cloud Scenes via Bilateral Augmentation and Adaptive Fusion
해당 논문은 Point cloud로부터 Semantic Segmentation을 푸는 방법이며, Point의 geometry 정보와 point로부터 feature를 추출한 정보 같이 사용한 Point based method로 SOTA를 달성한 방법론입니다. Method 해당…
[CVPR2019] Hue-Net: Intensity-based Image-to-Image Translation with Differentiable Histogram Loss Functions
이번 리뷰는 CVPR2019 논문인 Hue-Net입니다. 해당 논문이 수식도 많고(29개ㄷㄷ) 개념도 만만치않아서 중간중간 넘어가며 정리한 내용들이 많습니다. 리뷰 읽으실 때 그냥 가볍게 이런게 있구나 하고 읽는…
최신 댓글