[카테고리:] Paper

Paper Review

Posted in Paper X-Review

[arXiv 2022] VRAG: Region Attention Graphs for Content-Based Video Retrieval

오늘 소개드릴 논문은 Facebook에서 나온 “VRAG: Region Attention Graphs for Content-Based Video Retrieval”라는 논문으로, CBVR (Content-Based Video Retrieval), 즉, 제가 연구하고 있는 Video-to-video Retrieval 분야에서…

Continue Reading
Posted in Paper X-Review

BinsFormer: Revisiting Adaptive Bins for Monocular Depth Estimation

이번에 리뷰할 논문은 아래와 같이 Paper with codes, Monocular depth estimation 부문에서 일등을 기록하고 있는 Binsformer입니다. 이 논문 외에도 이 동일저자가 낸 Depthformer라는 논문 또한…

Continue Reading
Posted in Paper X-Review

[arXiv 2021] Multimodal End-to-End Sparse Model for Emotion Recognition

감정인식 관련 논문입니다. 저번 리뷰의 음성 인식처럼 한 가지 모달리티가 아니라, 총 세 가지의 모달리티 (video, audio, text) 를 이용하여 감정을 인식하는 task 에 대해…

Continue Reading
Posted in Paper X-Review

[CVPR2021] Visual Semantic Role Labeling for Video Understanding

오늘 리뷰할 논문은 이전 리뷰 에서 다루었던 논문의 motivation이 되었던 논문 “Visual Semantic Role Labeling for Video Understanding” 입니다. 기존 비디오 관련 분야에서는 video action…

Continue Reading
Posted in Conference News Paper X-Review

[CVPR2019] BASNet: Boundary-Aware Salient Object Detection

이번 리뷰 논문은 Salient Object Detection 논문 중 가장 보편적으로 인정 받는 방법론 입니다. 간단 명료한 네트워크 구조와 새로운 조합의 loss를 제안했습니다. 또한 Method 설명…

Continue Reading
Posted in Paper X-Review

[2022 CVPR] An Empirical Study of End-to-End Temporal Action Detection

Before Review 이번 논문 리뷰도 Temporal Action Detection(Localization) 논문을 가져왔습니다. Temporal Action Detection 관련 연구를 할 때 고려할만한 요인들을 여러 가지 소개해주면서 이 Task 자체에…

Continue Reading
Posted in Paper X-Review

Semi-Supervised Learning of Visual Features by Non-Parametrically Predicting View Assignments with Support Samples

소개 본 논문[pdf]은 non-parametrically 한 방식으로 unlabeled image의 psuedo label을 생성하여 학습하는 semi-supervised learning논문이다. labeled image로 구성된 support samples를 이용해 pseudo label을 생성하고 이를 학습에…

Continue Reading
Posted in Paper X-Review

[ICCV 2021] DOLG: Single-Stage Image Retrieval with Deep Orthogonal Fusion of Local and Global Features

최근에 읽고 있는 논문 시리즈의 마지막(?) 논문입니다. 최근 물체 중심 이미지 검색 논문들을 많이 보고있는데요. DELF → DELG → DOLG(Deep Orthogonal Local and Global feature…

Continue Reading
Posted in Paper X-Review

[CVPR2020]SuperGlue: Learning Feature Matching with Graph Neural Networks

1. Abstract 2개의 local feature의 대응되는 것을 찾고, 맞지않는 포인트는 거부하여 matching하는 SuperGlue라는 neural network를 소개한다. attention 기반의 super glue가 3D 장면 이해와 feature assignment를…

Continue Reading
Posted in Paper X-Review

[CVPR2021] AdaBins: Depth Estimation using Adaptive Bins

이번 리뷰에서 소개드릴 논문은 LiDAR를 GT로 사용하는 Supervised Monocular Depth Estimation에 관한 논문입니다. 일단 이 논문을 이해하려면 최근 Supervised 에서 Depth를 정의하는 방식부터 이해하셔야합니다. DPT나…

Continue Reading