MPViT : Multi-Path vision Transformer for Dense Prediction
이번에 논문은 오래만이면서도 친숙한 backbone 논문입니다. 듣기로는 CVPR2022에 붙은 논문이라고 하는데, 아무튼 그렇습니다. Intro 제목에서도 대략적인 느낌을 아실 수 있으시겠지만, Dense Prediction(object detection, semantic segmentation…
[CVPR2020]Unsupervised Intra-domain Adaptation for Semantic Segmentation through Self-Supervision
합성 데이터를 이용하여 학습한 모델을 real 데이터에 적용할 때 어떤 방식을 활용하여 도메인간의 차이를 줄이는 지 알아보기 위해 읽게 된 논문입니다. CNN방식은 어노테이션 된 라벨링에…
[VISAPP2022] Transformers in Self-Supervised Monocular Depth Estimation with Unknown Camera Intrinsics
CVPR 제출논문을 RAL로 변경하고 있는 요즘…. Reference걸어야 될 거 같은 논문을 찾아다니고 있던 중 저의 심기를 건드는 논문이 등장해서 소개드리고자 합니다. 사실 이런 논문은 리뷰를…
Barlow Twins: Self-Supervised Learning via Redundancy Reduction
소개 [arXiv] Self-supervised learning은 collapsing solution 해결책으로 수렴하는 문제를 가지고 있습니다. collapsing solution의 발생 경위는 다음과 같습니다. 데이터 x를 모델의 입력으로 하여 이에 적합하게 라벨링 된…
SimCLR: A Simple Framework for Contrastive Learning of Visual Representations
MoCo에 이어 Self-Superviesd Learning 의 근본 시리즈 2번째 편입니다. 지난번에 리뷰한 MoCo 역시 Self-Supervised Learning과 관련한 논문이었는데요. 오늘 제가 리뷰하는 SimCLR를 읽고 근본 시리즈 1편이…
[CVPR 2017] Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset
Before Review 이번 논문은 Action Recognition 진영에서 가장 흔하게 사용되는 Backbone Network를 준비했습니다. 본 논문에서 제안된 I3D라는 Backbone Network는 Temporal Action Localization 진영에서도 가장 많이…
[ECCV 2016] End-to-end Learning of Deep Visual Representations for Image Retrieval
안녕하세요. 오늘은 Image retrieval 논문을 가져왔습니다. 연초에 비디오 검색 과제에서 활용하려고 visual search 논문들을 많이 읽었는데요. 이번 논문도 그 연장선이라고 보시면 됩니다. 논문 제목에서도 알…
DeepMeshFlow: Content Adaptive Mesh Deformation for Robust Image Registration
현재 진행중인 멀티스펙트럴 이미지를 정합할 때, Homography matrix는 이미지는 평면이라는 가정을 항상 내제하고 있어 완벽한 이미지의 align을 맞출 수 없어 방법을 찾다가 알게 된 논문입니다….
[2022 IEEE TII] Weakly Aligned Multimodal Flame Detection for FireFighting Robots
이번에 소개해드릴 논문은 impact factor 10정도 되는 IEEE 저널인 Transactions on Industrial Informatics에 2022년에 실린 논문입니다. 해당 논문은 FLIR v2 데이터셋에 존재하는 unpaired 상황을 다룰만한…
[ICCV 2019]Deep Hough Voting for 3D Object Detection in Point Clouds
오늘은 이전 리뷰와 세미나에서 다룬 2.5D Votenet의 근간인 VoteNet에 대해 리뷰하고자 합니다. 해당 방법론은 효율적으로 포인트 클라우드만 이용하여 3차원 물체 검출의 SOTA를 달성한 방법론입니다. 포인트…
안녕하세요 지연님 좋은 리뷰 감사합니다. SGM 설명해주시는 부분에서 저는 문맥상 SGM이 학습시에만 사용되서 visual feature가 context정보를 학습하도록 돕는다고 이해했는데 "SGM은…