[카테고리:] Paper
Paper Review
[CVPR 2021] Spatiotemporal Contrastive Video Representation Learning
이번에 리뷰할 논문은 self-supervised video representation을 다룬 “Spatiotemporal Contrastive Video Representation Learning” 이라는 논문입니다. 해당 논문에서는 CVRL이라는 video representation learning을 위한 데이터 augmentation 기법을 통해…
[NAACL 2018] BERT : Pre-training of Deep Bidirectional Transformers for Language Understanding
Before Review 이번 리뷰는 자연어처리 논문을 읽게 되었습니다. BERT라고 해서 아마 한번쯤을 들어보셨을 법한 논문을 읽게 되었는데요, 이번 캡스톤 주제중 하나인 Text-to Video 논문을 읽을라고…
[PMLR 2021] Learning Transferable Visual Models From Natural Language Supervision
image가 주어졌을 때, 그에 대한 text 를 prdict 하는 것을 목적으로 pretrained 된 모델, CLIP에 대한 리뷰입니다. 우선 CLIP은 Contrastive Language-Image Pretraining 의 약자인데요. 이…
[arXiv 2021] QAHOI: Query-Based Anchors for Human-Object Interaction Detection
Action Recognition을 위해, person과 object 간의 interaction과 관련된 논문을 찾아보던 중, Human-Object Interaction (HOI)라는 분야를 알게되어 관련 논문을 리뷰하고자합니다. Action Recognition 분야에서는 현재 scene bias한…
[ICRA 2019] Build your own hybrid thermal/EO camera for autonomous vehicle
이번 논문은 제 연구 계획에서 핵심인 센서 팩 계획에 영감을 준 논문 중 하나입니다. 해당 논문은 빔스플리트를 이용한 광학 정합을 이용한 RGB-Thermal 센서 팩을 구조를…
[VISAPP2022] Transformers in Self-Supervised Monocular Depth Estimation with Unknown Camera Intrinsics
CVPR 제출논문을 RAL로 변경하고 있는 요즘…. Reference걸어야 될 거 같은 논문을 찾아다니고 있던 중 저의 심기를 건드는 논문이 등장해서 소개드리고자 합니다. 사실 이런 논문은 리뷰를…
Barlow Twins: Self-Supervised Learning via Redundancy Reduction
소개 [arXiv] Self-supervised learning은 collapsing solution 해결책으로 수렴하는 문제를 가지고 있습니다. collapsing solution의 발생 경위는 다음과 같습니다. 데이터 x를 모델의 입력으로 하여 이에 적합하게 라벨링 된…
[CVPR 2017] Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset
Before Review 이번 논문은 Action Recognition 진영에서 가장 흔하게 사용되는 Backbone Network를 준비했습니다. 본 논문에서 제안된 I3D라는 Backbone Network는 Temporal Action Localization 진영에서도 가장 많이…
DeepMeshFlow: Content Adaptive Mesh Deformation for Robust Image Registration
현재 진행중인 멀티스펙트럴 이미지를 정합할 때, Homography matrix는 이미지는 평면이라는 가정을 항상 내제하고 있어 완벽한 이미지의 align을 맞출 수 없어 방법을 찾다가 알게 된 논문입니다….
[2022 IEEE TII] Weakly Aligned Multimodal Flame Detection for FireFighting Robots
이번에 소개해드릴 논문은 impact factor 10정도 되는 IEEE 저널인 Transactions on Industrial Informatics에 2022년에 실린 논문입니다. 해당 논문은 FLIR v2 데이터셋에 존재하는 unpaired 상황을 다룰만한…
최신 댓글