[CVPR 2023] Boosting Weakly-Supervised Temporal Action Localization with Text Information
안녕하세요. 이번 주의 X-Review에서 소개해드릴 논문은 2023년도 CVPR에 게재된 <Boosting Weakly-Supervised Temporal Action Localization with Text Information> 입니다. 사실 세미나 때 발표드려 본 논문의 컨셉을…
<2023년도 상반기를 정리하며>
안녕하세요. 백지오입니다.오늘로 제가 연구실에 들어온지도 URP를 기준으로 벌써 6개월이 되었습니다. RCV랩에서 다함께 공부하고, 웃고 하다 보니 그 어느 때보다 빨리 지나간 상반기였던 것 같은데요. 이번 글을 통해 여러모로 알찼던 지난 상반기를 리뷰해…
[CVPR2021] LoFTR: Detector-Free Local Feature Matching with Transformers
이번에 소개드릴 논문은 cvpr21년도에 게재된 LoFTR이라고 하는 방법론입니다. 해당 방법론은 Place Recognition, Localization task에 관심이 있으신 분들이라면 아실법한 superpoint & superglue와 비슷한 결의 논문이라고 생각하시면…
[CVPR 2022] Contextualized Spatio-Temporal Contrastive Learning with Self-Supervision
오늘도 SSL에 관한 논문을 들고왔습니다. 지난번 논문의 연장선(?) 같은 느낌인데요. 이 논문에서도 pretext-task 없이 representation을 학습하는게 detection과 같은 Task에서 더 성능이 좋다는 논문입니다. Introduction 이미지…
[ICLR 2021] AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE
안녕하세요. 백지오입니다. 일곱 번째 X-REVIEW는 그 유명한 Vision Transformer (ViT)를 소개한 논문입니다.2017년 등장한 트랜스포머는 자연어 처리 분야에서 그야말로 혜성처럼 등장해 수많은 task들을 정복해나갔습니다. 트랜스포머의 강점은…
[CVPR 2020]PVN3D: A Deep Point-wise 3D Keypoints Voting Network for 6DoF Pose Estimation
제가 이번에 리뷰할 논문도 6D Pose Estimation 논문입니다. 해당 논문은 2020 CVPR 논문으로, 제가 최근에 리뷰한 FFB6D논문이 베이스로 삼았던 논문이라 읽고 리뷰하게 되었습니다. FFB6D가 궁금하신…
[CVPRW 2021] A mathematical Analysis of Learning Loss for Active Learning
Active Learning 논문 작업에 베이스라인으로 삼은 연구에 대한 수학적 분석을 시도했다는 워크샵 논문을 리뷰해보려고 합니다. 다만 오늘의 리뷰는 다소 선택적(???) 으로 리뷰할 것 같습니다. 해당…
[TPAMI 2018]Fine-tuning CNN Image Retrieval with No Human Annotation
Introduction Instance image retrieval task는 query에 나타난 특정 object를 데이터베이스에 존재하는 large/unordered 이미지에서 찾는 것을 의미합니다. 이 과정은 주로 CNN을 통해 이루어지는데요, 적은 메모리 사용과…
[ICCV2021]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
안녕하세요 ! 네 번째 x-review입니다. 바로 시작하겠습니다. ? Introduction nlp에서 사용되는 transformer를 computer vision에 적용한다면 image와 text 두 modality 차이로 다음의 두 가지 challenge가 존재합니다….
[CVPR 2018] VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection
안녕하세요 ! 4번째 x-review 역시 3D Data를 다루는 논문을 읽어보았습니다. 그럼 바로 리뷰 시작하겠습니다. 1. Introduction 3D Object Detection에서는 LiDAR 센서를 통해 2D 이미지와 다르게…
안녕하세요 지연님 좋은 리뷰 감사합니다. SGM 설명해주시는 부분에서 저는 문맥상 SGM이 학습시에만 사용되서 visual feature가 context정보를 학습하도록 돕는다고 이해했는데 "SGM은…