[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[ICRA2023]FG-Depth: Flow-Guided Unsupervised Monocular Depth Estimation
이번에 소개할 논문은 ICRA2023에 게재된 Self-supervised Depth Estimation 분야 논문입니다. 학회장에서 돌다가 보았던 논문 중 하나인데, 논문의 컨셉 자체가 나쁘지 않아서 읽고 리뷰하고자 합니다. Intro…
[CVPR 2021] FFB6D: A Full Flow Bidirectional Fusion Network for 6D Pose Estimation
제가 이번에 리뷰할 논문은 FFB6D라는 논문입니다. 6D Pose Estimation 논문으로, 2021년 CVPR oral paper라 합니다. Abstract 본 논문은 FFB6D(Full Flow Bidirectional fusion network for 6D…
[CVPR 2023] Proposal-based Multiple Instance Learning for Weakly-Supervised Temporal Action Localization
안녕하세요, 이번 주차 X-Review에서 제가 소개해드릴 논문은 올해 CVPR에 게재된 <Proposal-based Multiple Instance Learning for Weakly-Supervised Temporal Action Localization>입니다. 본 논문은 비디오 분야에서 Weakly-supervised Temporal…
[CVPR 2016] NetVLAD: CNN architecture for weakly supervised place recognition
Visual Place Recognition 분야의 논문을 읽어보려고 하다 Place Recognition의 베이스 논문이라고 할 수 있는 NetVLAD에 관한 이해가 우선되어야 할 것 같아 NetVLAD 논문을 읽게 되었습니다….
[ACL 2019] Multimodal Transformer for Unaligned Multimodal Language Sequences
안녕하세요. 이번에도 멀티모달 감정인식 논문입니다. 최신 논문이 아닌 2019년도 논문을 왜 들고 왔느냐 했을 때 이 논문이 multimodal transforemr 방법을 처음 제안한 논문이라고 봐도 무방하기…
[CVPR 2023] Modeling Video as Stochastic Process for Fine-Grained Video Representation Learning
Before Review Stochastic Process라고 해서 시간이 변함에 따라 확률 변수가 어떻게 변하는 지를 모델링하는 수학적 방법이 있는데 이를 Video Representation Learning에 도입한 논문입니다. CVPR 2023…
[CVPR 2017] PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation
안녕하세요 ! 3번째 x-review로 3D data를 다루는 논문을 처음 가지고 오게 되었습니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction 일반적인 convolution 구조에서는 input으로 regular한 포맷의…
[CVPR 2021] Patch-NetVLAD: Multi-Scale Fusion of Locally-Global Descriptors for Place Recognition
세 번째 x-review입니다. 이번에는 지난 NetVLAD 리뷰에 이어 Patch-NetVLAD를 들고 왔습니다. . 😏 Introduction Visual Place Recognition(VPR)은 robotics와 autonomous system의 중요한 전제 조건입니다. 예를 들자면,…
[BMVC 2021] Multi-Modality Task Cascade for 3D Object Detection
point cloud와 rgb image는 서로 상호보완적인 modality 관계가 될 수 있다. point cloud는 sparse한 특징을 가지지만 object의 정확한 location정보를 포함하고 rgb image는 dense한 color와 texture정보를…
[ECCV 2022] Vote from the Center: 6 DoF Pose Estimation in RGB-D Images by Radial Keypoint Voting
안녕하세요, 로보틱스 팀 양희진 입니다. 이번에도 6D Pose Estimation 논문을 리뷰해보았습니다. 제가 지금까지 리뷰를 진행했었던 방법론들은 비교적 해당 분야에서 오래된 방법론들 입니다. 데이터셋 촬영을 계획이…
최신 댓글