[카테고리:] X-Review

Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.

Posted in Conference X-Review

[ICRA2023]FG-Depth: Flow-Guided Unsupervised Monocular Depth Estimation

이번에 소개할 논문은 ICRA2023에 게재된 Self-supervised Depth Estimation 분야 논문입니다. 학회장에서 돌다가 보았던 논문 중 하나인데, 논문의 컨셉 자체가 나쁘지 않아서 읽고 리뷰하고자 합니다. Intro…

Continue Reading
Posted in X-Review

[CVPR 2021] FFB6D: A Full Flow Bidirectional Fusion Network for 6D Pose Estimation

제가 이번에 리뷰할 논문은 FFB6D라는 논문입니다. 6D Pose Estimation 논문으로, 2021년 CVPR oral paper라 합니다. Abstract 본 논문은 FFB6D(Full Flow Bidirectional fusion network for 6D…

Continue Reading
Posted in Paper X-Review

[CVPR 2023] Proposal-based Multiple Instance Learning for Weakly-Supervised Temporal Action Localization

안녕하세요, 이번 주차 X-Review에서 제가 소개해드릴 논문은 올해 CVPR에 게재된 <Proposal-based Multiple Instance Learning for Weakly-Supervised Temporal Action Localization>입니다. 본 논문은 비디오 분야에서 Weakly-supervised Temporal…

Continue Reading
Posted in X-Review

[CVPR 2016] NetVLAD: CNN architecture for weakly supervised place recognition

Visual Place Recognition 분야의 논문을 읽어보려고 하다 Place Recognition의 베이스 논문이라고 할 수 있는 NetVLAD에 관한 이해가 우선되어야 할 것 같아 NetVLAD 논문을 읽게 되었습니다….

Continue Reading
Posted in X-Review

[ACL 2019] Multimodal Transformer for Unaligned Multimodal Language Sequences

안녕하세요. 이번에도 멀티모달 감정인식 논문입니다. 최신 논문이 아닌 2019년도 논문을 왜 들고 왔느냐 했을 때 이 논문이 multimodal transforemr 방법을 처음 제안한 논문이라고 봐도 무방하기…

Continue Reading
Posted in Paper X-Review

[CVPR 2023] Modeling Video as Stochastic Process for Fine-Grained Video Representation Learning

Before Review Stochastic Process라고 해서 시간이 변함에 따라 확률 변수가 어떻게 변하는 지를 모델링하는 수학적 방법이 있는데 이를 Video Representation Learning에 도입한 논문입니다. CVPR 2023…

Continue Reading
Posted in Paper X-Review

[CVPR 2017] PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation

안녕하세요 ! 3번째 x-review로 3D data를 다루는 논문을 처음 가지고 오게 되었습니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction 일반적인 convolution 구조에서는 input으로 regular한 포맷의…

Continue Reading
Posted in Paper X-Review

[CVPR 2021] Patch-NetVLAD: Multi-Scale Fusion of Locally-Global Descriptors for Place Recognition

세 번째 x-review입니다. 이번에는 지난 NetVLAD 리뷰에 이어 Patch-NetVLAD를 들고 왔습니다. . 😏 Introduction Visual Place Recognition(VPR)은 robotics와 autonomous system의 중요한 전제 조건입니다. 예를 들자면,…

Continue Reading
Posted in X-Review

[BMVC 2021] Multi-Modality Task Cascade for 3D Object Detection

point cloud와 rgb image는 서로 상호보완적인 modality 관계가 될 수 있다. point cloud는 sparse한 특징을 가지지만 object의 정확한 location정보를 포함하고 rgb image는 dense한 color와 texture정보를…

Continue Reading
Posted in Paper X-Review

[ECCV 2022] Vote from the Center: 6 DoF Pose Estimation in RGB-D Images by Radial Keypoint Voting

안녕하세요, 로보틱스 팀 양희진 입니다. 이번에도 6D Pose Estimation 논문을 리뷰해보았습니다. 제가 지금까지 리뷰를 진행했었던 방법론들은 비교적 해당 분야에서 오래된 방법론들 입니다. 데이터셋 촬영을 계획이…

Continue Reading