[월:] 2023년 06월
[CVPR 2019]DenseFusion: 6D Object Pose Estimation by Iterative Dense Fusion
제가 이번에 리뷰할 논문도 6D Pose Estimation 논문으로, 현재까지 760회의 인용수를 기록하고있습니다. 그러면 리뷰를 시작하겠습니다. 본 논문도 RGB-D로부터 6D Pose를 추정하기 위해 서로 다른 두…
[ECCV 2020] EPNet: Enhancing Point Features with Image Semantics for 3D Object Detection
본 논문에서는 3d detection task에서 LiDAR point cloud와 camera image의 multiple sensor를 사용할 때 문제와 localization, classification confidence score간 inconsistency에 대해 문제를 제기하며 end-to-end 방식의…
[ICRA2023]FG-Depth: Flow-Guided Unsupervised Monocular Depth Estimation
이번에 소개할 논문은 ICRA2023에 게재된 Self-supervised Depth Estimation 분야 논문입니다. 학회장에서 돌다가 보았던 논문 중 하나인데, 논문의 컨셉 자체가 나쁘지 않아서 읽고 리뷰하고자 합니다. Intro…
[CVPR 2021] FFB6D: A Full Flow Bidirectional Fusion Network for 6D Pose Estimation
제가 이번에 리뷰할 논문은 FFB6D라는 논문입니다. 6D Pose Estimation 논문으로, 2021년 CVPR oral paper라 합니다. Abstract 본 논문은 FFB6D(Full Flow Bidirectional fusion network for 6D…
[CVPR 2023] Proposal-based Multiple Instance Learning for Weakly-Supervised Temporal Action Localization
안녕하세요, 이번 주차 X-Review에서 제가 소개해드릴 논문은 올해 CVPR에 게재된 <Proposal-based Multiple Instance Learning for Weakly-Supervised Temporal Action Localization>입니다. 본 논문은 비디오 분야에서 Weakly-supervised Temporal…
[CVPR 2016] NetVLAD: CNN architecture for weakly supervised place recognition
Visual Place Recognition 분야의 논문을 읽어보려고 하다 Place Recognition의 베이스 논문이라고 할 수 있는 NetVLAD에 관한 이해가 우선되어야 할 것 같아 NetVLAD 논문을 읽게 되었습니다….
[ACL 2019] Multimodal Transformer for Unaligned Multimodal Language Sequences
안녕하세요. 이번에도 멀티모달 감정인식 논문입니다. 최신 논문이 아닌 2019년도 논문을 왜 들고 왔느냐 했을 때 이 논문이 multimodal transforemr 방법을 처음 제안한 논문이라고 봐도 무방하기…
[CVPR 2023] Modeling Video as Stochastic Process for Fine-Grained Video Representation Learning
Before Review Stochastic Process라고 해서 시간이 변함에 따라 확률 변수가 어떻게 변하는 지를 모델링하는 수학적 방법이 있는데 이를 Video Representation Learning에 도입한 논문입니다. CVPR 2023…
[CVPR 2017] PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation
안녕하세요 ! 3번째 x-review로 3D data를 다루는 논문을 처음 가지고 오게 되었습니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction 일반적인 convolution 구조에서는 input으로 regular한 포맷의…
[CVPR 2021] Patch-NetVLAD: Multi-Scale Fusion of Locally-Global Descriptors for Place Recognition
세 번째 x-review입니다. 이번에는 지난 NetVLAD 리뷰에 이어 Patch-NetVLAD를 들고 왔습니다. . 😏 Introduction Visual Place Recognition(VPR)은 robotics와 autonomous system의 중요한 전제 조건입니다. 예를 들자면,…
최신 댓글