Author: 도경 김

Posted in X-Review

[ICRA 2020] Accurate detection and 3D localization of humans using a novel YOLO-based RGB-D fusion approach and synthetic training data

2d object detection이 많은 발전을 이뤄내고 있지만, occlusion이 포함된 3d space에서 object의 위치를 robust하게 추정하는 것은 여전히 풀기 어려운 issue라고 한다.  본 논문에서는 RGB-D data…

Continue Reading
Posted in X-Review

[CVPR 2015] SUN RGB-D: A RGB-D Scene Understanding Benchmark Suite

본 논문에서는 rgb와 Depth 정보를 포함하는 데이터 셋인 SUN RGB-D를 소개한다. 기존에는 large-Scale의 3d annotation된 benchmark dataset의 부재를 문제점으로 지적하며 새로운 rgbd benchmark 데이터 셋을…

Continue Reading
Posted in X-Review

[NeurIPS 2022] CAGroup3D: Class-Aware Grouping for 3D Object Detection on Point Clouds

본 논문에서는 two-stage의 fully sparse convolutional 3D object detection framework인 CAGroup3D를 제안한다. CAGroup3D에서는 class-aware local group 방식을 통해 object surface voxel에 대해 3d proposals를 생성하고,…

Continue Reading
Posted in X-Review

[CVPR 2022] Multimodal Token Fusion for Vision Transformers

기존의 vision transformer에 사용된 multiple modalities 데이터는 성능을 향상시키는데 도움이 되었지만, inner-modal의 집중해야하는 부분인 attentive weights는 충분히 고려되지 못해 최종 성능에는 좋은 영향을 주지 못했다….

Continue Reading
Posted in X-Review

[ICCV 2021]Group-Free 3D Object Detection via Transformers

irregular한 3d point cloud에서 object representation을 추출하기 위해서 기존의 방법론들은 points들을 grouping하여 object로 판단되는 각 point마다 object candidate로 할당하여 object features를 추출하였다. 하지만 hand-crafted 방식으로…

Continue Reading
Posted in X-Review

[CVPR 2022] RBGNet: Ray-based Grouping for 3D Object Detection

기존 3d object detection 방법론들에서는 object의 foreground surface geometric 정보를 충분히 사용하지 못했다. 본 논문에서는 voting방식을 기반으로 하는 RBGNet을 제안한다. 이름에서 알 수 있듯이 ray를…

Continue Reading
Posted in X-Review

[WACV 2022] ImVoxelNet: Image to Voxels Projection for Monocular and Multi-View General-Purpose 3D Object Detection

본 논문에서는 posed monocular or multi-view rgb images를 기반으로 하는 fully convolutional 3d object detection 방법론인 ImVoxelNet을 제안한다. 본 논문의 저자는 전에 읽어보았던 FCAF3D, TR3D…

Continue Reading
Posted in X-Review

[arvix 2023] TR3D: TOWARDS REAL-TIME INDOOR 3D OBJECT DETECTION

최근에 sparse 3D convolution을 이용한 3D CNN방법은, 3d point cloud 데이터를 voxel형태로 변환하여 적용하는 voxel-based approach에 견줄만한 성능을 보이면서도 memory효율이 좋아 large scale scenes에도 잘…

Continue Reading
Posted in X-Review

[ECCV 2022] FCAF3D: Fully Convolutional Anchor-Free 3D Object Detection

본 논문에서는 FCAF3D라는 모델을 제안한다. FCAF3D는 Fully Convolutional Anchor-Free indoor 3D object detection의 줄임말로 3d object detection방법론 중 처음으로 anchor-free를 적용한 방식이다. point cloud를 입력으로…

Continue Reading
Posted in X-Review

[CVPR 2018] Deep Depth Completion of a Single RGB-D Image

본 논문은 deep depth completion of a single rgb-d image라는 이름에서도 느껴지듯이 단일 RGB-D image의 depth channel 정보를 채우기 위한 방법을 제안하는 논문이다. 보통의 depth…

Continue Reading