[BMVC 2021] 2.5D-VoteNet: Depth Map based 3D object detection for real-time applications

본 논문에서는 depth map에서 2d cnn을 이용해 direct하게 feature를 포착하여 3d object detection을 하는 task를 제안한다. input은 3d point cloud가 아니라 2d로 누른 depth map을…

[CVPR2023] PiMAE:Point Cloud and Image Interactive Masked Autoencoders for 3D Object Detection

Masked autoencoder는 시각적인 표현력을 잘 학습할 수 있어 몇몇의 독립적인 modality에서 좋을 결과를 보였지만 multi-modal의 경우 많이 적용이 되지 못했다. 본 논문에서는 point cloud와 rgb…

[WACV2023] Masked Autoencoder for Self-Supervised Pre-training on Lidar Point Clouds

본 논문은 3d point cloud를 voxel로 처리하여 mae를 적용한 논문을 찾다 알게되어 읽어보게되었다. 기존의 indoor환경에서 mae를 적용했던 point-mae와 비슷하지만 본 논문에서의 voxel-mae는 outdoor환경에서 평가하였다. 저자는…

[ECCV 2022] Masked Autoencoders for Point Cloud Self-supervised Learning

본 논문에서는 위치 정보 유출, 불균일한 information density를 포함하는 point cloud의 특성이 제기하는 문제를 해결하기 위해 point cloud self-supervised learning을 위한 masked autoencoder구조의 방식을 제안한다….

[ECCV 2022] Masked Discrimination for Self-Supervised Learning on Point Clouds

masked autoencoding은 language와 image domain에서 self-supervised learning에 큰 성공을 거두었다. 하지만 masking방식 기반의 pretraining은 3d point cloud를 이해하는데 있어서 이점을 아직 보여주지 못했다. 이에 대해…

[CVPR 2020] Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Training Sample Selection

object detection은 대부분 anchor-based detector가 주를 이뤄왔고 anchor-free방식이 점차 등장하기 시작했다. 결론적으로 말하자면 본 논문에서는 먼저 anchor-based와 anchor-free 방식 사이의 주요한 차이는 사실 positive sample과…

<2023년도 상반기를 정리한다>

안녕하세요. 로보틱스 A팀 김도경입니다. 벌써 URP를 통해 연구실에 처음 들어온지 10개월, 석사과정을 시작한지 한 학기가 지났네요. 시간이 정말 빠르게 지나간 것 같습니다. 연구실에서 생활하면서 즐겁기도…

[ECCV 2020] Generative Sparse Detection Networks for 3D Single-shot Object Detection

3d object detection task는 정확한 물체의 위치를 검출하는데 큰 도움이 되지만 3d data의 sparse한 특성상 어려운 task로 여겨진다. 또 object surface에서만 point cloud를 얻을 수…

[ECCV 2020] EPNet: Enhancing Point Features with Image Semantics for 3D Object Detection

본 논문에서는 3d detection task에서 LiDAR point cloud와 camera image의 multiple sensor를 사용할 때 문제와 localization, classification confidence score간 inconsistency에 대해 문제를 제기하며 end-to-end 방식의…

[BMVC 2021] Multi-Modality Task Cascade for 3D Object Detection

point cloud와 rgb image는 서로 상호보완적인 modality 관계가 될 수 있다. point cloud는 sparse한 특징을 가지지만 object의 정확한 location정보를 포함하고 rgb image는 dense한 color와 texture정보를…

