[arvix 2023] TR3D: TOWARDS REAL-TIME INDOOR 3D OBJECT DETECTION
최근에 sparse 3D convolution을 이용한 3D CNN방법은, 3d point cloud 데이터를 voxel형태로 변환하여 적용하는 voxel-based approach에 견줄만한 성능을 보이면서도 memory효율이 좋아 large scale scenes에도 잘…
[ICRA 2022] Semi-Supervised Learning with Mutual Distillation for Monocular Depth Estimation
오늘 리뷰할 논문은 고려대학교 김승룡 교수님 연구실에서 작성된 논문입니다.Mutual Learning, Uncertainty map과 관련된 리뷰로 저번 리뷰처럼 masking 관련된 내용들이 흥미로워서 찾아보다가 citation을 타고타고 읽어보게 되었습니다….
[ECCV 2018] CornerNet: Detecting Object as Paired Keypoints
Introduction 기존에 사용되던 Convolution 기반 object detection모델은 anchor-based인 경우가 많았으며, 그 예로는 R-CNN. SSD, YOLO있었다고 합니다. anchor-based 방법론은 물체가 있을 법하거나, 물체의 형태를 나타내는 다양한…
[NeurIPS Workshop 2020] On Initial Pools for Deep Active Learning
오랜만에 Active Learning 에 대한 분석을 제시한 논문을 가져왔습니다. 해당 논문은 Active Learning에서 Initial pool에 따른 성능 차이가 있음에 주목하며, 이 초기 레이블 풀이 성능을…
[CVPR 2022] Frame-wise Action Representations for Long Videos via Sequence Contrastive Learning
이번 주차의 X-Review는 22년도 CVPR에 게재된 ‘Frame-wise Action Representations for Long Videos via Sequence Contrastive Learning’이라는 논문입니다. 우선 Self-supervised 기반의 Video Representation Learning 논문에 해당하고,…
[CVPR 2022](Oral) QueryDet: Cascaded Sparse Query for Accelerating High-Resolution Small Object Detection
안녕하세요. 아홉 번째 X-Review입니다. 지난 2-3주에 걸쳐 DETR과 Deformable DETR을 리뷰하고, 이번에는 Small object detection을 위한 방법론을 들고 왔습니다. 아마 한전 3차년도 정량적 결과를 위한…
[WACV 2023]MixVPR: Feature Mixing for Visual Place Recognition
제가 이번에 리뷰할 논문도 retrieval을 기반으로 하는 place recognition 논문입니다. VPR(Visual Place Recognition)은 위치를 알고자 하는 영상(쿼리 영상)과 데이터베이스의 영상들(reference 영상, GPS 정보가 태그되어있음)을 비교하여,…
[AAAI 2022] Self-Supervised Category-Level 6D Object Pose Estimation with Deep Implicit Shape Representation
이번 리뷰는 6D 포즈 추정 태스크에 관한 방법론에 대해 다루고자 합니다. 해당 논문은 단순한 6D 포즈 추정이 아니라 카테고리 수준에서 학습 및 예측을 수행하는 것이…
[ECCV 2022] FCAF3D: Fully Convolutional Anchor-Free 3D Object Detection
본 논문에서는 FCAF3D라는 모델을 제안한다. FCAF3D는 Fully Convolutional Anchor-Free indoor 3D object detection의 줄임말로 3d object detection방법론 중 처음으로 anchor-free를 적용한 방식이다. point cloud를 입력으로…
[CVPR2022]Active Learning by Feature Mixing
Abstract Active Learning(AL)이란 무엇인가요? 능동 학습으로 직역되는 AL은 사람이 모델에게 학습할 데이터셋인 training set을 구축하는 것 처럼 학습의 주체인 모델이 능동적으로 training set을 구축하여 학습을…
1. CTC 기반의 텍스트 인식 모델의 학습 과정에 대해 설명을 드리면 대답이 될 것 같네요! 입력된 텍스트 이미지[H x W…