[월:] 2023년 04월

[ICCV 2021]Group-Free 3D Object Detection via Transformers

irregular한 3d point cloud에서 object representation을 추출하기 위해서 기존의 방법론들은 points들을 grouping하여 object로 판단되는 각 point마다 object candidate로 할당하여 object features를 추출하였다. 하지만 hand-crafted 방식으로…

[CVPR 2023]R2Former: Unified Retrieval and Reranking Transformer for Place Recognition

제가 이번에 리뷰할 논문은 Retrieval기반의 위치 인식 논문입니다. 제가 리뷰했던 TransVLAD(논문, 리뷰)를 인용한 논문이라 관심이 생겨 리뷰를 하게 되었습니다. 아직 arxiv에 있지만 찾아보니 CVPR 2023에…

[CVPR 2022] RBGNet: Ray-based Grouping for 3D Object Detection

기존 3d object detection 방법론들에서는 object의 foreground surface geometric 정보를 충분히 사용하지 못했다. 본 논문에서는 voting방식을 기반으로 하는 RBGNet을 제안한다. 이름에서 알 수 있듯이 ray를…

[ICASSP 2022] MEmoBERT: Pre-training Model with Prompt-based Learning for Multimodal Emotion Recognition

안녕하세요. 이번 논문은 멀티모달 감정인식에도 사전학습 모델이 나올 수 있구나를 볼 수 있는 논문이여서 신박하여서 가져와봤는데요. 이름에서 알 수 있듯이 bert 기법이 많이 적용된 논문입니다….

[CVPR 2023] Masked Motion Encoding for Self-Supervised Video Representation Learning

제안서를 쓰고 돌아오니 CVPR 2023 accepted paper 리스트가 공개되었더라고요. 또 시즌이 되었습니다. 재밌는 논문이 뭐가 있을까 찾아보다가 하나 잡아서 들고온 논문인데요. MAE인데 비디오라서 하나 들고와봤습니다….

[WACV 2022] ImVoxelNet: Image to Voxels Projection for Monocular and Multi-View General-Purpose 3D Object Detection

본 논문에서는 posed monocular or multi-view rgb images를 기반으로 하는 fully convolutional 3d object detection 방법론인 ImVoxelNet을 제안한다. 본 논문의 저자는 전에 읽어보았던 FCAF3D, TR3D…

[ICASSP 2022] Speech emotion recognition with co-attention based multi-level acoustic information

안녕하세요. 이번 리뷰는 멀티모달 감정인식 분야가 아닌 음성 단일 모달리티 감정인식 관련 논문으로 가져와봤습니다. 성능 향상을 이루면서 제가 가장 익숙하게 건들일 수 있는 부분이 음성…

[ICLR 2019] A Closer Look at Few Shot Classification

Introduction Few-shot classification 이란 이름에서 알 수 있듯 매우 적은 example이 주어진 상황에서 분류를 수행하는 것을 의미합니다. 아래의 그림을 예시로 들자면 두 가지의 class(dog, otters가…

