[카테고리:] X-Review

Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.

Posted in Conference Paper X-Review

[CVPR2022 Oral] Surface Representation for Point Clouds

이번 리뷰 논문은 CVPR 2022 oral 페이퍼인 RepSurf에 대해 다루고자 합니다. 해당 논문은 point cloud에 대한 새로운 표현 기법을 제안하며 이를 통해 대부분의 포인트 클라우드…

Continue Reading
Posted in Conference Paper X-Review

[ICML 2020] Test-Time Training with Self-Supervision for Generalization under Distribution Shifts

저는 이번에 다크데이터 과제를 위해 읽어본 논문입니다. test time에서 모델을 업데이트한다는 컨셉으로, 최근 CVPR 2022에서도 이와 비슷한 컨셉으로 self-supervised learning 방법론이 게재되어 다음 리뷰는 그…

Continue Reading
Posted in Paper X-Review

[ICCV2019]Learning with Average Precision: Training Image Retrieval with a Listwise Loss

Abstract 최근 deeplearning 기반의 방법론을 이용하는 방식이 전통적인 기법을 크게 능가하고있다. 그러나 기존의 ranking-tailored loss 함수를 이용하는 방식은 mAP를 최적화하는 방식이 아니라는 이론적 한계와, 상당한…

Continue Reading
Posted in Conference X-Review

[2022 IJCAI Oral] Unsupervised Misaligned Infrared and Visible Image Fusion via Cross-Modality Image Generation and Registration

현재 진행중인 Multispectral Image Registration 연구와 비슷한 연구가 올라와 리뷰하게 됐습니다. Introduction 저희 연구실에서는 Multispectral Sensor를 이용하여 Detection을 위주로 하다보니 Image Fusion이라는 task가 생소할 수…

Continue Reading
Posted in Conference X-Review

[2021 IROS] 6-DoF Pose Estimation of Household Objects for Robotic Manipulation: An Accessible Dataset and Benchmark

안녕하세요 제가 이번에 가지고 온 논문은 6DoF Pose estimation 데이터셋 논문으로 NVIDIA에서 발표한 논문입니다. 먼저 데이터셋은 위와같은 이미지들이 있으며, 인도어 상황에서 household object들을 담고 있습니다….

Continue Reading
Posted in Conference X-Review

[CVPR2022](oral) Shunted-Attention via Multi-Scale Token Aggregation

이번에 소개드릴 논문은 이번 CVPR2022 oral paper 중 하나인 Shunted ~~ 입니다. 해당 방법론은 transformer backbone과 관련된 논문이며 튜토리얼 발표 때도 다뤘었습니다. Intro 일반적으로 Transformer…

Continue Reading
Posted in X-Review

[CVPR 2019] ArcFace: Additive Angular Margin Loss for Deep Face Recognition

이번에는 ArcFace라는 Loss 논문을 가져왔습니다. 최근에 읽은 논문에서 공통적으로 사용하고 있는데, 인용되는 내용만 봐서는 왜 좋은지 모르겠어서 논문을 읽게되었습니다. Introduction DCNN (Deep Convoluntional Neural Networks)에서…

Continue Reading
Posted in Paper X-Review

[arXiv 2022] VRAG: Region Attention Graphs for Content-Based Video Retrieval

오늘 소개드릴 논문은 Facebook에서 나온 “VRAG: Region Attention Graphs for Content-Based Video Retrieval”라는 논문으로, CBVR (Content-Based Video Retrieval), 즉, 제가 연구하고 있는 Video-to-video Retrieval 분야에서…

Continue Reading
Posted in Paper X-Review

BinsFormer: Revisiting Adaptive Bins for Monocular Depth Estimation

이번에 리뷰할 논문은 아래와 같이 Paper with codes, Monocular depth estimation 부문에서 일등을 기록하고 있는 Binsformer입니다. 이 논문 외에도 이 동일저자가 낸 Depthformer라는 논문 또한…

Continue Reading
Posted in Paper X-Review

[arXiv 2021] Multimodal End-to-End Sparse Model for Emotion Recognition

감정인식 관련 논문입니다. 저번 리뷰의 음성 인식처럼 한 가지 모달리티가 아니라, 총 세 가지의 모달리티 (video, audio, text) 를 이용하여 감정을 인식하는 task 에 대해…

Continue Reading