[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[CVPR2022 Oral] Surface Representation for Point Clouds
이번 리뷰 논문은 CVPR 2022 oral 페이퍼인 RepSurf에 대해 다루고자 합니다. 해당 논문은 point cloud에 대한 새로운 표현 기법을 제안하며 이를 통해 대부분의 포인트 클라우드…
[ICML 2020] Test-Time Training with Self-Supervision for Generalization under Distribution Shifts
저는 이번에 다크데이터 과제를 위해 읽어본 논문입니다. test time에서 모델을 업데이트한다는 컨셉으로, 최근 CVPR 2022에서도 이와 비슷한 컨셉으로 self-supervised learning 방법론이 게재되어 다음 리뷰는 그…
[ICCV2019]Learning with Average Precision: Training Image Retrieval with a Listwise Loss
Abstract 최근 deeplearning 기반의 방법론을 이용하는 방식이 전통적인 기법을 크게 능가하고있다. 그러나 기존의 ranking-tailored loss 함수를 이용하는 방식은 mAP를 최적화하는 방식이 아니라는 이론적 한계와, 상당한…
[2022 IJCAI Oral] Unsupervised Misaligned Infrared and Visible Image Fusion via Cross-Modality Image Generation and Registration
현재 진행중인 Multispectral Image Registration 연구와 비슷한 연구가 올라와 리뷰하게 됐습니다. Introduction 저희 연구실에서는 Multispectral Sensor를 이용하여 Detection을 위주로 하다보니 Image Fusion이라는 task가 생소할 수…
[2021 IROS] 6-DoF Pose Estimation of Household Objects for Robotic Manipulation: An Accessible Dataset and Benchmark
안녕하세요 제가 이번에 가지고 온 논문은 6DoF Pose estimation 데이터셋 논문으로 NVIDIA에서 발표한 논문입니다. 먼저 데이터셋은 위와같은 이미지들이 있으며, 인도어 상황에서 household object들을 담고 있습니다….
[CVPR2022](oral) Shunted-Attention via Multi-Scale Token Aggregation
이번에 소개드릴 논문은 이번 CVPR2022 oral paper 중 하나인 Shunted ~~ 입니다. 해당 방법론은 transformer backbone과 관련된 논문이며 튜토리얼 발표 때도 다뤘었습니다. Intro 일반적으로 Transformer…
[CVPR 2019] ArcFace: Additive Angular Margin Loss for Deep Face Recognition
이번에는 ArcFace라는 Loss 논문을 가져왔습니다. 최근에 읽은 논문에서 공통적으로 사용하고 있는데, 인용되는 내용만 봐서는 왜 좋은지 모르겠어서 논문을 읽게되었습니다. Introduction DCNN (Deep Convoluntional Neural Networks)에서…
[arXiv 2022] VRAG: Region Attention Graphs for Content-Based Video Retrieval
오늘 소개드릴 논문은 Facebook에서 나온 “VRAG: Region Attention Graphs for Content-Based Video Retrieval”라는 논문으로, CBVR (Content-Based Video Retrieval), 즉, 제가 연구하고 있는 Video-to-video Retrieval 분야에서…
BinsFormer: Revisiting Adaptive Bins for Monocular Depth Estimation
이번에 리뷰할 논문은 아래와 같이 Paper with codes, Monocular depth estimation 부문에서 일등을 기록하고 있는 Binsformer입니다. 이 논문 외에도 이 동일저자가 낸 Depthformer라는 논문 또한…
[arXiv 2021] Multimodal End-to-End Sparse Model for Emotion Recognition
감정인식 관련 논문입니다. 저번 리뷰의 음성 인식처럼 한 가지 모달리티가 아니라, 총 세 가지의 모달리티 (video, audio, text) 를 이용하여 감정을 인식하는 task 에 대해…
최신 댓글