[2021 IROS] 6-DoF Pose Estimation of Household Objects for Robotic Manipulation: An Accessible Dataset and Benchmark
안녕하세요 제가 이번에 가지고 온 논문은 6DoF Pose estimation 데이터셋 논문으로 NVIDIA에서 발표한 논문입니다. 먼저 데이터셋은 위와같은 이미지들이 있으며, 인도어 상황에서 household object들을 담고 있습니다….
[CVPR2022](oral) Shunted-Attention via Multi-Scale Token Aggregation
이번에 소개드릴 논문은 이번 CVPR2022 oral paper 중 하나인 Shunted ~~ 입니다. 해당 방법론은 transformer backbone과 관련된 논문이며 튜토리얼 발표 때도 다뤘었습니다. Intro 일반적으로 Transformer…
[CVPR 2019] ArcFace: Additive Angular Margin Loss for Deep Face Recognition
이번에는 ArcFace라는 Loss 논문을 가져왔습니다. 최근에 읽은 논문에서 공통적으로 사용하고 있는데, 인용되는 내용만 봐서는 왜 좋은지 모르겠어서 논문을 읽게되었습니다. Introduction DCNN (Deep Convoluntional Neural Networks)에서…
[arXiv 2022] VRAG: Region Attention Graphs for Content-Based Video Retrieval
오늘 소개드릴 논문은 Facebook에서 나온 “VRAG: Region Attention Graphs for Content-Based Video Retrieval”라는 논문으로, CBVR (Content-Based Video Retrieval), 즉, 제가 연구하고 있는 Video-to-video Retrieval 분야에서…
BinsFormer: Revisiting Adaptive Bins for Monocular Depth Estimation
이번에 리뷰할 논문은 아래와 같이 Paper with codes, Monocular depth estimation 부문에서 일등을 기록하고 있는 Binsformer입니다. 이 논문 외에도 이 동일저자가 낸 Depthformer라는 논문 또한…
[arXiv 2021] Multimodal End-to-End Sparse Model for Emotion Recognition
감정인식 관련 논문입니다. 저번 리뷰의 음성 인식처럼 한 가지 모달리티가 아니라, 총 세 가지의 모달리티 (video, audio, text) 를 이용하여 감정을 인식하는 task 에 대해…
[CVPR2021] Visual Semantic Role Labeling for Video Understanding
오늘 리뷰할 논문은 이전 리뷰 에서 다루었던 논문의 motivation이 되었던 논문 “Visual Semantic Role Labeling for Video Understanding” 입니다. 기존 비디오 관련 분야에서는 video action…
[CVPR2019] BASNet: Boundary-Aware Salient Object Detection
이번 리뷰 논문은 Salient Object Detection 논문 중 가장 보편적으로 인정 받는 방법론 입니다. 간단 명료한 네트워크 구조와 새로운 조합의 loss를 제안했습니다. 또한 Method 설명…
Protected: [2022 Sensors Peer Review] Emotion Recognition of Partial Face Using a Feature Vector Technique
There is no excerpt because this is a protected post.
[2022 CVPR] An Empirical Study of End-to-End Temporal Action Detection
Before Review 이번 논문 리뷰도 Temporal Action Detection(Localization) 논문을 가져왔습니다. Temporal Action Detection 관련 연구를 할 때 고려할만한 요인들을 여러 가지 소개해주면서 이 Task 자체에…
1. CTC 기반의 텍스트 인식 모델의 학습 과정에 대해 설명을 드리면 대답이 될 것 같네요! 입력된 텍스트 이미지[H x W…