[월:] 2023년 11월
[ICCV-2021]Emerging Properties in Self-Supervised Vision Transformers
안녕하세요, 열여덟 번째 X-Review입니다. 이번 논문은 2021년도 ICCV에 게재된 Emerging Properties in Self-Supervised Vision Transformers 논문입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction Transformer는 visual…
[CVPR 2019] RepMet: Representative-based metric learning for classification and few-shot object detection
안녕하세요. 스물 두번째 리뷰입니다. 최근 작성 중인 Pedestrian Detection과는 별도로, 논문은 Few-shot (One or Few) Object Detection에 대한 관한 논문입니다. Few-shot Classification에 관한 연구는 성황리에…
[WACV 2022] Occlusion-Robust Object Pose Estimation With Holistic Representation
제가 이번에 리뷰할 논문은 object의 자세 정보를 추정하는 데 있어, occlusion이 발생할 경우 object의 랜드마크를 찾기 어려워 발생하는 문제를 해결하고자 제안된 방법론 입니다. Abstract 6D…
[CVPR 2023] CompletionFormer: Depth Completion with Convolutions and Vision Transformers
안녕하세요, 열여덟번째 x-review 입니다. 이번 논문은 2023년도 CVPR에 게재된 CompletionFormer으로 컨볼루션과 트랜스포머를 함께 사용하는 Depth Completion 논문 입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction…
[2022 IROS] 6-DoF Pose Estimation of Household Objects for Robotic Manipulation: An Accessible Dataset and Benchmark
안녕하세요, 이번에도 6D pose estimation 관련 논문입니다. 데이터셋을 취득하기 위해 기존 데이터셋이 어떻게 물체를 정의하였는지, 어떤 시나리오로 구성하였는지, Annotation은 어떻게 했는지에 대해 아이디어를 제공 받기…
[SIU 2021]Gaussian Filter Based Digital Detail Enhancement in Thermal Images
이번 리뷰 논문은 열화상 영상 향상 알고리즘 논문입니다. 매번 딥러닝 기반의 모델들만 보다가 갑자기 영상 처리 논문을 들고 와서 의아해 하시는 분들도 계실 것이라고 생각이…
[IEEE Wireless Communication 2018] Active Learning for Wireless IoT Intrusion Detection
안녕하세요, 허재연입니다. 요즘 6종 데이터셋에 대한 통일된 Active Learning 적용을 주제로 한 논문을 작성하고자 하고 있습니다. 6종 데이터 중 하나가 IoT(사물 인터넷) 데이터인데, 이와 관련된…
[arXiv 2018]Deep Residual Learning for Image Recognition
안녕하세요 이번에 제가 리뷰할 논문은 ‘ResNet: Deep Residual Learning for Image Recognition’입니다. 2015년에 Kaiming He 등의 연구진은 Residual Networks(ResNet)라는 아키텍처를 제안하며 네트워크의 깊이가 증가함에 따라…
[ICASSP 2022] Wav2CLIP: Learning Robust Audio Representations from Clip
이번 주 리뷰는 Wav2CLIP이라는 논문으로 Contrastive Language–Image Pre-training (CLIP)에서 파생된 audio representation learning method입니다. 우리가 기존에 알고 있던 CLIP은 image와 text를 동일 feature space로 projection하고…
[ICCV 2023] UATVR: Uncertainty-Adaptive Text-Video Retrieval
이번 주차 X-Review는 23년도 ICCV에 게재된 <UATVR: Uncertainty-Adaptive Text-Video Retrieval>이라는 논문입니다. 중국 바이두에서 연구된 논문이네요. Text-Video Retrieval(이하 TVR)이라는 task는 비디오와 text 두 모달 간 공통의…
최신 댓글