Posted in Paper X-Review

[CVPR 2023] CompletionFormer: Depth Completion with Convolutions and Vision Transformers

안녕하세요, 열여덟번째 x-review 입니다. 이번 논문은 2023년도 CVPR에 게재된 CompletionFormer으로 컨볼루션과 트랜스포머를 함께 사용하는 Depth Completion 논문 입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction…

Continue Reading
Posted in Paper X-Review

[2022 IROS] 6-DoF Pose Estimation of Household Objects for Robotic Manipulation: An Accessible Dataset and Benchmark

안녕하세요, 이번에도 6D pose estimation 관련 논문입니다. 데이터셋을 취득하기 위해 기존 데이터셋이 어떻게 물체를 정의하였는지, 어떤 시나리오로 구성하였는지, Annotation은 어떻게 했는지에 대해 아이디어를 제공 받기…

Continue Reading
Posted in News X-Review

[SIU 2021]Gaussian Filter Based Digital Detail Enhancement in Thermal Images

이번 리뷰 논문은 열화상 영상 향상 알고리즘 논문입니다. 매번 딥러닝 기반의 모델들만 보다가 갑자기 영상 처리 논문을 들고 와서 의아해 하시는 분들도 계실 것이라고 생각이…

Continue Reading
Posted in Paper X-Review

[IEEE Wireless Communication 2018] Active Learning for Wireless IoT Intrusion Detection

안녕하세요, 허재연입니다. 요즘 6종 데이터셋에 대한 통일된 Active Learning 적용을 주제로 한 논문을 작성하고자 하고 있습니다. 6종 데이터 중 하나가 IoT(사물 인터넷) 데이터인데, 이와 관련된…

Continue Reading
Posted in News X-Review

[arXiv 2018]Deep Residual Learning for Image Recognition

안녕하세요 이번에 제가 리뷰할 논문은 ‘ResNet: Deep Residual Learning for Image Recognition’입니다. 2015년에 Kaiming He 등의 연구진은 Residual Networks(ResNet)라는 아키텍처를 제안하며 네트워크의 깊이가 증가함에 따라…

Continue Reading
Posted in X-Review

[ICASSP 2022] Wav2CLIP: Learning Robust Audio Representations from Clip

이번 주 리뷰는 Wav2CLIP이라는 논문으로 Contrastive Language–Image Pre-training (CLIP)에서 파생된 audio representation learning method입니다. 우리가 기존에 알고 있던 CLIP은 image와 text를 동일 feature space로 projection하고…

Continue Reading
Posted in Paper X-Review

[ICCV 2023] UATVR: Uncertainty-Adaptive Text-Video Retrieval

이번 주차 X-Review는 23년도 ICCV에 게재된 <UATVR: Uncertainty-Adaptive Text-Video Retrieval>이라는 논문입니다. 중국 바이두에서 연구된 논문이네요. Text-Video Retrieval(이하 TVR)이라는 task는 비디오와 text 두 모달 간 공통의…

Continue Reading
Posted in X-Review

[CVPR2016]Deep Residual Learning for Image Recognition

안녕하세요 오늘의 X-Review는 ResNet입니다. ResNet은 2015년도 ImageNet Classification 대회인 ILSVRC 대회에서 1등을 차지하고 현재까지 backbone모델로 많이 사용되는 모델입니다. 다들 익숙하신 내용이겠지만 CNN과 VGG모델을 알고 있다는…

Continue Reading
Posted in Conference

[ICCV2023] EfficientViT: Multi-Scale Linear Attention for High-Resolution Dense Prediction

이번에 소개드릴 논문은 ICCV2023에 게재된 EfficientViT라는 방법론입니다. backbone에 대한 논문이며, image classification 같은 task 대신 segmentation, super resolution과 같은 dense level prediction task에 초점을 맞추어…

Continue Reading
Posted in Paper X-Review

[MM 2022] X-CLIP: End-to-End Multi-grained Contrastive Learning for Video-Text Retrieval

이런 분들께 이 논문을 추천드립니다. CLIP을 비디오에 적용하는 방식에 흥미가 있으신 분 Video Text Retrieval에서 fine-grained와 coarse-grained를 모두 활용하는 cross-grained 방식이 궁굼하신 분 이 논문을…

Continue Reading