Category: X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[ICAI 2022] Contrastive Self-Supervised Learning: A Survey on Different Architectures
안녕하세요, 허재연입니다. self-supervised learning 중 contrastive learning을 기반으로 하는 방법이 널리 사용되고 있는데, 어떤 방법론이 많이 사용되는 방법인지, 각 장단점은 무엇인지 판단하기 쉽지 않아 관련…
[RAL 2022] E2EK: End-to-End Regression Network Based on Keypoint for 6D Pose Estimation
제가 이번에 리뷰 할 논문은 6D Pose Estimation에서 Keypoint를 추출하는 방법에 대한 논문입니다. Abstract 딥러닝 기반의 6D pose estimation은 바로 pose를 regression으로 예측하거나 2-stage 파이프라인을…
[KBS 2020] Knowledge based domain adaptation for semantic segmentation
안녕하세요,오늘도 늘 먹던 분야의 논문을 가지고 왔습니다. 다만 KBS 라고 하는 저널은 많은 분들이 처음 보실거라 생각이 드는데요,이는 Knowledge Based System (KBS) 라고 하는 저널입니다.Impact…
[ICML 2022] Understanding The Robustness in Vision Transformers
가끔 분석 논문을 읽는데 오늘도 분석 + 개선 논문입니다. 읽느라 되게 오래걸렸는데… 최대한 정리 잘 해서 작성해보겠습니다. Introduction 우리가 “트랜스포머”를 떠올리면 생각나는 몇가지 특징이 있습니다….
[CVPR2023] Lite-mono: A Lightweight CNN and Transformer Architecture for Self-Supervised Monocular Depth Estimation
이번에 소개드릴 논문은 Self-supervised monocular depth estimation task에서 모델의 architecture를 매우 경량화하여 모델 크기 대비 성능을 향상시킨 방법론에 대한 논문입니다. Intro Self-supervised monocular Depth Estimation(SDE)…
[ICML 2021] Learning Transferable Visual Models From Natural Language Supervision (CLIP) – Part 2
안녕하세요. 백지오입니다. 열세 번째 X-REVIEW는 지난 리뷰에 이은 CLIP 리뷰 파트 2입니다. 지난 파트 1 리뷰에서 CLIP의 개념과 방법론을 알아보았는데, 이번 리뷰에서는 저자들이 수행한 실험과…
[CVPR workshop 2020] NH-HAZE: An Image Dehazing Benchmark with Non-Homogeneous Hazy and Haze-Free Images
이번 리뷰 논문은 Image Dehazing 분야에서 처음으로 real-world의 데이터 셋을 구성하여 챌린지(NTIRE 중 Dehazing 분야)를 개최한 NH-HAZE라는 데이터 셋에 다루고자 합니다. 해당 데이터 셋은 기존…
[CVPR 2022]FS6D: Few-Shot 6D Pose Estimation of Novel Objects
Abstract 6D Pose Estimation은 고품질의 CAD 모델에 의존도가 높다는 문제가 있어 많은 수의 instance로 확장이 어렵다는 한계가 있습니다. 해당 논문은 본 적 없는 unknown object에…
[NeurIPS 2021] Unleashing the Power of Contrastive Self-Supervised Visual Models via Contrast-Regularized Fine-Tuning
안녕하세요, 허재연입니다. 요즘 Self-supervised learning을 활용해 pretrain한 이후 finetuning하는 과정에서 어떻게 하면 성능을 올릴 수 있을까 고민하고 있는데, 고민 도중 찾아본 논문을 소개하고자 합니다. 보통…
[ICASSP 2023] Fast Yet Effective Speech Emotion Recognition with Self-Distillation
이번에 리뷰할 논문은 ICASSP 2023의 Fast Yet Effective Speech Emotion Recognition with Self-Distillation으로 이전에 리뷰했던 self-distilation 기법을 음성 감정인식 분야에 적용한 논문입니다. 최신 논문 중…
1. CTC 기반의 텍스트 인식 모델의 학습 과정에 대해 설명을 드리면 대답이 될 것 같네요! 입력된 텍스트 이미지[H x W…