Month: January 2023
[WACV 2023] Randomness is the Root of All Evil: More Reliable Evaluation of Deep Active Learning
원래는 이 논문을 리뷰하려고 했던 건 아니었으나… 이 자극적인 논문의 제목 (모든 악의 근원은 랜덤성이다…) 을 보고 홀린듯이 리뷰하게 되었습니다. 물론 제가 이걸 리뷰하는 이유…
[ICLR 2022] How Do Vision Transformer Work?
Before Review 이번 논문 리뷰는 ViT에 대해 좀 더 깊은 분석을 진행한 논문을 읽었습니다. 흔히 알려져 있는 ViT에 대한 주장들에 대한 분석, ViT가 어떻게 작동하는지…
[CVPR 2018] VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection
VoxelNet은 Apple에서 제안한 network로, hand-crafted feature가 아닌 feature extraction과 bbox prediction이 one-stage로 구성된 end-to-end학습이 가능한 deep network이다. 딥러닝 기반 LiDAR 3D object detection분야에서 milestone이 된…
[ICML 2022] data2vec: A General Framework for Self-supervised Learning in Speech, Vision and Language
안녕하세요. 이번 x-reivew는 임근택 연구원이 추천해준 논문 “data2vec: A General Framework for Self-supervised learning in Speech, Vision, and Language” 입니다. 요즘에 올라오는 리뷰마다 self-supervised 키워드가…
[arXiv 2022] InternVideo : General Video Foundation Models via Generative and Discriminative Learning
Before Review Video 진영에도 GPT, BERT라고 할만한 Foundation Model이 등장한 것 같습니다. 결과만 놓고 보면 39가지의 데이터 셋을 가지고 평가하여 모든 SOTA를 갈아치웠습니다. 개인적으로는 아쉬운…
[NeurIPS2022] Croco: Self-supervised Pre-training for 3D Vision tasks by Cross-view Completion
이번에 소개드릴 논문은 네이버 랩스 유럽팀에서 연구한 CroCo라는 논문입니다. 분야는 핫하디 핫한 Masked AutoEncoder(MAE)를 기반으로 한 Self-supervised learning 연구이며, 네이버 랩스다 보니 3D Geometry 분야에…
[CVPR 2018] Non-local Neural Networks
Introduction convolution은 연산 방식이 일정 크기의 커널을 이미지에 windowing하면서 연산을 진행하기 때문에, local한 관계에 집중합니다. 그러다 보니 [ 그림1 ]과 같이 멀리 떨어진 픽셀은 좀…
[CVPR 2021] Self-supervised Video Representation Learning by Context and Motion Decoupling
오늘의 X-Review는 Self-supervised Video Representation Learning 관련 논문으로 준비해보았습니다. 2021년도 CVPR에 게재되었으며, 중국 기업 알리바바에서 작성하였네요. 참고로 아직 해당 task의 20, 21년도의 논문을 follow-up 하고…
[BMVC 2022] MoBYv2AL: Self-supervised Active Learning for Image Classification
저는 이번에 다시 Self-supervised + Active Learning 논문을 리뷰하려고 합니다. 그동안 제가 Hybrid Learning 논문은 Image Classification에 대해 Rotation Prediction을 Self-supervised model로 사용했을 때 가장…
[CVPR 2021]Discover Cross-Modality Nuances for Visible-Infrared Person Re-Identification
제가 이번에 리뷰할 논문도 Re-ID 논문 중 하나 입니다. visible-infrared Re-ID는 서로 다른 모달리티에서 동일한 id를 예측하는 것을 목표로 합니다. 기존의 연구들이 다른 모달리티의 feature의…
basic query는 기본적으로 random init되므로 해당 frame의 시각적 정보를 담고 있지 않습니다. 이를 함께 사용하면 학습 과정에서 도움을 줄 수는…