Author: 신 정민
[2023년][정민] 한 해의 상반기를 정리하며
벌써 23년도의 절반이 지나가고 새로운 절반이 시작되었습니다. 저만 그런진 모르겠지만 x-diary로 반기에 대하여 정리하는 글을 작성할 때가 되면 할 말은 많은 것 같으면서도 막상 하기…
[CVPR2021] LoFTR: Detector-Free Local Feature Matching with Transformers
이번에 소개드릴 논문은 cvpr21년도에 게재된 LoFTR이라고 하는 방법론입니다. 해당 방법론은 Place Recognition, Localization task에 관심이 있으신 분들이라면 아실법한 superpoint & superglue와 비슷한 결의 논문이라고 생각하시면…
[CVPR2023]Masked representation learning for domain generalized stereo matching
이번에 리뷰할 논문은 Stereo Matching 기반 방법론입니다. 근데 이제 Masked Image Modeling을 곁드린. Intro Stereo Matching이라는 분야는 쉽게 말하면 좌우가 나란히 있는 stereo image 쌍에…
[ICRA2023]FG-Depth: Flow-Guided Unsupervised Monocular Depth Estimation
이번에 소개할 논문은 ICRA2023에 게재된 Self-supervised Depth Estimation 분야 논문입니다. 학회장에서 돌다가 보았던 논문 중 하나인데, 논문의 컨셉 자체가 나쁘지 않아서 읽고 리뷰하고자 합니다. Intro…
[ICRA2023] Image Masking for Robust Self-Supervised Monocular Depth Estimation
이번에 가져온 논문은 ICRA2023에 게재된 논문으로, 제가 요새 눈여겨 보고 있는 Masked Image Modeling(MIM) 기반 학습 방식을 Self-supervised Monocular Depth Estimation task에 적용한 논문입니다. 제…
[ICLR2023] What Do Self-Supervised Vision Transformers Learn?
이번에 소개할 논문은 ICLR2023에 게재된 논문으로, Self-supervised Learning에서 가장 널리 사용되는 두 가지 기법(Contrastive Learning and Mask Image Modeling)들을 Vision Transformer 학습에 사용할 때 각각…
[CVPR2021] Rethinking and Improving the Robustness of Image Style Transfer
4월 한달 일정이 너무 바쁘다보니 오랜만에 x리뷰를 작성해보네요. 이번에 가져온 논문은 Style Transfer 관련 논문으로 내용이 상당히 재밌어보여서 가져와보았습니다. Style Transfer에 대한 지식이 없으신 분들은…
[CVPR2022] SimMIM: a Simple Framework for Masked Image Modeling
이번에 소개드릴 논문은 CVPR2022에 게재된 SimMIM이라는 논문입니다. 논문에서 다루는 task는 Masked AutoEncoder + Self-supervised Learning이며 방법론 자체에 큰 아이디어가 있다기 보다는 SSL based MAE에 대한…
[AAAI2023](Oral) Compact Transformer Tracker with Correlative Masked Modeling
이번에 작성하게 될 논문은 AAAI2023 oral paper로 선정된 논문으로 task는 object tracking 관련 논문입니다. object tracking에 관심이 생겨서 읽게 된 논문은 아니고, 성능 향상을 위해…
[CVPR2022] Masked Feature Prediction for Self-Supervised Visual Pre-Training
이번에 소개드릴 논문은 Facebook AI Research 팀에서 쓴 Masked Feature Prediction(MaskFeat)이라는 논문입니다. 해당 논문도 Masked Autoencoder(MAE)에 대한 방법론으로, 이 논문에서 다루고자하는 것은 Reconstruction하는 대상을 무엇으로…
안녕하세요 우현님 글 읽어주셔서 감사합니다. 우선 human video는 여러 형태로 존재할 수 있지만 제가 학회에 참석하면서 본 거의 대부분의 human…