Author: 신 정민

Posted in Paper X-Review

[Transactions on Machine Learning Research 2024] DINOv2: Learning Robust Visual Features without Supervision

이번에 소개드릴 논문은 DINOv2라는 논문입니다. Self-supervised Learning에서 매우 잘 알려진 Facebook AI Research의 DINOv1의 후속작으로 해당 논문도 마찬가지로 페이스북에서 공개한 논문입니다. 본 논문과 21년도 논문이었던…

Continue Reading
Posted in X-Diary

Protected: [x-diary] Urban Air Mobility(UAM)

There is no excerpt because this is a protected post.

Continue Reading
Posted in Paper X-Review

[Arxiv2023] ZoeDepth

이번에 소개드릴 논문은 ZoeDepth라는 논문입니다. 비록 아카이브에만 머물고 있는 논문이지만, 인텔과 KAUST에서 공개한 논문이기도 하고, github star도 1.9K라는 점에서 상당한 저력이 있는 논문이라고 생각합니다. 먼저…

Continue Reading
Posted in Paper X-Review

[Arxiv2024] CMRNext: Camera to Lidar Matching in the Wild for Localization and Extrinsic Calibration

이번에 소개드릴 논문은 CMRNext라고 하는 방법론입니다. 논문에서 다루는 task는 Visual Localization and Extrinsic Calibration이라는 task인데 앞에 Visual Localization보다는 Extrinsic Calibration 문제에 대해서 더 관심이 있어…

Continue Reading
Posted in Conference X-Review

[CVPR2023] 1% VS 100%: Parameter-Efficient Low Rank Adapter for Dense Predictions

지난번 리뷰에 이어 이번 논문 리뷰도 Adapter 관련 논문입니다. CVPR2023에 게재된 논문으로 지난번 ViT Adapter랑은 접근 방식이 제법 다른 방법론입니다. Intro InternImage, GPT 등등 Vision,…

Continue Reading
Posted in Conference X-Review

[ICLR2023] VisionTransformer Adapter for Dense Prediction

이번에 소개드릴 논문은 VisionAdapter라는 논문입니다. 방법론의 컨셉 자체는 단순한 것 같은데 ViT 구조에 언제든지 붙일 수 있다보니 그 범용성이 좋고 성능 향상도 크게 올리다보니 다양한…

Continue Reading
Posted in Conference Paper X-Review

[CVPR2024] DepthAnything: Unleashing the Power of Large-Scale Unlabeled Data

이번에 소개 드릴 논문은 DepthAnything이라는 논문입니다. 논문 및 코드가 공개된지는 몇개월 됐지만 지난 2월 26일날에 CVPR accept list가 공개되면서 본 논문도 CVPR2024에 게재된 것이 확인됐네요….

Continue Reading
Posted in Paper X-Review

(Arxiv2022) BinsFormer: Revisiting Adaptive Bins for Monocular Depth Estimation

이번에 소개드릴 논문은 BinsFormer라는 논문입니다. 논문이 arxiv에만 공개되어 있는 것이 아쉽긴한데 그 당시에 KITTI depth estimation benchmark (Feb, 2022)에서 1등을 한 방법론으로 arxiv 논문 치고…

Continue Reading
Posted in Conference X-Review

[CVPR2023] DistractFlow: Improving Optical Flow Estimation via Realistic Distractions and Pseudo-Labeling

24년도를 맞이해서 처음 작성하는 x리뷰네요. 이번에 소개드릴 논문은 DistractFlow라는 방법론으로 mix-up 기반 data augmentation을 통해 optical flow의 성능을 향상시키는 방법론입니다. Intro optical flow는 두 연속되는…

Continue Reading
Posted in Conference

[ICCV2023] EfficientViT: Multi-Scale Linear Attention for High-Resolution Dense Prediction

이번에 소개드릴 논문은 ICCV2023에 게재된 EfficientViT라는 방법론입니다. backbone에 대한 논문이며, image classification 같은 task 대신 segmentation, super resolution과 같은 dense level prediction task에 초점을 맞추어…

Continue Reading