Author: 신 정민
[AAAI2024] SQLDepth: Generalizable Self-Supervised Fine-Structured Monocular Depth Estimation
이번에 소개드릴 논문은 AAAI 2024에 게재된 SQLDepth라고 하는 논문입니다. Self-supervised monocular depth estimation (SDE)에서 상당히 좋은 성능을 보여준 논문이지만 코드 공개도 안되어있고, 논문도 상당히 모호하게…
[ICCV2023] Vision Transformer Adapters for Generalizable Multitask Learning
이번에 소개드릴 논문은 ICCV2023에 게재된 논문으로 Adapter를 활용하여 Multitask learning을 수행하는 논문입니다. 본 논문이 요즘 핫한 키워드인 adapter부터해서 zero-shot task transfer, domain generalization 등등 온갖…
[Transactions on Machine Learning Research 2024] DINOv2: Learning Robust Visual Features without Supervision
이번에 소개드릴 논문은 DINOv2라는 논문입니다. Self-supervised Learning에서 매우 잘 알려진 Facebook AI Research의 DINOv1의 후속작으로 해당 논문도 마찬가지로 페이스북에서 공개한 논문입니다. 본 논문과 21년도 논문이었던…
[Arxiv2023] ZoeDepth
이번에 소개드릴 논문은 ZoeDepth라는 논문입니다. 비록 아카이브에만 머물고 있는 논문이지만, 인텔과 KAUST에서 공개한 논문이기도 하고, github star도 1.9K라는 점에서 상당한 저력이 있는 논문이라고 생각합니다. 먼저…
[Arxiv2024] CMRNext: Camera to Lidar Matching in the Wild for Localization and Extrinsic Calibration
이번에 소개드릴 논문은 CMRNext라고 하는 방법론입니다. 논문에서 다루는 task는 Visual Localization and Extrinsic Calibration이라는 task인데 앞에 Visual Localization보다는 Extrinsic Calibration 문제에 대해서 더 관심이 있어…
[CVPR2023] 1% VS 100%: Parameter-Efficient Low Rank Adapter for Dense Predictions
지난번 리뷰에 이어 이번 논문 리뷰도 Adapter 관련 논문입니다. CVPR2023에 게재된 논문으로 지난번 ViT Adapter랑은 접근 방식이 제법 다른 방법론입니다. Intro InternImage, GPT 등등 Vision,…
[ICLR2023] VisionTransformer Adapter for Dense Prediction
이번에 소개드릴 논문은 VisionAdapter라는 논문입니다. 방법론의 컨셉 자체는 단순한 것 같은데 ViT 구조에 언제든지 붙일 수 있다보니 그 범용성이 좋고 성능 향상도 크게 올리다보니 다양한…
[CVPR2024] DepthAnything: Unleashing the Power of Large-Scale Unlabeled Data
이번에 소개 드릴 논문은 DepthAnything이라는 논문입니다. 논문 및 코드가 공개된지는 몇개월 됐지만 지난 2월 26일날에 CVPR accept list가 공개되면서 본 논문도 CVPR2024에 게재된 것이 확인됐네요….
(Arxiv2022) BinsFormer: Revisiting Adaptive Bins for Monocular Depth Estimation
이번에 소개드릴 논문은 BinsFormer라는 논문입니다. 논문이 arxiv에만 공개되어 있는 것이 아쉽긴한데 그 당시에 KITTI depth estimation benchmark (Feb, 2022)에서 1등을 한 방법론으로 arxiv 논문 치고…
최신 댓글