Author: 신 정민

Posted in Conference X-Review

[ICCV2025] FlashDepth: Real-time streaming Video Depth Estimation at 2K Resolution

이번에 소개드릴 논문은 Video Depth Estimation 논문입니다. 근데 이제 고해상도에 빠른 추론 속도를 곁드린. 보통 Depth estimation은 단일 프레임에 대해서 입력으로 하는 경우가 대부분이고 종종…

Continue Reading
Posted in Paper X-Review

DINOv3

이번에 소개드릴 논문은 최근에 공개된 DINOv3 입니다. DINOv2가 CV에서 엄청난 파급력이 있음은 잘 알려져있지만 그렇다고 이번에 새로 나온 DINOv3 논문 제목이 추가적인 부연 설명이나 내용…

Continue Reading
Posted in Conference X-Review

[ICCV2025] Mind the Gap: Aligning Vision Foundation Models to Image Feature Matching

이번에 소개드릴 논문은 ICCV2025에 게재된 논문으로 feature matching task를 다루고 있습니다. 제가 예전에 homography estimation 논문을 작성할 때 feature matching 방법론들 논문을 종종 보곤 했었는데…

Continue Reading
Posted in Conference X-Review

[CVPR2025] NVILA: Efficient Frontier Visual Language Models

오늘 소개드릴 논문은 CVPR2025에 게재된 NVIDIA 논문이고 제목에서도 보시면 아시다시피 효율적인 VLM을 만드는 방법에 대해서 소개하는 논문입니다. 근데 제가 논문을 검색해서 찾을 때는 CVPR 포멧이…

Continue Reading
Posted in Conference X-Review

[CVPR2025] GeoDepth

이번에 리뷰로 작성할 논문은 CVPR2025에 게재된 GeoDepth라는 논문이며, 해당 논문은 self-supervised monocular depth estimation task를 다루고 있습니다. Intro 지난번 리뷰에서도 마찬가지로 self-supervised monocular depth estimation(SDE)는…

Continue Reading
Posted in Paper X-Review

[2025 TCSVT] MonoDiffusion: Self-Supervised Monocular Depth Estimation Using Diffusion Model

이번에 소개드릴 논문은 self-supervised monocular depth estimation 쪽 논문입니다. 해당 task로 논문을 쓰고 있어서 당분간 주기적으로 해당 분야의 최신 논문 리뷰를 작성할 것 같네요. self-supervised…

Continue Reading
Posted in Ph.D. X-Diary

2025년 상반기 회고문

어느 덧 25년도의 절반이 지나고도 20일이나 더 지났습니다. 체감 상 매우 짧게 느껴지지만 실제로는 긴 시간인 반년의 기간 동안을 되돌아보는 글을 작성하고자 합니다. 사실 이번…

Continue Reading
Posted in Conference X-Review

[CVPR2025] NavigationWorld Models

이번에 소개드릴 논문은 CVPR2025에 게재된 논문으로 Visual Navigation task 관련 논문입니다. 메타, 뉴욕대, 버클리 AI research에서 작성한 논문이고 교신저자가 르쿤이 형이여서 그런지 포스터 섹션에서도 많은…

Continue Reading
Posted in Conference X-Review

[CVPR2025] CustomKD: Customizing Large Vision Foundation for Edge Model Improvement via Knowledge Distillation

이번에 소개드릴 논문은 퀄컴에서 작성한 논문이며, 퀄컴의 관심 분야답게 모델의 효율성을 위한 Knowledge Distillation을 목적으로 합니다. CVPR 참관하면서 포스터로 접하게 된 논문인데 컨셉이 그리 복잡하지…

Continue Reading
Posted in Conference X-Review

[CVPR2025] Masking meets Supervision: A Strong Learning Alliance

이번에 리뷰로 작성할 논문은 CVPR2025에 게재된 논문으로 네이버 AI Lab에서 작성한 논문입니다. self-supervised learning에서 자주 소개되었던 Masked Image Modeling을 supervised learning framework에 적용하였을 때의 문제점을…

Continue Reading