Author: 신 정민

Posted in Paper X-Review

[2025 TCSVT] MonoDiffusion: Self-Supervised Monocular Depth Estimation Using Diffusion Model

이번에 소개드릴 논문은 self-supervised monocular depth estimation 쪽 논문입니다. 해당 task로 논문을 쓰고 있어서 당분간 주기적으로 해당 분야의 최신 논문 리뷰를 작성할 것 같네요. self-supervised…

Continue Reading
Posted in Ph.D. X-Diary

2025년 상반기 회고문

어느 덧 25년도의 절반이 지나고도 20일이나 더 지났습니다. 체감 상 매우 짧게 느껴지지만 실제로는 긴 시간인 반년의 기간 동안을 되돌아보는 글을 작성하고자 합니다. 사실 이번…

Continue Reading
Posted in Conference X-Review

[CVPR2025] NavigationWorld Models

이번에 소개드릴 논문은 CVPR2025에 게재된 논문으로 Visual Navigation task 관련 논문입니다. 메타, 뉴욕대, 버클리 AI research에서 작성한 논문이고 교신저자가 르쿤이 형이여서 그런지 포스터 섹션에서도 많은…

Continue Reading
Posted in Conference X-Review

[CVPR2025] CustomKD: Customizing Large Vision Foundation for Edge Model Improvement via Knowledge Distillation

이번에 소개드릴 논문은 퀄컴에서 작성한 논문이며, 퀄컴의 관심 분야답게 모델의 효율성을 위한 Knowledge Distillation을 목적으로 합니다. CVPR 참관하면서 포스터로 접하게 된 논문인데 컨셉이 그리 복잡하지…

Continue Reading
Posted in Conference X-Review

[CVPR2025] Masking meets Supervision: A Strong Learning Alliance

이번에 리뷰로 작성할 논문은 CVPR2025에 게재된 논문으로 네이버 AI Lab에서 작성한 논문입니다. self-supervised learning에서 자주 소개되었던 Masked Image Modeling을 supervised learning framework에 적용하였을 때의 문제점을…

Continue Reading
Posted in Ph.D. X-Diary

CVPR2025 참관기

지난주 내슈빌에서 열린 CVPR 2025 참관 후기를 작성하고자 합니다. 무슨 이야기를 담으면 좋을까 하다가 학회에서 흥미롭게 봤던 연구 내용들은 세미나 시간에 풀면 될 것 같다는…

Continue Reading
Posted in Conference X-Review

[CVPR2022] Think Global, Act Local: Dual-scale Graph Transformer for vision-and-Language Navigation

오늘 리뷰 할 논문은 Vision-Language Navigation task를 다루는 논문으로 이쪽 분야에 대해서 처음 공부하다보니 모르는게 많아 리뷰 퀄리티가 낮을 수 있다는 점 양해부탁드립니다 허허. Intro…

Continue Reading
Posted in Paper X-Review

[TPAMI2023] SC-DepthV3: Robust Self-supervised Monocular Depth Estimation for Dynamic Scenes

오랜만에 쓰는 x리뷰입니다. 감을 잡을 겸 예전부터 익숙했던 분야의 논문을 읽고 리뷰해보았습니다. TPAMI2023에 나온 논문이고 제목에서 V3라고 되어있는데 V1은 IJCV, V2는 TPAMI2022에 붙은 논문으로 방향성을…

Continue Reading
Posted in Conference X-Review

[AAAI2024] SQLDepth: Generalizable Self-Supervised Fine-Structured Monocular Depth Estimation

이번에 소개드릴 논문은 AAAI 2024에 게재된 SQLDepth라고 하는 논문입니다. Self-supervised monocular depth estimation (SDE)에서 상당히 좋은 성능을 보여준 논문이지만 코드 공개도 안되어있고, 논문도 상당히 모호하게…

Continue Reading
Posted in Conference X-Review

[ICCV2023] Vision Transformer Adapters for Generalizable Multitask Learning

이번에 소개드릴 논문은 ICCV2023에 게재된 논문으로 Adapter를 활용하여 Multitask learning을 수행하는 논문입니다. 본 논문이 요즘 핫한 키워드인 adapter부터해서 zero-shot task transfer, domain generalization 등등 온갖…

Continue Reading