Author: 안 우현

Posted in B.S. X-Diary

2025년도 하계 URP 조교를 마치며

안녕하세요. 2025 겨울학기 URP 과정에서 멘티로 참여했었는데, 이번에는 2025년 여름학기 URP 과정에서 서브 멘토로 참여하게 되었습니다. 이번 8주간의 과정에서 멘티 시절과는 다른 위치에서 URP를 다시…

Continue Reading
Posted in X-Review

[WACV 2024]Revisiting Token Pruning for Object Detection and Instance Segmentation

안녕하세요, 이번에 리뷰할 논문은 토큰 프루닝 관련 논문입니다. 토큰 프루닝 관련 논문은 처음 접해보는 분야인지라 아무리 쉬운 방법론이라고 저자가 언급하여도 저한테는 어렵고 낯설어서 읽기가 어려웠던…

Continue Reading
Posted in Paper X-Review

[Arxiv 2022]BinsFormer:Revisiting Adaptive Bins forMonocular Depth Estimation

안녕하세요 이번에 들고온 논문은 2022년에 arxiv에 올라온 BinsFormer:Revisiting Adaptive Bins forMonocular Depth Estimation라는 논문입니다.이번에는 이전에 리뷰했던 Scale Depth의 근간이 되는 BinsFormer를 직접 읽어보면서, 무엇이 핵심…

Continue Reading
Posted in Paper X-Review

[CVPR 2025]LLMDet: Learning Strong Open-Vocabulary Object Detectors under theSupervision of Large Language Models

안녕하세요. 이번에 리뷰로 들고 온 논문은 2025년 CVPR에 게재된 LLMDet 라는 논문입니다.먼저 OVOD는 대부분 아시다시피 사용자가 입력한 텍스트 라벨을 기반으로 임의의 클래스를 탐지하는 것을 목표로…

Continue Reading
Posted in Paper

[CVPR 2023]Mask DINO: Towards A Unified Transformer-based Framework for Object Detection and Segmentation

안녕하세요. 이번에 제가 이번에 리뷰할 논문은 Mask DINO라는 논문입니다. 상반기 회고에서도 잠깐 언급했듯이, 현재는 단순하게 말씀드리면 하나의 모델로 depth estimation과 object detection을 동시에 수행할 수…

Continue Reading
Posted in B.S. X-Diary

2025 상반기 회고

안녕하세요. 작년 10월 중순에 연구실에 처음 들어와서 멀뚱 멀뚱 앉아있던 것이 엊그제 같은데 벌써 올해의 반절을 넘어 7월이 지나고 8월을 향해 달려가고 있는 것을 보니…

Continue Reading
Posted in Paper X-Review

[ICLR 2025]DEPTH PRO: Sharp Monocular Metric Depth In Less Than a Second

안녕하세요. 이번 X-Review에서는 2025년 ICLR에 게재된 애플에서 연구한 논문 “Depth Pro: Sharp Monocular Metric Depth in Less Than a Second”를 소개드리고자 합니다. 저번 주에 소개드렸던…

Continue Reading
Posted in Paper X-Review

[arXiv 2024]ScaleDepth: Decomposing Metric Depth Estimation into Scale Prediction and Relative Depth Estimation

안녕하세요 이번에 들고온 리뷰할 논문은 Scale Depth 라는 논문입니다. 2024년 10월에 아카이브에 올라왔지만 아직 어느 학회에도 게재가 되지는 않은 논문입니다. 다른 Depth 논문들과는 다르게 이미지를…

Continue Reading
Posted in X-Review

[CVPR 2022]RegionCLIP: Region-based Language-Image Pretraining

안녕하세요. 두 번째 X-Review로 소개드릴 논문은 RegionCLIP: Region-based Language-Image Pretraining으로 2022년 CVPR에 게재된 논문입니다. 이 논문은 제가 OVOD(Open-Vocabulary Object Detection) 관련 연구들을 처음 접하고 공부하던…

Continue Reading
Posted in Paper X-Review

[CVPR 2024]YOLO-World:Real-Time Open-Vocabulary Object Detection

안녕하세요 이번에 첫번째 X-review를 작성하게된 안우현 이라고합니다. 제가 오늘 첫번재로 가져온 논문은 2024년 3월 CVPR에 게재된 Open Vocabulary Object Detection 분야의 최신 연구라고 볼 수…

Continue Reading