[NeurIPS 2024]Fine-Tuning is Fine if Calibrated
사전 학습된 모델을 특정 작업에 맞게 최적화하는 파인 튜닝(fine-tuning)은, 사전 학습에 사용된 정보를 손실하는 catastrophic forgetting 문제가 있다고 알려져 있습니다. 그러나 본 논문에서는 다른 관점을…
[CVPR 2024] Feature 3DGS: Supercharging 3D Gaussian Splatting to Enable Distilled Feature Fields
이번 논문은 3D scene representations에 foundation model의 특징 정보를 학습시킴으로써, 장면에 대한 의미론적 이해가 가능하도록 하는 것을 목표로 합니다. 더 나아가, 언어, point, bbox 등…
[AAAI 2024] Exploiting Auxiliary Caption for Video Grounding
안녕하세요, 이번 주 X-Review에는 24년도 AAAI에 게재된 논문 <Exploiting Auxiliary Caption for Video Grounding>을 소개해드리겠습니다. 비디오 도메인의 Video Grounding task를 수행하며, 중국 북경대의 연구 결과지만…
[ICLR 2024] Active Test-Time Adaptation: Theoretical Analyses and An Algorithm
오늘 리뷰할 논문은 Test-Time Adaptation과 Active Learning 을 결합한 Active Test-Time Adaptation (ATTA) 라는 분야를새롭게 제안한 논문입니다. 본 논문에서는 앞서 활발히 연구되고 있는 Test-Time Adaptation…
[ECCV 2024 Oral] CAT-SAM: Conditional Tuning for Few-Shot Adaptation of Segment Anything Model
이번 리뷰 논문은 CAT-SAM이라는 SAM의 지식을 유지하면서 특정 도메인에 효율적으로 적응시키는 기법을 소개한 논문입니다. RGB 특화된 태스크 외에도 비 RGB에서도 적응적인 결과를 보여주고 있습니다. 추가로…
[AAAI 2023]Few-Shot Object Detection via Variational Feature Aggregation
오늘 소개해드릴 논문은 Novel Class에 대한 Feature의 분포 학습을 통해 Few-shot Learning 성능을 개선시킨 논문입니다. 그럼 논문 소개를 시작해보겠습니다. 소개 소개하는 논문은 Few-Shot Object Detection(FSOD)문제를…
[ECCV 2022] Language Matters – A Weakly Supervised Vision-Language Pre-training Approach for Scene Text Detection and Spotting
안녕하세요, 마흔다섯 번째 X-Review입니다. 이번 논문은 2022년도 ECCV에 게재된 Language Matters – A Weakly Supervised Vision-Language Pre-training Approach for Scene Text Detection and Spotting 논문입니다….
[arXiv 2024] ScaleDepth: Decomposing Metric Depth Estimation into Scale Prediction and Relative Depth Estimation
안녕하세요. 이번 리뷰는 24년 7월, arXiv에 공개된 depth estimation에 관한 논문입니다. 본 논문을 읽게 된 계기는 제가 주 담당자로 활동하는 센서 과제와 관련이 있는데, 해당…
[ACM MM 2024] Not All Inputs Are Valid: Towards Open-Set Video Moment Retrieval using Language
안녕하세요 박성준 연구원입니다. 오늘 제가 리뷰할 논문은 Not All Inputs Are Valid: Towards Open-Set Video Moment Retrieval using Language으로 Video Moment Retrieval을 Open-Set으로 확장시킨 첫…
[CVPRw 2024] GM-DETR: Generalized Muiltispectral DEtection TRansformer with Efficient Fusion Encoder for Visible-Infrared Detection
안녕하세요, 허재연입니다. 오늘 리뷰할 논문은 2024년 CVPR workshop에서 발표된 논문으로, DETR 구조를 활용해 multispectral detection을 수행하는 모델을 제안하였습니다. 바로 리뷰 시작하도록 하겠습니다. Introduction Object Detection은…
안녕하세요 정민님 깔끔한 리뷰 감사합니다. 말씀하신 것처럼 약간 지도학습기반으로 다시 회귀하는 점이 장점이자 단점이라고 생각할 수 있을 것 같습니다. 제가…