[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[NeurIPS 2024]Fine-Tuning is Fine if Calibrated
사전 학습된 모델을 특정 작업에 맞게 최적화하는 파인 튜닝(fine-tuning)은, 사전 학습에 사용된 정보를 손실하는 catastrophic forgetting 문제가 있다고 알려져 있습니다. 그러나 본 논문에서는 다른 관점을…
[CVPR 2024] Feature 3DGS: Supercharging 3D Gaussian Splatting to Enable Distilled Feature Fields
이번 논문은 3D scene representations에 foundation model의 특징 정보를 학습시킴으로써, 장면에 대한 의미론적 이해가 가능하도록 하는 것을 목표로 합니다. 더 나아가, 언어, point, bbox 등…
[AAAI 2024] Exploiting Auxiliary Caption for Video Grounding
안녕하세요, 이번 주 X-Review에는 24년도 AAAI에 게재된 논문 <Exploiting Auxiliary Caption for Video Grounding>을 소개해드리겠습니다. 비디오 도메인의 Video Grounding task를 수행하며, 중국 북경대의 연구 결과지만…
[ICLR 2024] Active Test-Time Adaptation: Theoretical Analyses and An Algorithm
오늘 리뷰할 논문은 Test-Time Adaptation과 Active Learning 을 결합한 Active Test-Time Adaptation (ATTA) 라는 분야를새롭게 제안한 논문입니다. 본 논문에서는 앞서 활발히 연구되고 있는 Test-Time Adaptation…
[ECCV 2024 Oral] CAT-SAM: Conditional Tuning for Few-Shot Adaptation of Segment Anything Model
이번 리뷰 논문은 CAT-SAM이라는 SAM의 지식을 유지하면서 특정 도메인에 효율적으로 적응시키는 기법을 소개한 논문입니다. RGB 특화된 태스크 외에도 비 RGB에서도 적응적인 결과를 보여주고 있습니다. 추가로…
[AAAI 2023]Few-Shot Object Detection via Variational Feature Aggregation
오늘 소개해드릴 논문은 Novel Class에 대한 Feature의 분포 학습을 통해 Few-shot Learning 성능을 개선시킨 논문입니다. 그럼 논문 소개를 시작해보겠습니다. 소개 소개하는 논문은 Few-Shot Object Detection(FSOD)문제를…
[ECCV 2022] Language Matters – A Weakly Supervised Vision-Language Pre-training Approach for Scene Text Detection and Spotting
안녕하세요, 마흔다섯 번째 X-Review입니다. 이번 논문은 2022년도 ECCV에 게재된 Language Matters – A Weakly Supervised Vision-Language Pre-training Approach for Scene Text Detection and Spotting 논문입니다….
[arXiv 2024] ScaleDepth: Decomposing Metric Depth Estimation into Scale Prediction and Relative Depth Estimation
안녕하세요. 이번 리뷰는 24년 7월, arXiv에 공개된 depth estimation에 관한 논문입니다. 본 논문을 읽게 된 계기는 제가 주 담당자로 활동하는 센서 과제와 관련이 있는데, 해당…
[ACM MM 2024] Not All Inputs Are Valid: Towards Open-Set Video Moment Retrieval using Language
안녕하세요 박성준 연구원입니다. 오늘 제가 리뷰할 논문은 Not All Inputs Are Valid: Towards Open-Set Video Moment Retrieval using Language으로 Video Moment Retrieval을 Open-Set으로 확장시킨 첫…
[CVPRw 2024] GM-DETR: Generalized Muiltispectral DEtection TRansformer with Efficient Fusion Encoder for Visible-Infrared Detection
안녕하세요, 허재연입니다. 오늘 리뷰할 논문은 2024년 CVPR workshop에서 발표된 논문으로, DETR 구조를 활용해 multispectral detection을 수행하는 모델을 제안하였습니다. 바로 리뷰 시작하도록 하겠습니다. Introduction Object Detection은…
최신 댓글