X-Review – Page 50 – Robotics and Computer Vision Lab

[ECCV 2024] SegPoint: Segment Any Point Cloud via Large Language Model

안녕하세요, 마흔 다섯번째 x-review 입니다. 엄청 오랜만에 엑스리뷰를 쓰는 것 같은데요, 이번 논문은 2024년도 ECCV에 게재된 SegPoint: Segment Any Point Cloud via Large Language Model입니다….

Paper X-Review

[2023 CVPR] Cap4Video: What Can Auxiliary Captions Do for Text-Video Retrieval?

안녕하세요. 이번에 리뷰할 논문은 기존의 텍스트-비디오 검색 방식에서 한 단계 발전하여, 비디오에 포함된 관련 텍스트 정보(예: 제목, 태그, 자막)를 활용하여 텍스트 쿼리를 더 효과적으로 매칭하는…

Conference X-Review

[ECCV 2024] HYPE: Hyperbolic Entailment Filtering for Underspecified Images and Texts

이번에는 하이퍼볼릭 임베딩을 활용한 이미지-텍스트 데이터 필터링에 대한 논문을 리뷰해보겠습니다. 보다 구체적으로 말하자면, 단순히 이미지-텍스트 사이의 정렬만 집중하는 것이 아닌 CLIP에 Hyperbolic Embedding을 추가하여 데이터의…

Paper X-Review

[ICCV 2021] Emerging Properties in Self-Supervised Vision Transformers (DINO)

안녕하세요, 허재연입니다. 오늘 리뷰 할 논문은 Facebook AI Research에서 2021년 ICCV에 게재한 논문으로 DINO라는 Self-Supervised Learning 방법을 제안한 논문입니다. DINOv2라는 방법론을 공부해 볼 예정이기에 먼저…

Paper X-Review

[CVPR 2023] Towards Unified Scene Text Spotting based on Sequence Generation

안녕하세요, 마흔여섯 번째 X-Review입니다. 이번 논문은 2023년도 CVPR에 게재된 Towards Unified Scene Text Spotting based on Sequence Generation 논문입니다. 바로 시작하도록 하겠습니다. ? 1. Introduction…

Paper X-Review

[NeurIPS 2024]Fine-Tuning is Fine if Calibrated

사전 학습된 모델을 특정 작업에 맞게 최적화하는 파인 튜닝(fine-tuning)은, 사전 학습에 사용된 정보를 손실하는 catastrophic forgetting 문제가 있다고 알려져 있습니다. 그러나 본 논문에서는 다른 관점을…

Conference X-Review

[CVPR 2024] Feature 3DGS: Supercharging 3D Gaussian Splatting to Enable Distilled Feature Fields

이번 논문은 3D scene representations에 foundation model의 특징 정보를 학습시킴으로써, 장면에 대한 의미론적 이해가 가능하도록 하는 것을 목표로 합니다. 더 나아가, 언어, point, bbox 등…

Paper X-Review

[AAAI 2024] Exploiting Auxiliary Caption for Video Grounding

안녕하세요, 이번 주 X-Review에는 24년도 AAAI에 게재된 논문 <Exploiting Auxiliary Caption for Video Grounding>을 소개해드리겠습니다. 비디오 도메인의 Video Grounding task를 수행하며, 중국 북경대의 연구 결과지만…

Paper X-Review

[ICLR 2024] Active Test-Time Adaptation: Theoretical Analyses and An Algorithm

오늘 리뷰할 논문은 Test-Time Adaptation과 Active Learning 을 결합한 Active Test-Time Adaptation (ATTA) 라는 분야를새롭게 제안한 논문입니다. 본 논문에서는 앞서 활발히 연구되고 있는 Test-Time Adaptation…

Conference Paper X-Review