Category: X-Review

Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.

Posted in Paper X-Review

[ECCV 2024] Diffusion Models for Monocular Depth Estimation: Overcoming Challenging Conditions

안녕하세요, 75번째 x-review 입니다. 이번 논문은 2024 ECCV에 게재된 Diffusion Models for Monocular Depth Estimation이라는 논문 입니다. 그럼 바로 리뷰 시작하겠습니다  1. Introduction MDE는 한…

Continue Reading
Posted in Paper X-Review

[AAAI 2024] TD2-Net: Toward Denoising and Debiasing for Dynamic Scene Graph Generation

안녕하세요, 허재연입니다. 오늘 다룰 논문은 AAAI 2024에 게재된 논문으로, video scene graph에서의 다양한 데이터 문제를 다루고 있습니다. 개인적으로 Action Genome 데이터셋의 annotation을 살펴보면서 positive-negative 불균형이…

Continue Reading
Posted in Paper X-Review

[ICCV 2023]Prompt Switch: Efficient CLIP Adaptation for Text-Video Retrieval

안녕하세요 이번에 소개할 논문도 Text-Video Retrieval 분야의 연구 논문입니다. 저는 최근 CLIP 모델에 Mixture-of-Experts(MoE)를 결합하여 모델을 확장하고, 동시에 CLIP 백본에 시간적 정보를 추가하는 방법에 대해…

Continue Reading
Posted in X-Review

[NAACL 2025] DREAM: Improving Video-Text Retrieval Through Relevance-Based Augmentation Using Large Foundation Models

오랜만에 Video-Text Retrieval 태스크에 대해 리뷰해보겠습니다. 성능을 급격하게 상승시킨 논문이라서 리뷰하게 되었습니다. 바로 시작해보겠습니다. 1. Introduction 최근 비디오-텍스트 검색(Video-Text Retrieval, VTR) 성능 향상은 CLIIP이라는 강력한…

Continue Reading
Posted in X-Review

[ICCV 2025]6DOPE-GS: Online 6D Object Pose Estimation using Gaussian Splatting

안녕하세요, 7번째? X-Review 작성자 손우진입니다^^. 이번에 리뷰할 논문은 ICCV 2025에 accept된 논문입니다. 최근 X-Review에서 제가 6D 관련 논문을 자주 다루고 있는데요, 6D 분야의 흐름은 model-based에서…

Continue Reading
Posted in Paper X-Review

[arxiv 2025]Fine Tuning without Catastrophic Forgetting via Selective Low Rank Adaptation

안녕하세요. 이번에는 아카이브에 있지만 현재 창의학기제에서 CLIP 모델에 LoRA를 적용해보는게 어떨지 좀 서베이 해보다가 읽게된 논문을 들고왔습니다. 제가 생각했던 문제점을 실제로 다뤄줘서 들고왔고, 최초 LoRA…

Continue Reading
Posted in X-Review

[CVPR 2025] Any6D : Model-free 6D Pose Estimation of Novel Objects

안녕하세요 이번주는 Scene Complete과정에 속하는 6D Pose Estimation 논문을 리뷰하도록 하겠습니다. 단 한장의 RGB-D 앵커 이미지만 활용해 unknown 객체의 6D pose와 metric scale을 추정하는 model-free…

Continue Reading
Posted in Paper X-Review

[CVPR 2025] Towards Training-free Anomaly Detection with Vision and Language Foundation Models

안녕하세요, 예순 아홉번째 X-Review입니다. 이번 논문은 2025년도 CVPR에 올라온 Towards Training-free Anomaly Detection with Vision and Language Foundation Models 입니다. 바로 시작하도록 하겠습니다.  1. Introduction…

Continue Reading
Posted in Paper X-Review

[CVPR 2025]LLMDet: Learning Strong Open-Vocabulary Object Detectors under theSupervision of Large Language Models

안녕하세요. 이번에 리뷰로 들고 온 논문은 2025년 CVPR에 게재된 LLMDet 라는 논문입니다.먼저 OVOD는 대부분 아시다시피 사용자가 입력한 텍스트 라벨을 기반으로 임의의 클래스를 탐지하는 것을 목표로…

Continue Reading
Posted in Paper X-Review

[AAAI2025] Video Repurposing from User Generated Content: A Large-scale Dataset and Benchmark

오늘 소개드릴 논문은 비디오 요약과 관련된 문제를 새롭게 정의 하고 데이터셋을 구축한 논문입니다. 테스크 명은 Video Repurposing 인데요, 본문에서 소개를 해보겠습니다. (Q)인스타그램, 틱톡, 유튜브 쇼츠등…

Continue Reading