Author: 박 성준

Posted in X-Diary

KCCV2024 참관기

안녕하세요. 박성준 연구원입니다. 이번에 KCCV2024를 다녀오게 되어 참관기를 남기게 되었습니다. KCCV2024를 준비하며 연구실에서 KCCV2024를 참관하는 것이 확정되며 설레는(?) 마음으로 KCCV2024에 대해 알아보기 시작했습니다. 다들 아시겠지만…

Continue Reading
Posted in X-Review

[ICCV2023]Self-Feedback DETR for Temporal Action Detection

안녕하세요 박성준 연구원입니다. 오늘 제가 할 리뷰는 Self-Feedback DETR로 이번에 KCCV2023에서 포스터가 예정되어 있는 논문입니다. KCCV 2024에 앞서 일정을 훑어보는 중 흥미로워 보여서 읽게 되었습니다….

Continue Reading
Posted in X-Review

[ArXiv2024]The Surprising Effectiveness of Multimodal Large Language Models for Video Moment Retrieval

안녕하세요. 박성준 연구원입니다. 오늘 리뷰할 논문은 아직 아카이브에만 등재되어있긴하지만, Moment Retrieval task에 MLLM을 활용해 SOTA를 달성한 Mr.BLIP 모델입니다. 논문의 양식을 보아 ECCV에 제출할 것으로 예상되는…

Continue Reading
Posted in X-Review

[CVPR2024]Retrieval-Augmented Open-Vocabulary Object Detection

안녕하세요. 오늘 리뷰할 논문은 OVOD task를 다룬 Retrieval-Augmented Open-Vocabulary Object Detection입니다. CVPR 논문들을 뒤져보다가 마침 궁금했던 OVOD task를 고려대학교, 삼섬 리서치에서 작성한 논문이 있길래 OVOD…

Continue Reading
Posted in X-Diary

2024년 상반기 회고 – 박성준

안녕하세요. 박성준 연구원입니다. 어느새 2024년의 절반이 지나 7월을 앞두고 있고 시간이 흘러 이제 연구실에 들어온 지 1년이 되어갑니다. 지난 1년 동안 연구실에서 여러 선배 연구원들로부터…

Continue Reading
Posted in X-Review

[NIPS2023]MomentDiff: Generative Video Moment Retrieval from Random to Real

안녕하세요. 오늘 리뷰할 논문은 디퓨전을 사용해 Moment Retrieval을 다룬 MomentDiff 논문입니다. Abstract 비디오 Moment Retrieval은 주어진 텍스트 설명에 해당하는 특정 구간을 비디오 영상으로부터 식별하기 위한…

Continue Reading
Posted in X-Review

[CVPR2023]Weakly Supervised Temporal Sentence Grounding with Uncertainty-Guided Self-training

안녕하세요 박성준 연구원입니다. 제가 오늘 리뷰할 논문은 Moment Retrieval을 weak supervision으로 다룬 방법론입니다. weakly supervised moment retrieval은 영상과 자연어 쿼리만 주어지고 쿼리에 해당하는 구간이 annotation이…

Continue Reading
Posted in X-Review

[CVPR2024]Bridging the Gap: A Unified Video Comprehension Framework for Moment Retrieval and Highlight Detection

안녕하세요. 박성준입니다. 제가 오늘 리뷰할 논문은 바로 CVPR 2024에 등재된 UVCOM입니다. UVCOM은 Unified Video COMprehension의 약자로 Moment Retrieval과 Highlight Detection task를 다룰 수 있는 Unified…

Continue Reading
Posted in X-Review

[ICCV2023]Unified Coarse-to-Fine Alignment for Video-Text Retrieval

안녕하세요. 오늘 다룰 논문은 ICCV 2023의 Unified Coarse-to-Fine Alignment for Video-Text Retrieval(UCoFIA)입니다. CLIP 기반의 text-video task에서 SOTA를 달성했었던 모델입니다. Abstract Moment Retrieval에서 흔히 사용되는 방법…

Continue Reading
Posted in X-Review

[CVPR2024]Towards Surveillance Video-and-Language Understanding: New Dataset, Baselines, and Challenges

안녕하세요. 박성준입니다. 오늘의 x-review는 2024 CVPR에 개재된 UCA 데이터셋입니다. Introduction 감시 영상은 보안에 관련해 많은 관심을 이끌고 있지만, 기존의 감시 영상 데이터셋들은 이상 사건들을 분류하고…

Continue Reading