Author: 박 성준

Posted in X-Review

[ICLR2024] Multi-granularity Correspondence Learning from Long-term Noisy Videos – Part 2

안녕하세요. 박성준 연구원입니다. 오늘은 ICLR2024에 게재된 Multi-granularity Correspondence Learning from Long-term Noisy Videos 논문의 Part2로 논문에서 제안하는 방법론과 실험결과에 대해서 리뷰하겠습니다. 아직 이전 리뷰를 보지…

Continue Reading
Posted in X-Review

[ICLR2024] Multi-granularity Correspondence Learning from Long-term Noisy Videos – Part 1

안녕하세요. 박성준 연구원입니다. 오늘 리뷰할 논문은 ICLR2024에 게재된 논문으로 video-paragraph retrieval, cilp-caption retrieval, text-to-video retrieval 등 text와 video의 align을 맞추는 tasks들을 전반적으로 다룬 논문으로 텍스트와…

Continue Reading
Posted in X-Review

[NIPS2023]CAST: Cross-Attention in Space and Time for Video Action Recognition

안녕하세요. 박성준입니다. 오늘 제가 할 리뷰는 KCCV 2024 포스터 및 오랄 발표 논문으로 video understanding 연구를 진행한 CAST 논문입니다. 먼저 Video Action Recognition는 영상 내…

Continue Reading
Posted in X-Diary

KCCV2024 참관기

안녕하세요. 박성준 연구원입니다. 이번에 KCCV2024를 다녀오게 되어 참관기를 남기게 되었습니다. KCCV2024를 준비하며 연구실에서 KCCV2024를 참관하는 것이 확정되며 설레는(?) 마음으로 KCCV2024에 대해 알아보기 시작했습니다. 다들 아시겠지만…

Continue Reading
Posted in X-Review

[ICCV2023]Self-Feedback DETR for Temporal Action Detection

안녕하세요 박성준 연구원입니다. 오늘 제가 할 리뷰는 Self-Feedback DETR로 이번에 KCCV2023에서 포스터가 예정되어 있는 논문입니다. KCCV 2024에 앞서 일정을 훑어보는 중 흥미로워 보여서 읽게 되었습니다….

Continue Reading
Posted in X-Review

[ArXiv2024]The Surprising Effectiveness of Multimodal Large Language Models for Video Moment Retrieval

안녕하세요. 박성준 연구원입니다. 오늘 리뷰할 논문은 아직 아카이브에만 등재되어있긴하지만, Moment Retrieval task에 MLLM을 활용해 SOTA를 달성한 Mr.BLIP 모델입니다. 논문의 양식을 보아 ECCV에 제출할 것으로 예상되는…

Continue Reading
Posted in X-Review

[CVPR2024]Retrieval-Augmented Open-Vocabulary Object Detection

안녕하세요. 오늘 리뷰할 논문은 OVOD task를 다룬 Retrieval-Augmented Open-Vocabulary Object Detection입니다. CVPR 논문들을 뒤져보다가 마침 궁금했던 OVOD task를 고려대학교, 삼섬 리서치에서 작성한 논문이 있길래 OVOD…

Continue Reading
Posted in X-Diary

2024년 상반기 회고 – 박성준

안녕하세요. 박성준 연구원입니다. 어느새 2024년의 절반이 지나 7월을 앞두고 있고 시간이 흘러 이제 연구실에 들어온 지 1년이 되어갑니다. 지난 1년 동안 연구실에서 여러 선배 연구원들로부터…

Continue Reading
Posted in X-Review

[NIPS2023]MomentDiff: Generative Video Moment Retrieval from Random to Real

안녕하세요. 오늘 리뷰할 논문은 디퓨전을 사용해 Moment Retrieval을 다룬 MomentDiff 논문입니다. Abstract 비디오 Moment Retrieval은 주어진 텍스트 설명에 해당하는 특정 구간을 비디오 영상으로부터 식별하기 위한…

Continue Reading
Posted in X-Review

[CVPR2023]Weakly Supervised Temporal Sentence Grounding with Uncertainty-Guided Self-training

안녕하세요 박성준 연구원입니다. 제가 오늘 리뷰할 논문은 Moment Retrieval을 weak supervision으로 다룬 방법론입니다. weakly supervised moment retrieval은 영상과 자연어 쿼리만 주어지고 쿼리에 해당하는 구간이 annotation이…

Continue Reading