Author: 박 성준
[ECCCV2024] Uncertainty-Aware Sign Language Vido Retrieval with Probability Distribution Modeling
안녕하세요 박성준 연구원입니다. 제가 오늘 리뷰할 논문은 조금은 생소할 수 있는 task인 Sign Language(수화) Video Retrieval를 다룬 논문입니다. Introduction Sign Language Video Retrieval은 두가지의 목표를…
[ECCV2024]R2-Tuning: Efficient Image-to-Video Transfer Learning for Video Temporal Grounding
안녕하세요. 박성준 연구원입니다. 오늘 제가 리뷰할 논문은 ECCV2024에 게재된 R2-Tuning 입니다. Introduction 먼저 R2-Tuning은 Video Temporal Grounding(VTG) task를 다룬 논문입니다. VTG란, untrimmed(정제되지 않은) video 내에서…
[ACM MM 2024] Not All Inputs Are Valid: Towards Open-Set Video Moment Retrieval using Language
안녕하세요 박성준 연구원입니다. 오늘 제가 리뷰할 논문은 Not All Inputs Are Valid: Towards Open-Set Video Moment Retrieval using Language으로 Video Moment Retrieval을 Open-Set으로 확장시킨 첫…
[ICLR2024] Multi-granularity Correspondence Learning from Long-term Noisy Videos – Part 2
안녕하세요. 박성준 연구원입니다. 오늘은 ICLR2024에 게재된 Multi-granularity Correspondence Learning from Long-term Noisy Videos 논문의 Part2로 논문에서 제안하는 방법론과 실험결과에 대해서 리뷰하겠습니다. 아직 이전 리뷰를 보지…
[ICLR2024] Multi-granularity Correspondence Learning from Long-term Noisy Videos – Part 1
안녕하세요. 박성준 연구원입니다. 오늘 리뷰할 논문은 ICLR2024에 게재된 논문으로 video-paragraph retrieval, cilp-caption retrieval, text-to-video retrieval 등 text와 video의 align을 맞추는 tasks들을 전반적으로 다룬 논문으로 텍스트와…
[NIPS2023]CAST: Cross-Attention in Space and Time for Video Action Recognition
안녕하세요. 박성준입니다. 오늘 제가 할 리뷰는 KCCV 2024 포스터 및 오랄 발표 논문으로 video understanding 연구를 진행한 CAST 논문입니다. 먼저 Video Action Recognition는 영상 내…
KCCV2024 참관기
안녕하세요. 박성준 연구원입니다. 이번에 KCCV2024를 다녀오게 되어 참관기를 남기게 되었습니다. KCCV2024를 준비하며 연구실에서 KCCV2024를 참관하는 것이 확정되며 설레는(?) 마음으로 KCCV2024에 대해 알아보기 시작했습니다. 다들 아시겠지만…
[ICCV2023]Self-Feedback DETR for Temporal Action Detection
안녕하세요 박성준 연구원입니다. 오늘 제가 할 리뷰는 Self-Feedback DETR로 이번에 KCCV2023에서 포스터가 예정되어 있는 논문입니다. KCCV 2024에 앞서 일정을 훑어보는 중 흥미로워 보여서 읽게 되었습니다….
[ArXiv2024]The Surprising Effectiveness of Multimodal Large Language Models for Video Moment Retrieval
안녕하세요. 박성준 연구원입니다. 오늘 리뷰할 논문은 아직 아카이브에만 등재되어있긴하지만, Moment Retrieval task에 MLLM을 활용해 SOTA를 달성한 Mr.BLIP 모델입니다. 논문의 양식을 보아 ECCV에 제출할 것으로 예상되는…
[CVPR2024]Retrieval-Augmented Open-Vocabulary Object Detection
안녕하세요. 오늘 리뷰할 논문은 OVOD task를 다룬 Retrieval-Augmented Open-Vocabulary Object Detection입니다. CVPR 논문들을 뒤져보다가 마침 궁금했던 OVOD task를 고려대학교, 삼섬 리서치에서 작성한 논문이 있길래 OVOD…
최신 댓글