Author: 박 성준

Posted in X-Diary

2024년을 마무리하며 – 박성준

안녕하세요. 시간이 흘러 어느새 2024년이 가고 2025년이 오고 있습니다. 올해는 저한테 있어서 배우는 점이 많았던 해인 것 같습니다. 2024년을 시작했던 다짐들을 돌아보고 앞으로 다가올 2025년의…

Continue Reading
Posted in X-Review

[CVPR 2022] Incorporating Semi-Supervised and Positive-Unlabeled Learning for Boosting Full Reference Image Quality Assessment

안녕하세요. 박성준 연구원입니다. 오늘은 약간 색다른 task의 논문을 리뷰하게 되었습니다. 그렇기 때문에 이번 리뷰는 좀 더 자세하게 서술해보려 합니다. 최근 unlabeled 데이터들을 잘 활용하는 방법에…

Continue Reading
Posted in X-Review

[arXiv2024] LLaVA-MR: Large Language-and-Vision Assistant for Video Moment Retrieval

안녕하세요. 오늘 제가 리뷰할 논문은 아직 아카이브에만 등재된 논문이지만, 제목을 보고 궁금증이 생겨서 읽게된 LLaVA-MR입니다. 올해 하반기부터해서 Video Moment Retrieval(VMR) task에서도 사전학습된 foundation 모델을 활용하는…

Continue Reading
Posted in X-Review

[NIPS2024] Temporal Grounding with Relevance Feedback in Videos

안녕하세요. 오늘 리뷰할 논문은 NIPS2014에 게재된 Temporal Sentence Grounding(TSG) 논문으로 이름만 다를 뿐 Video Moment Retrieval과 같은 연구입니다. Introduction TSG는 Temporal Sentence Grounding 연구로 영상…

Continue Reading
Posted in X-Review

[ECCCV2024] Uncertainty-Aware Sign Language Vido Retrieval with Probability Distribution Modeling

안녕하세요 박성준 연구원입니다. 제가 오늘 리뷰할 논문은 조금은 생소할 수 있는 task인 Sign Language(수화) Video Retrieval를 다룬 논문입니다. Introduction Sign Language Video Retrieval은 두가지의 목표를…

Continue Reading
Posted in X-Review

[ECCV2024]R2-Tuning: Efficient Image-to-Video Transfer Learning for Video Temporal Grounding

안녕하세요. 박성준 연구원입니다. 오늘 제가 리뷰할 논문은 ECCV2024에 게재된 R2-Tuning 입니다. Introduction 먼저 R2-Tuning은 Video Temporal Grounding(VTG) task를 다룬 논문입니다. VTG란, untrimmed(정제되지 않은) video 내에서…

Continue Reading
Posted in X-Review

[ACM MM 2024] Not All Inputs Are Valid: Towards Open-Set Video Moment Retrieval using Language

안녕하세요 박성준 연구원입니다. 오늘 제가 리뷰할 논문은 Not All Inputs Are Valid: Towards Open-Set Video Moment Retrieval using Language으로 Video Moment Retrieval을 Open-Set으로 확장시킨 첫…

Continue Reading
Posted in X-Review

[ICLR2024] Multi-granularity Correspondence Learning from Long-term Noisy Videos – Part 2

안녕하세요. 박성준 연구원입니다. 오늘은 ICLR2024에 게재된 Multi-granularity Correspondence Learning from Long-term Noisy Videos 논문의 Part2로 논문에서 제안하는 방법론과 실험결과에 대해서 리뷰하겠습니다. 아직 이전 리뷰를 보지…

Continue Reading
Posted in X-Review

[ICLR2024] Multi-granularity Correspondence Learning from Long-term Noisy Videos – Part 1

안녕하세요. 박성준 연구원입니다. 오늘 리뷰할 논문은 ICLR2024에 게재된 논문으로 video-paragraph retrieval, cilp-caption retrieval, text-to-video retrieval 등 text와 video의 align을 맞추는 tasks들을 전반적으로 다룬 논문으로 텍스트와…

Continue Reading
Posted in X-Review

[NIPS2023]CAST: Cross-Attention in Space and Time for Video Action Recognition

안녕하세요. 박성준입니다. 오늘 제가 할 리뷰는 KCCV 2024 포스터 및 오랄 발표 논문으로 video understanding 연구를 진행한 CAST 논문입니다. 먼저 Video Action Recognition는 영상 내…

Continue Reading