Author: 김 현우

Posted in Paper X-Review

[ECCV 2022] Zero-Shot Temporal Action Detection via Vision-Language Prompting

오늘의 X-Review에서는 Zero-shot 기반으로 Temporal Action Localization을 수행하기 위해 CLIP을 활용한 논문에 대해 소개해드리겠습니다. 22년도 ECCV에 게재되었습니다. 1. Introduction 22년도는 그 당시 CLIP의 등장으로 다양한…

Continue Reading
Posted in Paper X-Review

[MDPI Applied Science 2024] VTG-GPT: Tuning-Free Zero-Shot Video Temporal Grounding with GPT

안녕하세요. 오늘의 X-Review에서는 GPT 등의 LLM을 활용해 Temporal Sentence Grounding in Video(TSGV) task를 수행하는 논문을 소개해드리겠습니다. 해당 논문은 중국 대학교에서 연구되었으며 24년도 MDPI Applied Science…

Continue Reading
Posted in B.S. X-Diary

AAAI-24 학회 참관기

안녕하세요, 오늘은 저번 주 다녀왔던 2024년도 AAAI 학회 참관기를 작성해보겠습니다. 우선 저희 팀은 이번 AAAI에 <VVS: Video-to-Video Retrieval with Irrelevant Frame Suppression> 논문이 accept되어 참석하게…

Continue Reading
Posted in Paper X-Review

[AAAI 2023] Phrase-level Relationship Mining for Temporal Sentence Localization

오늘의 X-Review 또한 Temporal Sentence Grounding in Videos(TSGV) task 방법론으로 가져왔습니다. 23년도 AAAI에 게재되었으며 중국 북경대의 연구 결과입니다. 최근 연구실 전체적으로 제안서 작업이 한창인데요, 저희…

Continue Reading
Posted in Paper X-Review

[CVPR 2023] You Can Ground Earlier than See: An Effective and Efficient Pipeline for Temporal Sentence Grounding in Compressed Videos

안녕하세요. 이번 주 X-Review는 23년도 CVPR에 게재된 <You Can Ground Earlier than See: An Effective and Efficient Pipeline for Temporal Sentence Grounding in Compressed Videos>입니다….

Continue Reading
Posted in Paper X-Review

[CVPR 2023] Text-Visual Prompting for Efficient 2D Temporal Video Grounding

이번 주차 X-Review 또한 Temporal Sentence Grounding in Videos(TSGV) 관련 논문입니다. 본 논문은 23년도 CVPR에 게재되었으며, 20, 21년도 근처의 초창기 방법론들을 익히던 와중 23년도 CVPR에…

Continue Reading
Posted in Paper X-Review

[CVPR 2020] Local-Global Video-Text Interactions for Temporal Grounding

안녕하세요. 이번 주차 X-Review의 주제는 지난 세미나 때 말씀드렸듯, 제가 관심갖고 살펴보려한 task인 Temporal Sentence Grounding in Videos(TSGV)의 초창기 방법론입니다. 2020년도 CVPR에 게재되었으며, 서울대 한보형…

Continue Reading
Posted in B.S. X-Diary

2023년을 보내면서 – 김현우

안녕하세요. 이번 글은 작년 한 해 제 연구실 생활을 되돌아보고, 돌아오는 2024년에는 어떠한 연구 계획을 가지고 있는지 담아보도록 하겠습니다. 물론 저 스스로 해마다 성장하고 있는지,…

Continue Reading
Posted in Paper X-Review

[ICCV 2023] UATVR: Uncertainty-Adaptive Text-Video Retrieval

이번 주차 X-Review는 23년도 ICCV에 게재된 <UATVR: Uncertainty-Adaptive Text-Video Retrieval>이라는 논문입니다. 중국 바이두에서 연구된 논문이네요. Text-Video Retrieval(이하 TVR)이라는 task는 비디오와 text 두 모달 간 공통의…

Continue Reading
Posted in Paper X-Review

[arXiv 2022] Unsupervised Prompt Learning for Vision-Language Models

안녕하세요, 이번 주차 X-Review는 22년도 arXiv에 올라온 <Unsupervised Prompt Learning for Vision-Language Models>라는 논문입니다. 해당 논문은 Image Classification 문제를 다루며, 다른 dataset으로의 transfer 시 CLIP의…

Continue Reading