Author: 김 현우
[ECCV 2022] Zero-Shot Temporal Action Detection via Vision-Language Prompting
오늘의 X-Review에서는 Zero-shot 기반으로 Temporal Action Localization을 수행하기 위해 CLIP을 활용한 논문에 대해 소개해드리겠습니다. 22년도 ECCV에 게재되었습니다. 1. Introduction 22년도는 그 당시 CLIP의 등장으로 다양한…
[MDPI Applied Science 2024] VTG-GPT: Tuning-Free Zero-Shot Video Temporal Grounding with GPT
안녕하세요. 오늘의 X-Review에서는 GPT 등의 LLM을 활용해 Temporal Sentence Grounding in Video(TSGV) task를 수행하는 논문을 소개해드리겠습니다. 해당 논문은 중국 대학교에서 연구되었으며 24년도 MDPI Applied Science…
AAAI-24 학회 참관기
안녕하세요, 오늘은 저번 주 다녀왔던 2024년도 AAAI 학회 참관기를 작성해보겠습니다. 우선 저희 팀은 이번 AAAI에 <VVS: Video-to-Video Retrieval with Irrelevant Frame Suppression> 논문이 accept되어 참석하게…
[AAAI 2023] Phrase-level Relationship Mining for Temporal Sentence Localization
오늘의 X-Review 또한 Temporal Sentence Grounding in Videos(TSGV) task 방법론으로 가져왔습니다. 23년도 AAAI에 게재되었으며 중국 북경대의 연구 결과입니다. 최근 연구실 전체적으로 제안서 작업이 한창인데요, 저희…
[CVPR 2023] You Can Ground Earlier than See: An Effective and Efficient Pipeline for Temporal Sentence Grounding in Compressed Videos
안녕하세요. 이번 주 X-Review는 23년도 CVPR에 게재된 <You Can Ground Earlier than See: An Effective and Efficient Pipeline for Temporal Sentence Grounding in Compressed Videos>입니다….
[CVPR 2023] Text-Visual Prompting for Efficient 2D Temporal Video Grounding
이번 주차 X-Review 또한 Temporal Sentence Grounding in Videos(TSGV) 관련 논문입니다. 본 논문은 23년도 CVPR에 게재되었으며, 20, 21년도 근처의 초창기 방법론들을 익히던 와중 23년도 CVPR에…
[CVPR 2020] Local-Global Video-Text Interactions for Temporal Grounding
안녕하세요. 이번 주차 X-Review의 주제는 지난 세미나 때 말씀드렸듯, 제가 관심갖고 살펴보려한 task인 Temporal Sentence Grounding in Videos(TSGV)의 초창기 방법론입니다. 2020년도 CVPR에 게재되었으며, 서울대 한보형…
2023년을 보내면서 – 김현우
안녕하세요. 이번 글은 작년 한 해 제 연구실 생활을 되돌아보고, 돌아오는 2024년에는 어떠한 연구 계획을 가지고 있는지 담아보도록 하겠습니다. 물론 저 스스로 해마다 성장하고 있는지,…
[ICCV 2023] UATVR: Uncertainty-Adaptive Text-Video Retrieval
이번 주차 X-Review는 23년도 ICCV에 게재된 <UATVR: Uncertainty-Adaptive Text-Video Retrieval>이라는 논문입니다. 중국 바이두에서 연구된 논문이네요. Text-Video Retrieval(이하 TVR)이라는 task는 비디오와 text 두 모달 간 공통의…
[arXiv 2022] Unsupervised Prompt Learning for Vision-Language Models
안녕하세요, 이번 주차 X-Review는 22년도 arXiv에 올라온 <Unsupervised Prompt Learning for Vision-Language Models>라는 논문입니다. 해당 논문은 Image Classification 문제를 다루며, 다른 dataset으로의 transfer 시 CLIP의…
최신 댓글