Author: 김 현우

Posted in Paper X-Review

[AAAI 2023] Phrase-level Relationship Mining for Temporal Sentence Localization

오늘의 X-Review 또한 Temporal Sentence Grounding in Videos(TSGV) task 방법론으로 가져왔습니다. 23년도 AAAI에 게재되었으며 중국 북경대의 연구 결과입니다. 최근 연구실 전체적으로 제안서 작업이 한창인데요, 저희…

Continue Reading
Posted in Paper X-Review

[CVPR 2023] You Can Ground Earlier than See: An Effective and Efficient Pipeline for Temporal Sentence Grounding in Compressed Videos

안녕하세요. 이번 주 X-Review는 23년도 CVPR에 게재된 <You Can Ground Earlier than See: An Effective and Efficient Pipeline for Temporal Sentence Grounding in Compressed Videos>입니다….

Continue Reading
Posted in Paper X-Review

[CVPR 2023] Text-Visual Prompting for Efficient 2D Temporal Video Grounding

이번 주차 X-Review 또한 Temporal Sentence Grounding in Videos(TSGV) 관련 논문입니다. 본 논문은 23년도 CVPR에 게재되었으며, 20, 21년도 근처의 초창기 방법론들을 익히던 와중 23년도 CVPR에…

Continue Reading
Posted in Paper X-Review

[CVPR 2020] Local-Global Video-Text Interactions for Temporal Grounding

안녕하세요. 이번 주차 X-Review의 주제는 지난 세미나 때 말씀드렸듯, 제가 관심갖고 살펴보려한 task인 Temporal Sentence Grounding in Videos(TSGV)의 초창기 방법론입니다. 2020년도 CVPR에 게재되었으며, 서울대 한보형…

Continue Reading
Posted in B.S. X-Diary

2023년을 보내면서 – 김현우

안녕하세요. 이번 글은 작년 한 해 제 연구실 생활을 되돌아보고, 돌아오는 2024년에는 어떠한 연구 계획을 가지고 있는지 담아보도록 하겠습니다. 물론 저 스스로 해마다 성장하고 있는지,…

Continue Reading
Posted in Paper X-Review

[ICCV 2023] UATVR: Uncertainty-Adaptive Text-Video Retrieval

이번 주차 X-Review는 23년도 ICCV에 게재된 <UATVR: Uncertainty-Adaptive Text-Video Retrieval>이라는 논문입니다. 중국 바이두에서 연구된 논문이네요. Text-Video Retrieval(이하 TVR)이라는 task는 비디오와 text 두 모달 간 공통의…

Continue Reading
Posted in Paper X-Review

[arXiv 2022] Unsupervised Prompt Learning for Vision-Language Models

안녕하세요, 이번 주차 X-Review는 22년도 arXiv에 올라온 <Unsupervised Prompt Learning for Vision-Language Models>라는 논문입니다. 해당 논문은 Image Classification 문제를 다루며, 다른 dataset으로의 transfer 시 CLIP의…

Continue Reading
Posted in X-Review

[CVPR 2022] Probabilistic Representations for Video Contrastive Learning

안녕하세요, 이번 X-Review는 직전 세미나에서 소개해드렸던 22년도 CVPR 논문 <Probabilistic Representations for Video Contrastive Learning>을 주제로 준비하였습니다. 사실 세미나라는 것이 짧은 시간 내 방법론의 배경과…

Continue Reading
Posted in Paper X-Review

[CVPR 2023] Fine-Tuned CLIP Models are Efficient Video Learners

안녕하세요. 오늘 소개해드릴 논문은 최근 유행하는 형태의 제목을 가지고 있는 23년도 CVPR 논문, <Fine-Tuned CLIP Models are Efficient Video Learners>입니다. 최근 Action Localization에 CLIP representation을…

Continue Reading
Posted in Paper X-Review

[IJCV 2022] Learning to Prompt for Vision-Language Models

안녕하세요. 이번 주 X-Review에서 소개해드릴 논문의 제목은 <Learning to Prompt for Vision-Language Models>입니다. 22년도 IJCV에 게재되었고, NLP 분야의 학습 기반 prompt learning 방법론을 영상 분야에…

Continue Reading