Author: 김 현우
[ICCV 2023] Verbs in Action: Improving Verb Understanding in Video-Language Models
제가 현재 연구주제로 잡은 task인 Moment Retrieval은 사용자의 텍스트 쿼리를 입력받아 길고 다양한 컨텐츠를 포함하고 있는 untrimmed video 내에서 상응하는 구간을 찾아내는 것이 목적입니다. 처음에는…
[AAAI 2024] Towards Balanced Alignment: Modal-Enhanced Semantic Modeling for Video Moment Retrieval
안녕하세요. 이번 주 X-Review에서 소개해드릴 논문은 24년도 AAAI에 게재된 <Towards Balanced Alignment: Modal-Enhanced Semantic Modeling for Video Moment Retrieval> 입니다. 본 논문은 제가 요즘 관심갖고…
2024년 상반기 회고
안녕하세요. 오늘은 벌써 모두 지나가버린 2024년도 상반기 회고록을 작성해보겠습니다. 올해 상반기가 모두 지남에 따라 저는 석사 1학기를 보내었고 어느덧 연구실 만 2년 반차가 되었습니다. 말…
[CVPR 2024] Task-Driven Exploration: Decoupling and Inter-Task Feedback for Joint Moment Retrieval and Highlight Detection
안녕하세요. 오늘의 X-Review에서 소개해드릴 논문은 2024년도 CVPR에 게재된 <Task-Driven Exploration: Decoupling and Inter-Task Feedback for Joint Moment Retrieval and Highlight Detection> 입니다. 우선 본 논문은…
[AAAI 2024] TR-DETR: Task-Reciprocal Transformer for Joint Moment Retrieval and Highlight Detection
안녕하세요. 오늘의 X-Review는 24년도 AAAI에 게재된 <TR-DETR: Task-Reciprocal Transformer for Joint Moment Retrieval and Highlight Detection> 논문입니다. 비디오 도메인에서 Moment Retrieval과 Highlight Detection task를 동시에…
보호된 글: [MM 2024 (Under Review)] Enhancing …
보호하고 있는 글이라서 요약이 없습니다.
[arXiv 2024] Correlation-guided Query-Dependency Calibration in Video Representation Learning for Temporal Grounding
안녕하세요. 이번 X-Review에서 소개해드릴 논문은 제가 이전에 작성했던 리뷰 QD-DETR의 후속 연구 논문 CG-DETR입니다. QD-DETR과 동일한 성균관대 한국인 박사님의 연구이며, ECCV에 제출한 뒤 이제 리비전을…
[ACM MM 2023] MH-DETR: Video Moment and Highlight Detection with Cross-modal Transformer
안녕하세요, 이번 X-Review에선 23년도 MM 학회에 게재된 MH-DETR이라는 논문을 소개해드리고자 합니다. 기본적으로 저번 리뷰에서도 설명드렸던 Moment Retrieval (MR)과 Highlight Detection (HD)를 동시에 수행하는 방법론 중…
[CVPR 2023] Query-Dependent Video Representation for Moment Retrieval and Highlight Detection
안녕하세요. 이번 주 X-Review에서는 23년도 CVPR에 게재된 <Query-Dependent Video Representation for Moment Retrieval and Highlight Detection>이라는 논문을 소개해드리겠습다. 성균관대 허재필 교수님 연구실에서 나온 논문이며, 해당…
[ECCV 2022] Simple Open-Vocabulary Object Detection with Vision Transformers
안녕하세요, 오늘의 X-Review는 22년도 ECCV에 게재된 Open-Vocabulary Object Detection (OVOD) 관련 논문입니다. 구글에서 진행된 연구네요. CLIP과 유사한 방식으로 영상과 텍스트 간 거대 사전학습을 수행한 후…
최신 댓글