[일:] 2024년 11월 18일
Posted in X-Review
[ECCCV2024] Uncertainty-Aware Sign Language Vido Retrieval with Probability Distribution Modeling
박 성준 11/18/2024 Leave a Comment on [ECCCV2024] Uncertainty-Aware Sign Language Vido Retrieval with Probability Distribution Modeling
안녕하세요 박성준 연구원입니다. 제가 오늘 리뷰할 논문은 조금은 생소할 수 있는 task인 Sign Language(수화) Video Retrieval를 다룬 논문입니다. Introduction Sign Language Video Retrieval은 두가지의 목표를…
[CVPR 2024] VicTR: Video-conditioned Text Representation for Activity Recognition
김 현우 11/18/2024 Leave a Comment on [CVPR 2024] VicTR: Video-conditioned Text Representation for Activity Recognition
안녕하세요, 이번 주 X-Review에서는 24년도 CVPR에 게재된 논문 <VicTR: Video-conditioned Text Representation for Activity Recognition>을 소개해드리겠습니다. 잘 편집되어있는, 즉 하나의 비디오에서는 하나의 action만 등장하는 trimmed…
[EMNLP 2023] ROME: Evaluating Pre-trained Vision-Language Models on Reasoning beyond Visual Common Sense
정 의철 11/18/2024 Leave a Comment on [EMNLP 2023] ROME: Evaluating Pre-trained Vision-Language Models on Reasoning beyond Visual Common Sense
안녕하세요 이번에 소개할 논문은 사전 학습된 비전-언어 모델(VLMs)이 단순한 시각적 상식을 넘어선 복잡한 추론 능력을 평가하기 위해 새로운 데이터셋인 ROME과 평가 프레임워크를 제안한 논문입니다. 연구의…
최신 댓글