[일:] 2024년 08월 25일

Posted in X-Review

[arXiv 2024]WorldAfford: Affordance Grounding based on Natural Language Instructions

제가 이번에 리뷰할 논문도 affordance grounding분야의 논문입니다. 제가 이전에 리뷰했던 Affordance Grounding 관련 논문들은 action이나 대상 object에 대해 단순한 방식이나 정해진 템플릿으로 입력하여 그에 해당하는…

Continue Reading
Posted in Paper X-Review

[ECCV 2024] BAM-DETR: Boundary-Aligned Moment Detection Transformer for Temporal Sentence Grounding in Videos

안녕하세요. 이번주 X-Review는 오랜만에 다시 비디오의 Moment Retrieval task 논문으로 돌아왔습니다. 소개해드릴 BAM-DETR이라는 논문은, 보통 Moment Retrieval과 Highlight Detection이라는 2가지 task를 동시에 수행하는 DETR 기반의…

Continue Reading
Posted in X-Review

[INTERSPEECH 2024]SELM: Enhancing Speech Emotion Recognition for Out-of-Domain Scenarios

Introduction Speech Emotion Recognition은 사람의 음성이 나타내는 감정을 인식하는 task입니다. 사람은 일반적으로 음성 대화 과정에서 다양한 감정을 표현하고 있기 때문에, 대화의 맥락을 이해하고 적절히 반응하기…

Continue Reading
Posted in Paper X-Review

[ECCV 2024] OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation

안녕하세요, 마흔 세번째 x-review 입니다. 이번 논문은 2024년도 ECCV에 게재된 OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation 입니다. 23년도에 처음으로 3D detection에서…

Continue Reading
Posted in X-Review

[Neurocomputing 2024] OV-VG: A Benchmark for Open-Vocabulary Visual Grounding

안녕하세요. 금주 kccv 세미나에서 “현대 사회에서 비록 산업 분야로 나아가든 혹은 그렇지 않든, 우리의 연구에 대해 ‘돈이 될 수 있는지’ 즉, 비즈니스 모델을 상정함 또한…

Continue Reading
Posted in Conference Paper X-Review

[ICML 2024] VISION TRANSFORMERS NEED REGISTERS

이번 논문은 Vision Transformers 기반 large model의 특징 표현력을 향상시키기 위해 원인을 찾아 분석하고 이에 대한 해결책을 제시한 논문입니다. 해당 기법에 주목하게 된 계기는 Vision…

Continue Reading
Posted in Paper X-Review

[ICLR 2022] Open-Vocabulary Object Detection via Vision and Language Knowledge Distillation

오늘 가져온 논문은 Open-Vocabulary Object Detection 분야의 논문입니다. 일반적인 Detection 모델과는 달리, 임의로 주어지는 text input 에 해당하는 object를 이미지 내에서 찾는 task 이죠.현존하는 Object…

Continue Reading
Posted in Paper X-Review

[arXiv 2024] UniMEEC: Towards Unified Multimodal Emotion Recognition and Emotion Cause

pdf 안녕하세요. 오늘 가져온 논문은 MER(Multimodal Emotion Recognition)을 팔로업 하는 사람들이면 알법한 논문인 UniMSE의 저자의 후속 논문입니다. UniMSE가 2022년도 논문인데 최근 논문을 보니 계속해서 affecting…

Continue Reading