[INTERSPEECH 2024]SELM: Enhancing Speech Emotion Recognition for Out-of-Domain Scenarios
Introduction Speech Emotion Recognition은 사람의 음성이 나타내는 감정을 인식하는 task입니다. 사람은 일반적으로 음성 대화 과정에서 다양한 감정을 표현하고 있기 때문에, 대화의 맥락을 이해하고 적절히 반응하기…
[ECCV 2024] OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation
안녕하세요, 마흔 세번째 x-review 입니다. 이번 논문은 2024년도 ECCV에 게재된 OV-Uni3DETR: Towards Unified Open-Vocabulary 3D Object Detection via Cycle-Modality Propagation 입니다. 23년도에 처음으로 3D detection에서…
[Neurocomputing 2024] OV-VG: A Benchmark for Open-Vocabulary Visual Grounding
안녕하세요. 금주 kccv 세미나에서 “현대 사회에서 비록 산업 분야로 나아가든 혹은 그렇지 않든, 우리의 연구에 대해 ‘돈이 될 수 있는지’ 즉, 비즈니스 모델을 상정함 또한…
[ICLR 2024] VISION TRANSFORMERS NEED REGISTERS
이번 논문은 Vision Transformers 기반 large model의 특징 표현력을 향상시키기 위해 원인을 찾아 분석하고 이에 대한 해결책을 제시한 논문입니다. 해당 기법에 주목하게 된 계기는 Vision…
[ICLR 2022] Open-Vocabulary Object Detection via Vision and Language Knowledge Distillation
오늘 가져온 논문은 Open-Vocabulary Object Detection 분야의 논문입니다. 일반적인 Detection 모델과는 달리, 임의로 주어지는 text input 에 해당하는 object를 이미지 내에서 찾는 task 이죠.현존하는 Object…
[arXiv 2024] UniMEEC: Towards Unified Multimodal Emotion Recognition and Emotion Cause
pdf 안녕하세요. 오늘 가져온 논문은 MER(Multimodal Emotion Recognition)을 팔로업 하는 사람들이면 알법한 논문인 UniMSE의 저자의 후속 논문입니다. UniMSE가 2022년도 논문인데 최근 논문을 보니 계속해서 affecting…
KCCV 2024 참관기
안녕하세요, 정의철 연구원입니다. 2024년 8월에 부산 BEXCO에서 열린 KCCV 2024에 다녀올 수 있는 기회를 얻게 되어, 이렇게 참관 후기를 작성하게 되었습니다. 이번 KCCV 2024에서는 여러…
[CVPR 2022] Entropy-based Active Learning for Object Detection with Progressive Diversity Constraint
오랜만에 Object Detection을 위한 Active Learning 논문을 리뷰해보겠습니다. Multi-class가 존재하는 object detection 태스크에서, 보다 정확하고 균일한 데이터셋을 선택하는 방식을 제안한 연구입니다. Conference: CVPR 2022 Title:…
KCCV2024 참관기
안녕하세요. 박성준 연구원입니다. 이번에 KCCV2024를 다녀오게 되어 참관기를 남기게 되었습니다. KCCV2024를 준비하며 연구실에서 KCCV2024를 참관하는 것이 확정되며 설레는(?) 마음으로 KCCV2024에 대해 알아보기 시작했습니다. 다들 아시겠지만…
[CVPR2022] Grounded Language-Image Pre-training(GLIP)
안녕하세요. 오늘 소개 시켜드릴 논문은 Grounded Language-Image Pre-training이란 논문으로 VLM분야의 foundation모델로 GLIP이란 모델과 학습법을 제안한 논문이 되겠습니다. 해당 논문을 읽게 된 이유는 센서과제에서 학습 때…
1. CTC 기반의 텍스트 인식 모델의 학습 과정에 대해 설명을 드리면 대답이 될 것 같네요! 입력된 텍스트 이미지[H x W…