[ICASSP 2024] Improving Speech Emotion Recognition with Unsupervised Speaking Style Transfer
Introduction Speech Emotion Recognition(SER)이란 인간의 음성에서 감정을 인식하는 것을 의미합니다. 논문에서는 라벨링된 감정 데이터셋이 부족하여 SER 연구에 제악이 존재한다고 언급하고 있습니다. 또한 수집되는 대부분의 음성…
[CVPR 2024]One-Shot Open Affordance Learning with Foundation Models
제가 이번에 리뷰할 논문은 제안서와 관련하여 논문을 서베이하면서 보게 된 논문입니다. Affordance segmentation이라고해서 물체에서 기능(Grasp/Cut/Scoop/Contain/Pound/Support/Wrap-Grasp 등 데이터에 따라 세부 분류가 조금씩 달라지는 것으로 보입니다)에 따라…
[CVPR 2023]Multispectral Contrastive Learning with Viewmaker Networks
안녕하세요 이번에 제가 소개할 논문은 ‘Multispectral Contrastive Learning with Viewmaker Networks’이란 논문입니다. 이 논문은 항공 위성으로 얻은 다양한 Multispectral 이미지를 Contrastive Learning에 적용시킬 수 있는…
[NeurIPS 2023] Bridging the Domain Gap: Self-Supervised 3D Scene Understanding with Foundation Models
안녕하세요, 서른 다섯번째 x-review 입니다. 이번 논문은 2023년도 NeurIPS에 게재된 Bridging the Domain Gap: Self-Supervised 3D Scene Understanding with Foundation Models 입니다. 그럼 바로 리뷰…
[CVPR 2022] Target-Relevant Knowledge Preservation for Multi-Source Domain Adaptive Object Detection
안녕하세요. 지난 2번의 리뷰 간 MSDA OD, Mulit-Source Domain Adaptation for Object Detection 논문을 리뷰하였습니다. 맨 처음 리뷰한 논문은 DMSN으로 DAOD, Domain Adpataion for Object…
[NeurIPS 2020] Unsupervised Learning of Visual Features by Contrasting Cluster Assignments
안녕하세요. 허재연입니다. 한동안 계속 Self-Supervised Learning쪽 논문을 읽고 있습니다. 이번에 다룰 논문도 image data의 visual feature를 어떻게 unsupervised방법으로 학습할 지를 다룬 visual representation learning 분야…
[arXiv 2024] PS6D: Point Cloud Based Symmetry-Aware 6D Object Pose Estimation in Robot Bin-Picking
안녕하세요, 이번에는 instance-level에 속하는 6D pose estimation 관련 논문을 읽어보았습니다. 기존 리뷰 했던 내용들은 주로 RGB/RGB-D를 사용하는 방법론이었는데, PS6D 같은 경우는 포인트 클라우드만을 입력으로 사용하여…
[AAAI 2024] TR-DETR: Task-Reciprocal Transformer for Joint Moment Retrieval and Highlight Detection
안녕하세요. 오늘의 X-Review는 24년도 AAAI에 게재된 <TR-DETR: Task-Reciprocal Transformer for Joint Moment Retrieval and Highlight Detection> 논문입니다. 비디오 도메인에서 Moment Retrieval과 Highlight Detection task를 동시에…
[CVPR 2022] Active Learning by Feature Mixing
황유진 연구원과 제출한 논문에서 받은 리뷰 중, 해당 논문에 대해서도 성능 비교 실험에 추가해달라는 코멘트가 있었습니다. 이에 제가 작성한 리뷰를 살펴보니, 해당 논문을 자세하게 리뷰한…
[CVPR 2024] OneLLM: One Framework to Align All Modalities with Language
안녕하세요. 최근에 계속해서 LLM 관련으로 논문을 읽게 되는 것 같습니다. LLM 논문을 볼 때마다 아쉬웠던 점이, 멀티모달 LLM 관련하여 vision-text 분야 LLM은 굉장히 논문이 많이…
안녕하세요 질문 남겨주셔서 감사합니다 논문에서는 CTR 데이터에 대한 결과와 비교하면서 STR의 경우 이미지 내 텍스트가 갖는 특징 자체가 보다 덜…