[IEEE Trans Affect Comput 2022] Multitask Learning From Augmented Auxiliary Data for Improving Speech Emotion Recognition
Introduction Speech Emotion Recognition (SER)은 인간-컴퓨터 상호작용을 새롭게 정의하는 중요한 연구 분야입니다. 이 기술은 고객 서비스, 의료, 교육, 운송, 포렌식, 미디어 등 다양한 분야에서 매우…
[RA-L 2022] Learning Open-World Object Proposals Without Learning to Classify
안녕하세요. 이번 리뷰는 Open-world(Open-set)에 대한 Localization을 위주로 삼은 논문을 들고 왔습니다. 이미 예전에 리뷰한, 그리고 이번 주차 세미나에서 소개드린 GOOD: Exploring Geometric Cues for Detecting…
[CVPR 2024]Instance-Adaptive and Geometric-Aware Keypoint Learning for Category-Level 6D Object Pose Estimation
제가 이번에 리뷰할 논문은 Category-level의 6D Pose Estimation논문으로, Category-level의 방법론에서 Instance-Adaptive하게 keypoint를 예측하는 방식이라 하여 궁금해서 리뷰하게 되었습니다. Abstract Category-level의 6D Pose Estimation은 특정 카테고리…
[CVPR 2024] Task-Driven Exploration: Decoupling and Inter-Task Feedback for Joint Moment Retrieval and Highlight Detection
안녕하세요. 오늘의 X-Review에서 소개해드릴 논문은 2024년도 CVPR에 게재된 <Task-Driven Exploration: Decoupling and Inter-Task Feedback for Joint Moment Retrieval and Highlight Detection> 입니다. 우선 본 논문은…
[ICCV 2023] Knowing Where to Focus: Event-aware Transformer for Video Grounding
Preliminary 하나의 비디오에서 다양한 콘텐츠를 가지고 있는 Untrimmed Video를 분석 하기 위해 다양한 연구들이 진행 되었는데, 오늘은 [2022 CVPR] UBoCo : Unsupervised Boundary Contrastive Learning…
[RAL 2022]TransDSSL: Transformer Based Depth Estimation via Self-Supervised Learning
안녕하세요! 조현석연구원 입니다. 오늘 소개시켜드릴 논문은 신입 교육기간 동안 다룬 Self-Supervised Monocular Depth Estimation Task의 마지막 일정인 TransDSSL입니다. 본 논문은 RAL 2022년에 게재된 것으로 저희…
[CVPR 2024 Spotlight] LangSplat: 3D Language Gaussian Splatting
이번 리뷰 논문은 LangSplat이라는 3D Language Fields (3DLF) 분야의 기법 중 3D Gaussian Splatting (3DGS)을 적용한 방식을 처음 제안한 논문입니다. 3DLF라는 분야도, 3DGS라는 분야도 많이…
[NIPS2023]MomentDiff: Generative Video Moment Retrieval from Random to Real
안녕하세요. 오늘 리뷰할 논문은 디퓨전을 사용해 Moment Retrieval을 다룬 MomentDiff 논문입니다. Abstract 비디오 Moment Retrieval은 주어진 텍스트 설명에 해당하는 특정 구간을 비디오 영상으로부터 식별하기 위한…
[RA-L 2022] TransDSSL: Transformer Based Depth Estimation via Self-Supervised Learning
안녕하세요 이재찬 연구원입니다. 이번 주에 다뤄 볼 논문도 Self-supervised monocular depth estimation 분야의 논문입니다. 이번 학기 기초교육의 마지막 논문이 되겠습니다. 해당 논문은 저와 조현석 연구원의…
[NeurIPS 2023] Scale-Space Hypernetworks for Efficient Biomedical Imaging
안녕하세요, 서른여섯 번째 X-Review입니다. 이번 논문은 2023년도 NeurIPS에 게재된 Scale-Space Hypernetworks for Efficient Biomedical Imaging입니다. 논문제목도 그렇고 본문에서도 medical이라는 단어가 많이 나오는 것을 보아 의학쪽…
안녕하세요 질문 남겨주셔서 감사합니다 논문에서는 CTR 데이터에 대한 결과와 비교하면서 STR의 경우 이미지 내 텍스트가 갖는 특징 자체가 보다 덜…