X-Review – Page 62 – Robotics and Computer Vision Lab

[CVPR 2024 Spotlight] LangSplat: 3D Language Gaussian Splatting

이번 리뷰 논문은 LangSplat이라는 3D Language Fields (3DLF) 분야의 기법 중 3D Gaussian Splatting (3DGS)을 적용한 방식을 처음 제안한 논문입니다. 3DLF라는 분야도, 3DGS라는 분야도 많이…

X-Review

[NIPS2023]MomentDiff: Generative Video Moment Retrieval from Random to Real

안녕하세요. 오늘 리뷰할 논문은 디퓨전을 사용해 Moment Retrieval을 다룬 MomentDiff 논문입니다. Abstract 비디오 Moment Retrieval은 주어진 텍스트 설명에 해당하는 특정 구간을 비디오 영상으로부터 식별하기 위한…

X-Review

[RA-L 2022] TransDSSL: Transformer Based Depth Estimation via Self-Supervised Learning

안녕하세요 이재찬 연구원입니다. 이번 주에 다뤄 볼 논문도 Self-supervised monocular depth estimation 분야의 논문입니다. 이번 학기 기초교육의 마지막 논문이 되겠습니다. 해당 논문은 저와 조현석 연구원의…

Paper X-Review

[NeurIPS 2023] Scale-Space Hypernetworks for Efficient Biomedical Imaging

안녕하세요, 서른여섯 번째 X-Review입니다. 이번 논문은 2023년도 NeurIPS에 게재된 Scale-Space Hypernetworks for Efficient Biomedical Imaging입니다. 논문제목도 그렇고 본문에서도 medical이라는 단어가 많이 나오는 것을 보아 의학쪽…

X-Review

[ICASSP 2024] Improving Speech Emotion Recognition with Unsupervised Speaking Style Transfer

Introduction Speech Emotion Recognition(SER)이란 인간의 음성에서 감정을 인식하는 것을 의미합니다. 논문에서는 라벨링된 감정 데이터셋이 부족하여 SER 연구에 제악이 존재한다고 언급하고 있습니다. 또한 수집되는 대부분의 음성…

Conference X-Review

[CVPR 2024]One-Shot Open Affordance Learning with Foundation Models

제가 이번에 리뷰할 논문은 제안서와 관련하여 논문을 서베이하면서 보게 된 논문입니다. Affordance segmentation이라고해서 물체에서 기능(Grasp/Cut/Scoop/Contain/Pound/Support/Wrap-Grasp 등 데이터에 따라 세부 분류가 조금씩 달라지는 것으로 보입니다)에 따라…

News Paper X-Review

[CVPR 2023]Multispectral Contrastive Learning with Viewmaker Networks

안녕하세요 이번에 제가 소개할 논문은 ‘Multispectral Contrastive Learning with Viewmaker Networks’이란 논문입니다. 이 논문은 항공 위성으로 얻은 다양한 Multispectral 이미지를 Contrastive Learning에 적용시킬 수 있는…

Paper X-Review

[NeurIPS 2023] Bridging the Domain Gap: Self-Supervised 3D Scene Understanding with Foundation Models

안녕하세요, 서른 다섯번째 x-review 입니다. 이번 논문은 2023년도 NeurIPS에 게재된 Bridging the Domain Gap: Self-Supervised 3D Scene Understanding with Foundation Models 입니다. 그럼 바로 리뷰…

X-Review

[CVPR 2022] Target-Relevant Knowledge Preservation for Multi-Source Domain Adaptive Object Detection

안녕하세요. 지난 2번의 리뷰 간 MSDA OD, Mulit-Source Domain Adaptation for Object Detection 논문을 리뷰하였습니다. 맨 처음 리뷰한 논문은 DMSN으로 DAOD, Domain Adpataion for Object…

Paper X-Review

[NeurIPS 2020] Unsupervised Learning of Visual Features by Contrasting Cluster Assignments

안녕하세요. 허재연입니다. 한동안 계속 Self-Supervised Learning쪽 논문을 읽고 있습니다. 이번에 다룰 논문도 image data의 visual feature를 어떻게 unsupervised방법으로 학습할 지를 다룬 visual representation learning 분야…

Category: X-Review

[CVPR 2024 Spotlight] LangSplat: 3D Language Gaussian Splatting

[NIPS2023]MomentDiff: Generative Video Moment Retrieval from Random to Real

[RA-L 2022] TransDSSL: Transformer Based Depth Estimation via Self-Supervised Learning

[NeurIPS 2023] Scale-Space Hypernetworks for Efficient Biomedical Imaging

[ICASSP 2024] Improving Speech Emotion Recognition with Unsupervised Speaking Style Transfer

[CVPR 2024]One-Shot Open Affordance Learning with Foundation Models

[CVPR 2023]Multispectral Contrastive Learning with Viewmaker Networks

[NeurIPS 2023] Bridging the Domain Gap: Self-Supervised 3D Scene Understanding with Foundation Models

[CVPR 2022] Target-Relevant Knowledge Preservation for Multi-Source Domain Adaptive Object Detection

[NeurIPS 2020] Unsupervised Learning of Visual Features by Contrasting Cluster Assignments

Conference Deadline

NEW POST

New Comment