X-Review – Page 60 – Robotics and Computer Vision Lab

[arXiv 2024] Zero123-6D: Zero-shot Novel View Synthesis for RGB Category-level 6D Pose Estimation

안녕하세요, 이번에는 6D pose estimation 테스크 중 category-level object pose estimation 관련 논문을 읽어보았습니다. 이번 Zero123-6D는 제목이 좀 특이 하긴 하네요. 이름을 왜 저렇게 지었는지는…

Paper X-Review

[ICCV 2023] Shape Anchor Guided Holistic Indoor Scene Understanding

안녕하세요, 서른 일곱번째 x-review 입니다. 이번 논문은 2023년도 ICCV에 게재된 Shape Anchor Guided Holistic Indoor Scene Understanding 입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction…

Paper X-Review

[SIGGRAPH 2023] 3D Gaussian Splatting for Real-Time Radiance Field Rendering

이번 리뷰는 NeRF를 이어 Novel View Synthesis 분야에 큰 획을 그은 3D Gaussian Splatting (3DGS)에 대해서 다루고자 합니다. Intro 3차원 공간을 표현하는 가장 대표적인 방법인…

X-Review

[CVPR 2024] Active Prompt Learning in Vision Language Models

Active Learning 과 Vision Language Model을 결합한 연구가 있어 리뷰해보도록 하겠습니다. 결국 Active Learning에도 CLIP을 결합한 연구가 등장하였네요. 사실 올 초 신진연구 제안서 작업을 할…

Paper X-Review

[Sensors 2021] R-CenterNet+: Anchor-Free Detector for Ship Detection in SAR Images

안녕하세요, 서른일곱 번째 X-Review입니다. 이번 논문은 2021년도 Sensors에 게재된 R-CenterNet+: Anchor-Free Detector for Ship Detection in SAR Images입니다. 바로 시작하도록 하겠습니다. ? 1. Introduction Synthetic…

Paper X-Review

[CVPR 2024] EGTR : Extracting Graph from Transformer for Scene Graph Generation

이번 리뷰는 Scene Graph Generation 관련 논문이지만, Closed-Set 이고 Fully Supervised 세팅에서의 연구 입니다. Best paper award candidate로 선정된 논문이라 제가 관심 있는 Open-Vocabulary는 아니지만…

Paper X-Review

[CVPR 2023] Open-Vocabulary Point-Cloud Object Detection without 3D Annotation

안녕하세요, 서른 여섯번째 x-review 입니다. 이번 논문은 2023년도 CVPR에 게재된 Open-Vocabulary Point-Cloud Object Detection without 3D Annotation 입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction…

Paper X-Review

[ICASSP 2024] Improving Multi-Modal Emotion Recognition Using Entropy-Based Fusion and Pruning-Based Network Architecture Optimization

안녕하세요. 이번 논문도 감정인식 논문인데 제가 읽어왔던 논문과는 조금 다른 결을 가집니다. Entropy-based Fusion이라는 것이 흥미를 끌어 읽게 되었습니다. Pruning도 사용하니 최적화 관련하여 관심이 있으신…

Paper X-Review

[IROS 2023] HANDAL: A Dataset of Real-World Manipulable Object Categories with Pose Annotations, Affordances, and Reconstructions

안녕하세요, 이번에는 Bop Challenge에서 새롭게 추가된 HANDAL을 읽어보았습니다. NVIDIA는 데이터셋도 참 잘 만드네요.. 데이터를 취득하는 과정 중에 애플 제품으로 무언가를 하는 게 좀 특이하네요. 자세한 방법은…

X-Review

[IEEE Trans Affect Comput 2022] Multitask Learning From Augmented Auxiliary Data for Improving Speech Emotion Recognition

Introduction Speech Emotion Recognition (SER)은 인간-컴퓨터 상호작용을 새롭게 정의하는 중요한 연구 분야입니다. 이 기술은 고객 서비스, 의료, 교육, 운송, 포렌식, 미디어 등 다양한 분야에서 매우…

Category: X-Review

[arXiv 2024] Zero123-6D: Zero-shot Novel View Synthesis for RGB Category-level 6D Pose Estimation

[ICCV 2023] Shape Anchor Guided Holistic Indoor Scene Understanding

[SIGGRAPH 2023] 3D Gaussian Splatting for Real-Time Radiance Field Rendering

[CVPR 2024] Active Prompt Learning in Vision Language Models

[Sensors 2021] R-CenterNet+: Anchor-Free Detector for Ship Detection in SAR Images

[CVPR 2024] EGTR : Extracting Graph from Transformer for Scene Graph Generation

[CVPR 2023] Open-Vocabulary Point-Cloud Object Detection without 3D Annotation

[ICASSP 2024] Improving Multi-Modal Emotion Recognition Using Entropy-Based Fusion and Pruning-Based Network Architecture Optimization

[IROS 2023] HANDAL: A Dataset of Real-World Manipulable Object Categories with Pose Annotations, Affordances, and Reconstructions

[IEEE Trans Affect Comput 2022] Multitask Learning From Augmented Auxiliary Data for Improving Speech Emotion Recognition

Conference Deadline

NEW POST

New Comment