[카테고리:] X-Review

Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.

Posted in X-Review

[ICASSP 2024] RaD-Net: A Repairing and Denoising Network for Speech Signal Improvement

Introduction Speech communication system은 speech를 통해 발생하는 발화, 의사소통하는 것으로, 여러 가지 speech 관련 task에서 중요하게 다루어지고 있습니다. 그러나 speech를 마이크 센서를 통해 audio data로…

Continue Reading
Posted in Paper X-Review

[CVPR 2024] From Pixels to Graphs : Open-Vocabulary Scene Graph Generation with Vision-Language Models

Introduction Scene Graph Generation (이하 SGG)은 이미지에 존재하는 객체와 객체들간의 관계를 예측하는 작업으로 High-level Scene Understanding 능력을 요구로 합니다. Scene Graph의 구성 요소는 크게 세…

Continue Reading
Posted in Paper X-Review

[arXiv 2024] Correlation-guided Query-Dependency Calibration in Video Representation Learning for Temporal Grounding

안녕하세요. 이번 X-Review에서 소개해드릴 논문은 제가 이전에 작성했던 리뷰 QD-DETR의 후속 연구 논문 CG-DETR입니다. QD-DETR과 동일한 성균관대 한국인 박사님의 연구이며, ECCV에 제출한 뒤 이제 리비전을…

Continue Reading
Posted in Conference X-Review

[ECCV Workshop 2022]TransNet: Transparent Object Manipulation Through Category-Level Pose Estimation

제가 이번에 리뷰할 논문은 투명 객체에 대한 Pose Estimation을 수행한 논문입니다. 저는 투명 객체에 대한 pose 추정을 위해 열화상을 사용하는 것의 효과를 확인하기 위한 실험을…

Continue Reading
Posted in Paper X-Review

[ICCV 2023] Towards Open-Set Test-Time Adaptation Utilizing the Wisdom of Crowds in Entropy Minimization

안녕하세요.오늘 리뷰할 논문도 마찬가지로 Test-Time Adaptation 관련 논문입니다. TTA 관련 논문을 찾아보던 도중 Open-Set 키워드가 함께 들어있어서 읽어보게 되었습니다.시작 전에 말씀드리자면, 본 논문은 Open-Set class…

Continue Reading
Posted in News Paper X-Review

[IEEE 2022] Deeply Unsupervised Patch Re-Identification for Pre-training Object Detectors

안녕하세요 정의철 연구원입니다. 이번에 제가 소개할 논문은 ‘Deeply Unsupervised Patch Re-Identification for Pre-training Object Detectors’ 이란 논문입니다. 최근 Detection과 self-supervised을 주제로 연구를 진행하고 있어서 이렇게…

Continue Reading
Posted in Paper X-Review

[CVPR 2024] HiPose: Hierarchical Binary Surface Encoding and Correspondence Pruning for RGB-D 6DoF Object Pose Estimation

안녕하세요, 이번에 리뷰할 논문은 오래간만에 instance-level에서의 6D pose estimation 방법론입니다. 선행 연구로 제안된 ZebraPose의 문제점들을 해결하기 위해 제안된 방법론으로, binary encoding을 통해 pose를 추정하는 신박한 방법론입니다….

Continue Reading
Posted in Paper X-Review

[CVPR 2024] Probing the 3D Awareness of Visual Foundation Models

안녕하세요, 서른 세번째 x-review 입니다. 이번 논문은 2024년도 CVPR에 게재된 Probing the 3D Awareness of Visual Foundation Models로, 널리 사용되는 Fondation model의 3차원 인지 능력에…

Continue Reading
Posted in Paper X-Review

[BMVC 2021] Self-Supervised Monocular Depth Estimation with Internal Feature Fusion(DIFFnet)

https://daffodil-story-3b9.notion.site/BMVC-2021-Self-Supervised-Monocular-Depth-Estimation-with-Internal-Feature-Fusion-DIFFnet-1eb9786e3cca404398d779905f80c481?pvs=4 X-review 작성 간에 수학 수식을 삽입하는 방법을 몰라서 일단은 정리한 노션 페이지 링크를 첨부하였습니다.(인라인 수학 수식 삽입이 안됩니다 ㅠㅠ…)이번 주 안으로 작성 방법을 배워서…

Continue Reading
Posted in Paper X-Review

[AAAI 2024] CARAT: Contrastive Feature Reconstruction and Aggregation for Multi-Modal Multi-Label Emotion Recognition

안녕하세요. 이번에는 MER 논문을 읽어 봤습니다. 요즘 감정인식 trend가 contrastive learning 쪽으로 가고 있다고 느끼고 있는데요. 이번에는 contrastive learning을 적극 이용한 감정 인식 논문이 있어…

Continue Reading