[월:] 2024년 05월
[CVPR 2024] Probing the 3D Awareness of Visual Foundation Models
안녕하세요, 서른 세번째 x-review 입니다. 이번 논문은 2024년도 CVPR에 게재된 Probing the 3D Awareness of Visual Foundation Models로, 널리 사용되는 Fondation model의 3차원 인지 능력에…
[BMVC 2021] Self-Supervised Monocular Depth Estimation with Internal Feature Fusion(DIFFnet)
https://daffodil-story-3b9.notion.site/BMVC-2021-Self-Supervised-Monocular-Depth-Estimation-with-Internal-Feature-Fusion-DIFFnet-1eb9786e3cca404398d779905f80c481?pvs=4 X-review 작성 간에 수학 수식을 삽입하는 방법을 몰라서 일단은 정리한 노션 페이지 링크를 첨부하였습니다.(인라인 수학 수식 삽입이 안됩니다 ㅠㅠ…)이번 주 안으로 작성 방법을 배워서…
[AAAI 2024] CARAT: Contrastive Feature Reconstruction and Aggregation for Multi-Modal Multi-Label Emotion Recognition
안녕하세요. 이번에는 MER 논문을 읽어 봤습니다. 요즘 감정인식 trend가 contrastive learning 쪽으로 가고 있다고 느끼고 있는데요. 이번에는 contrastive learning을 적극 이용한 감정 인식 논문이 있어…
[WACV 2024] Multi-Source Domain Adaptation for Object Detection with Prototype-based Mean Teacher
안녕하세요. 지난 주의 MSDA (Multi-Source Domain Adaptation) for Object Detection 리뷰에 이은 MSDA-OD 논문을 리뷰하고자합니다. 지난 주 리뷰한 논문은 MSDA-OD의 시초 논문이였으나, 코드가 공개되어 있지…
[ICML 2023] SAAL: Sharpness-Aware Active Learning
제가 이번에 리뷰하려는 논문은, 새로운 optimizer 기법으로 성능 향상을 도모한 AL 연구입니다. 2021년도 짧게나마 ImageNet 에서 SOTA의 자리에 올랐던, SAM (Sharpness-Aware Minimization) 이라는 방법론이 존재한데요,…
[CVPR2023]Weakly Supervised Temporal Sentence Grounding with Uncertainty-Guided Self-training
안녕하세요 박성준 연구원입니다. 제가 오늘 리뷰할 논문은 Moment Retrieval을 weak supervision으로 다룬 방법론입니다. weakly supervised moment retrieval은 영상과 자연어 쿼리만 주어지고 쿼리에 해당하는 구간이 annotation이…
[CVPR2024]Bridging the Gap: A Unified Video Comprehension Framework for Moment Retrieval and Highlight Detection
안녕하세요. 박성준입니다. 제가 오늘 리뷰할 논문은 바로 CVPR 2024에 등재된 UVCOM입니다. UVCOM은 Unified Video COMprehension의 약자로 Moment Retrieval과 Highlight Detection task를 다룰 수 있는 Unified…
[AAAI2024] SQLDepth: Generalizable Self-Supervised Fine-Structured Monocular Depth Estimation
이번에 소개드릴 논문은 AAAI 2024에 게재된 SQLDepth라고 하는 논문입니다. Self-supervised monocular depth estimation (SDE)에서 상당히 좋은 성능을 보여준 논문이지만 코드 공개도 안되어있고, 논문도 상당히 모호하게…
[ECCV 2022] Towards Open-Vocabulary Scene Graph Generation with Prompt-based Finetuning
Before Review 이번 논문은 요즘 제가 관심을 가지고 있는 Open-Vocabulary Scene Graph Generation을 처음으로 제안하는 논문 입니다. 방법론이 새롭거나 복잡한 부분은 딱히 없지만, 처음으로 문제…
[arXiv 2024]Leveraging Positional Encoding for Robust Multi-Reference-Based Object 6D Pose Estimation
제가 이번에 리뷰할 논문은 아직 아카이브에 있는 논문으로 기하학적 representation을 encoding 한다고 하여 궁금증이 생겨 읽어보게 되었습니다. Abstract object의 정확한 자세를 추정하는 것은 중요하며, 이를…
