[카테고리:] Paper

Paper Review

Posted in Paper X-Review

[arXiv 2023] LLM4VG: Large Language Models Evaluation for Video Grounding

안녕하세요, 이번 주 X-Review에서는 23년도 말 arXiv에 게재된 <LLM4VG: Large Language Models Evaluation for Video Grounding> 이라는 논문을 소개해드리겠습니다. 방법론 논문은 아니고, 현존하는 LLM과 Multi-modal…

Continue Reading
Posted in Paper X-Review

[CVPR 2021] Propagate Yourself: Exploring Pixel-Level Consistency for Unsupervised Visual Representation Learning

안녕하세요, 허재연입니다. 이번에 다룰 논문은 Microsoft Research Asia에서 작성하여 CVPR2021에 게재된 논문으로, 현재 약 420회 인용되었습니다. 기존의 SimCLR, MoCo 등 Contrastive Learning 계열 Self-Supervised Learning…

Continue Reading
Posted in Conference Paper X-Review

[ECCV 2022] Simple Open-Vocabulary Object Detection with Vision Transformers (OWL-ViT)

안녕하세요. 저번 주에는 OWOD 태스크 중 Foundation model을 활용한 FOMO를 리뷰했었는데, 이번 주 리뷰는 FOMO의 베이스라인으로 활용됐던 OWL-ViT에 대해 리뷰를 해보려고 합니다. OWL-ViT는 Open-World Localization을…

Continue Reading
Posted in Paper X-Review

[ICCV 2023] Verbs in Action: Improving Verb Understanding in Video-Language Models

제가 현재 연구주제로 잡은 task인 Moment Retrieval은 사용자의 텍스트 쿼리를 입력받아 길고 다양한 컨텐츠를 포함하고 있는 untrimmed video 내에서 상응하는 구간을 찾아내는 것이 목적입니다. 처음에는…

Continue Reading
Posted in News Paper X-Review

[CVPR 2022] Learning What and Where to Learn: A New Perspective on Self-supervised Learning

안녕하세요 정의철 연구원입니다. 이번에 제가 리뷰할 논문은 2022년 CVPR에 발표된 ‘Learning What and Where to Learn: A New Perspective on Self-supervised Learning’이란 논문입니다. 이 논문은…

Continue Reading
Posted in Paper X-Review

쌍곡 신경망 (Hyperbolic Neural Network) (Part.1)

쌍곡 심층 학습 (Hyperbolic Deep Learning) 요즘 제가 풀고 싶은 문제가 Scene Graph Generation 에서의 Long Tail Distribution 문제 입니다. Logng Tail 문제에서 결국 Head…

Continue Reading
Posted in Paper X-Review

[CVPR 2024] FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects

안녕하세요, 이번에는 CVPR 2024 highlight인 FoundationPose를 리뷰해보았습니다. 해당 링크에 들어가보시면 어떤 테스크인지 감이 오실 것 같습니다. Model-free 기반으로 하기 때문에 inference 할 때 3D 모델이…

Continue Reading
Posted in Paper X-Review

[arXiv 2024] Emotion-LLaMA

안녕하세요. 정말 따근따근한 MER (Multimodal Emotion Recognition)논문을 들고 왔습니다. arXiv에 6월에 등록된 논문으로 EMER과 마찬가지로 under review 중에 있는 논문입니다. 새로운 MER 분야로 찾아보게 되니…

Continue Reading
Posted in Paper X-Review

[ICCV 2023] Multi-modal 3D Object Detection with Object-Centric Fusion

안녕하세요, 서른 아홉번째 x-review 입니다. 이번 논문은 2023년도 ICCV에 게재된 Multi-modal 3D Object Detection with Object-Centric Fusion입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction 3차원…

Continue Reading
Posted in Paper X-Review

[CVPR 2024] Unified Entropy Optimization for Open-Set Test-Time Adaptation

안녕하세요. 오늘 리뷰할 논문은 CVPR 2024에서 발표된 open-set TTA 분야의 논문입니다. 실험을 classification 에서만 진행하긴 하지만 open-set 키워드에 이끌려 한번 읽어보게 되었습니다. 리뷰 바로 시작하도록…

Continue Reading