[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[arXiv 2023] LLM4VG: Large Language Models Evaluation for Video Grounding
안녕하세요, 이번 주 X-Review에서는 23년도 말 arXiv에 게재된 <LLM4VG: Large Language Models Evaluation for Video Grounding> 이라는 논문을 소개해드리겠습니다. 방법론 논문은 아니고, 현존하는 LLM과 Multi-modal…
[CVPR 2021] Propagate Yourself: Exploring Pixel-Level Consistency for Unsupervised Visual Representation Learning
안녕하세요, 허재연입니다. 이번에 다룰 논문은 Microsoft Research Asia에서 작성하여 CVPR2021에 게재된 논문으로, 현재 약 420회 인용되었습니다. 기존의 SimCLR, MoCo 등 Contrastive Learning 계열 Self-Supervised Learning…
[CVPR 2024] DETRs Beat YOLOs on Real-time Object Detection
안녕하세요. 실수로 집에 아이패드를 두고 오는 바람에, 리뷰 작성이 조금 늦어졌습니다. 지난 주 10번째 버전의 Yolo-v10을 리뷰 했었습니다. 해당 리뷰를 읽으셨다면 실험 파트에서 비교군으로 삼던…
[ECCV 2022] Simple Open-Vocabulary Object Detection with Vision Transformers (OWL-ViT)
안녕하세요. 저번 주에는 OWOD 태스크 중 Foundation model을 활용한 FOMO를 리뷰했었는데, 이번 주 리뷰는 FOMO의 베이스라인으로 활용됐던 OWL-ViT에 대해 리뷰를 해보려고 합니다. OWL-ViT는 Open-World Localization을…
[IEEE TAC 2024] Vesper: A Compact and Effective Pretrained Model for Speech Emotion Recognition
오늘 리뷰할 논문은 Vesper로 대규모의 음성 사전학습 모델을 감정인식이라는 특정 task에 대해 adaptation을 진행함과 더불어 경량화를 진행하는 논문입니다. 본격적인 리뷰에 앞서 간단하게 개요를 설명드리자면 general…
[ECCV 2020]End-to-End Object Detection with Transformers(DETR)
안녕하세요. 조현석 연구원입니다. 오늘은 End-to-End Object Detection with Transformers이란 논문을 가져왔습니다. DETR이라는 모델의 이름으로 유명한 해당 논문을 x-review로 작성하게 된 계기는 연구실 세미나, 특히 다양한…
[CVPR 2024]FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects
제가 이번에 리뷰할 논문은 미학습 객체에 대응하기 위한 6D Pose Estimation 논문으로, 미학습 객체의 pose 정보를 추정하기 위한 서로 다른 세팅(3D CAD 모델을 사용하는 model-based방식과…
[ICCV 2023] Verbs in Action: Improving Verb Understanding in Video-Language Models
제가 현재 연구주제로 잡은 task인 Moment Retrieval은 사용자의 텍스트 쿼리를 입력받아 길고 다양한 컨텐츠를 포함하고 있는 untrimmed video 내에서 상응하는 구간을 찾아내는 것이 목적입니다. 처음에는…
[CVPR 2022] Learning What and Where to Learn: A New Perspective on Self-supervised Learning
안녕하세요 정의철 연구원입니다. 이번에 제가 리뷰할 논문은 2022년 CVPR에 발표된 ‘Learning What and Where to Learn: A New Perspective on Self-supervised Learning’이란 논문입니다. 이 논문은…
쌍곡 신경망 (Hyperbolic Neural Network) (Part.1)
쌍곡 심층 학습 (Hyperbolic Deep Learning) 요즘 제가 풀고 싶은 문제가 Scene Graph Generation 에서의 Long Tail Distribution 문제 입니다. Logng Tail 문제에서 결국 Head…
최신 댓글