[WACV 2022]Occlusion-Robust Object Pose Esitimation with Holistic Representation
안녕하세요 1번째 X-Review 작성자 손우진입니다. 처음 작성하는 리뷰라 미숙한 점이 있을 수 있습니다. 독자분들 모두의 피드백은 저의 실력향상과 올바른 길로가는 거름이라 생각하고 성심껏 답변하고 받아드리겠습니다!…
[NeurIPS2021]CLIP-It! Language-Guided Video Summarization
안녕하세요 오늘도 지난시간에 이어서 Video Summarization 연구를 소개하려 합니다. 지난 리뷰[Link]에서는 입력된 비디오에서 맥락적으로 중요한 부분을 선별하기 위한 데이터셋과 구조를 소개했습니다. 이와 다르게 본 논문은…
[ICLR 2025] PhysBench: Benchmarking and Enhancing Vision-Language Models for Physical World Understanding
안녕하세요. 이번 리뷰는 조금 색다른 벤치마크 관련 논문을 가져와 보았습니다(무려 150장). 바로 physical 적인 정보를 다룬 VQA 데이터셋인데요. 특히 VLM(MLLM) 의 physical 이해 능력을 벤치마킹하며…
[ICLR 2025] How new data permeates LLM knowledge and how to dilute it
안녕하세요. 박성준 연구원입니다. 오늘의 리뷰는 ICLR 2025에 Spotlight에 선정된 연구입니다. Google DeepMind에서 게재한 논문으로 요즘 핫한(?) LLM에 대한 내용으로 LLM에 주입되는 새로운 정보가 기존 지식에…
[ECCV 2024] Scene-Graph ViT: End-to-End Open-Vocabulary Visual Relationship Detection
안녕하세요, 허재연입니다. 오늘 리뷰할 논문은 ECCV 2024에 게재된 논문으로, Visual Relationship DetectionI(VRD)를 open-vocabulary로 수행하는 Scene-Graph ViT라는 방법론을 제안한 논문입니다. Visual Relationship Detection은 장면 이해를 수행하기…
[Arxiv 2025]AffordanceSAM: Segment Anything Once More in Affordance Grounding
제가 이번에 리뷰할 논문은 최근 아카이브에 공개된 affordance segmentation 관련 논문입니다. Abstract 실세계로의 응용을 위해서는 unseen object 및 affordance 기능에 대한 일반화가 중요하지만, 최근 연구는…
[arXiv 2025] RoboVerse: Towards a Unified Platform, Dataset and Benchmark for Scalable and Generalizable Robot Learning
안녕하세요, 이번엔 2025년 4월에 나온 따끈따끈한 논문을 리뷰해보려고 합니다. 지난주에 Behavior-1K논문을 리뷰했었는데, Behavior-1K는 수많은 asset을 제작해서 하나의 거대한 데이터셋을 제작했다면, 이번에 리뷰할 논문은 여러 시뮬레이터에서…
[CVPR 2024] OMNIPARSER: A Unified Framework for Text Spotting, Key Information Extraction and Table Recognition
안녕하세요, 60번째 X-Review입니다. 이번 논문은 2024년도 CVPR에 올라온 OMNIPARSER: A Unified Framework for Text Spotting, Key Information Extraction and Table Recognition논문입니다. 바로 시작하도록 하겠습니다. ?…
[CVPR 2024] ECoDepth: Effective Conditioning of Diffusion Models for Monocular Depth Estimation
안녕하세요, 64번째 x-review 입니다. CVPR 2024년도에 게재된 Monocular depth estimation 논문 입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction 보통 Monocular Depth Estimation이라고 칭하는데 본…
[ECCV 2020] End-to-End Object Detection with Transformers
안녕하세요 류지연입니다. 오늘 리뷰할 논문은 이전에 작성했던 TESTR 모델의 근간이 되는 DETR입니다. TESTR을 읽을 때 DETR에 대해서 알고자 간단하게 블로그만을 참고했었는데요 깊게 알고자 논문을 읽고…
안녕하세요 정민님 깔끔한 리뷰 감사합니다. 말씀하신 것처럼 약간 지도학습기반으로 다시 회귀하는 점이 장점이자 단점이라고 생각할 수 있을 것 같습니다. 제가…