[카테고리:] X-Review

Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.

Posted in X-Review

[ECCV 2024] Expanding Scene Graph Boundaries: Fully Open-vocabulary Scene Graph Generation via Visual-Concept Alignment and Retention

오늘은 Open-vocabulary Scene Graph Generation 에 대한 논문을 리뷰해보겠습니다. 해당 논문은 Grounding DINO를 Open-vocabulary SGG를 위해 개선한 논문입니다. 앞으로 진행할 연구의 베이스라인이 되는 논문으로, 아마…

Continue Reading
Posted in X-Review

[CoRL 2024 Oral]Retrieval-Based Affordance Transfer for Generalizable Zero-Shot Robotic Manipulation

외부 지식을 활용한 접근법이라는 게, 과제 제안서와 얼라인이 맞는 듯 합니다.. Abstract 해당 논문은 retrieval 기반의 zero-shot 프레임워크인 RAM을 제안하여 다양한 사물과 환경에 대해 일반화…

Continue Reading
Posted in X-Review

[ICLR2024] Multi-granularity Correspondence Learning from Long-term Noisy Videos – Part 2

안녕하세요. 박성준 연구원입니다. 오늘은 ICLR2024에 게재된 Multi-granularity Correspondence Learning from Long-term Noisy Videos 논문의 Part2로 논문에서 제안하는 방법론과 실험결과에 대해서 리뷰하겠습니다. 아직 이전 리뷰를 보지…

Continue Reading
Posted in Paper X-Review

[CVPR 2023] Turning a CLIP Model into a Scene Text Detector

안녕하세요, 마흔네 번째 X-Review입니다. 이번 논문은 2023년도 CVPR에 게재된 Turning a CLIP Model into a Scene Text Detector 논문입니다. 바로 시작하도록 하겠습니다. 🦩 1. Introduction…

Continue Reading
Posted in Paper X-Review

[2021 CVPR] Probabilistic Modeling of Semantic Ambiguity for Scene Graph Generation

안녕하세요 이번에 소개할 논문은 SGG 논문으로 Long-tail 문제를 완화하기 위해 제안된 논문입니다. 구체적으로 기존의 SGG 모델은 의미적 모호성을 충분히 처리하지 못하고, 단일한 결정론적 관계만을 예측하려고…

Continue Reading
Posted in Paper X-Review

[ECCV 2024] Is user feedback always informative? Retrieval Latent Defending for Semi-Supervised Domain Adaptation without Source Data

올 초부터 (Online) Test-Time Adaptation(TTA) 분야의 논문들을 적지 않게 읽어왔습니다. 최근 TTA 논문들에서 핵심적으로 문제삼는 것들 중 하나는 long-term TTA 수행 속 마주하는 Catastrophic forgetting…

Continue Reading
Posted in Conference X-Review

[CVPR 2023] Detecting Everything in the Open World: Towards Universal Object Detection

안녕하세요. 지난 리뷰에서는 Universal Segmentation, Segmentation의 모든 Task 에 대한 연구를 소개 드렸다면, 이번 논문에서는 Detection 분야에서 “모든 환경에서, 모든 객체를 탐지하고자 하는” 연구를 소개…

Continue Reading
Posted in Conference Paper X-Review

[CoRL 2023 Oral] Language Embedded Radiance Fields for Zero-Shot Task-Oriented Grasping

이번 논문은 LEFT-TOGO라는 논문으로 저희가 진행하고 있는 LLM 로봇 과제에서 지향하는 목표 중 하나를 구현한 논문에 해당합니다. 해당 논문은 VLM의 특징 정보를 가진 NeRF인 LERF를…

Continue Reading
Posted in Paper X-Review

[CVPR 2024] Domain-Specific Block Selection and Paired-View Pseudo-Labeling for Online Test-Time Adaptation

안녕하세요, 오랜만에 TTA 분야 논문 리뷰입니다.바로 시작하겠습니다. 1. Introduction source domain dataset에 대해 학습된 모델이 실상황에 deploy된 상황 속,학습때는 마주하지 못한 새로운 target domain 에…

Continue Reading
Posted in Paper X-Review

[MM 2024] Let Me Finish My Sentence: Video Temporal Grounding with Holistic Text Understanding

안녕하세요, 오늘의 X-Review에서는 24년도 ACM MM 학회에 게재된 논문 <Let Me Finish My Sentence: Video Temporal Grounding with Holistic Text Understanding>을 소개해드리고자 합니다. 카이스트의 정준선…

Continue Reading