[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[ACM MM 2024] Not All Inputs Are Valid: Towards Open-Set Video Moment Retrieval using Language
안녕하세요 박성준 연구원입니다. 오늘 제가 리뷰할 논문은 Not All Inputs Are Valid: Towards Open-Set Video Moment Retrieval using Language으로 Video Moment Retrieval을 Open-Set으로 확장시킨 첫…
[CVPRw 2024] GM-DETR: Generalized Muiltispectral DEtection TRansformer with Efficient Fusion Encoder for Visible-Infrared Detection
안녕하세요, 허재연입니다. 오늘 리뷰할 논문은 2024년 CVPR workshop에서 발표된 논문으로, DETR 구조를 활용해 multispectral detection을 수행하는 모델을 제안하였습니다. 바로 리뷰 시작하도록 하겠습니다. Introduction Object Detection은…
[2023 CVPR] Prototype-based Embedding Network for Scene Graph Generation
안녕하세요 이번에 소개할 논문은 sgg task의 논문으로 unbiased 관계 예측을 해결하기 위해 제안된 모델입니다. SGG에서는 종종 특정 관계나 객체 쌍에 대한 데이터의 불균형이 발생하여, 모델이…
[CVPR2023]Semantic Prompt for Few-Shot Image Recognition
안녕하세요? 저는 저번주부터 다크데이터 과제로 인해 Few-shot learning 관련 논문을 읽고있는데요, 저에게는 조금 낯선 개념이여서 그동안 리뷰를 쓰지 못했습니다 ㅎㅎ 그리고 드디어 해당 논문으로 리뷰를…
[ICCV 2023] Distribution-Consistent Modal Recovering for Incomplete Multimodal Learning
안녕하세요! 이번에는 논문의 related work에 작성하면 좋을 법한 논문을 발견하여 조금 더 디테일하게 팔로업 해보고자 읽게 되었습니다. 그럼 시작합니다! 1. Introduction 기존의 많은 연구자들은 heterogeneous…
[ECCV 2024] Expanding Scene Graph Boundaries: Fully Open-vocabulary Scene Graph Generation via Visual-Concept Alignment and Retention
오늘은 Open-vocabulary Scene Graph Generation 에 대한 논문을 리뷰해보겠습니다. 해당 논문은 Grounding DINO를 Open-vocabulary SGG를 위해 개선한 논문입니다. 앞으로 진행할 연구의 베이스라인이 되는 논문으로, 아마…
[CoRL 2024 Oral]Retrieval-Based Affordance Transfer for Generalizable Zero-Shot Robotic Manipulation
외부 지식을 활용한 접근법이라는 게, 과제 제안서와 얼라인이 맞는 듯 합니다.. Abstract 해당 논문은 retrieval 기반의 zero-shot 프레임워크인 RAM을 제안하여 다양한 사물과 환경에 대해 일반화…
[ICLR2024] Multi-granularity Correspondence Learning from Long-term Noisy Videos – Part 2
안녕하세요. 박성준 연구원입니다. 오늘은 ICLR2024에 게재된 Multi-granularity Correspondence Learning from Long-term Noisy Videos 논문의 Part2로 논문에서 제안하는 방법론과 실험결과에 대해서 리뷰하겠습니다. 아직 이전 리뷰를 보지…
[CVPR 2023] Turning a CLIP Model into a Scene Text Detector
안녕하세요, 마흔네 번째 X-Review입니다. 이번 논문은 2023년도 CVPR에 게재된 Turning a CLIP Model into a Scene Text Detector 논문입니다. 바로 시작하도록 하겠습니다. 🦩 1. Introduction…
[2021 CVPR] Probabilistic Modeling of Semantic Ambiguity for Scene Graph Generation
안녕하세요 이번에 소개할 논문은 SGG 논문으로 Long-tail 문제를 완화하기 위해 제안된 논문입니다. 구체적으로 기존의 SGG 모델은 의미적 모호성을 충분히 처리하지 못하고, 단일한 결정론적 관계만을 예측하려고…
최신 댓글