[일:] 2025년 05월 19일

Posted in Paper X-Review

[CVPR 2024]YOLO-World:Real-Time Open-Vocabulary Object Detection

안녕하세요 이번에 첫번째 X-review를 작성하게된 안우현 이라고합니다. 제가 오늘 첫번재로 가져온 논문은 2024년 3월 CVPR에 게재된 Open Vocabulary Object Detection 분야의 최신 연구라고 볼 수…

Continue Reading
Posted in Paper X-Review

[NeurIPS 2024] Scene Graph Generation with Role-Playing Large Language Models

안녕하세요, 허재연입니다. 오늘도 Open-Vocabualry Scene Graph Generation(OV-SGG) 논문을 들고 왔습니다. 기존 OV-SGG 방법론들이 scene-agnostic하게 text classifier를 적용시킨 방식에 대해 문제를 제기하고, LLM을 적극적으로 활용하여 주어진…

Continue Reading
Posted in Paper X-Review

[AAAI 2023] DPText-DETR: Towards Better Scene Text Detection with Dynamic Points in Transformer

안녕하세요 류지연입니다. TESTR 논문 리뷰에 이어서 TESTR의 검출 성능을 개선한 DPText-DETR 논문에 대해 리뷰 진행해보도록 하겠습니다. 1. Introduction Text spotting은 OCR(문자 인식) task 중 하나로…

Continue Reading
Posted in Conference X-Review

[ICLR 2025] TempMe: Video Temporal Token Merging for Efficient Text-Video Retrieval

오늘은 연산량과 추론속도 해결에 집중한 Text-Video Retrieval 논문에 대해 리뷰해보겠습니다. Conference: ICLR 2025 Authors: Leqi Shen, Tianxiang Hao, Tao He, Sicheng Zhao, Yifeng Zhang, pengzhang liu,…

Continue Reading