[일:] 2025년 05월 19일
[CVPR 2024]YOLO-World:Real-Time Open-Vocabulary Object Detection
안녕하세요 이번에 첫번째 X-review를 작성하게된 안우현 이라고합니다. 제가 오늘 첫번재로 가져온 논문은 2024년 3월 CVPR에 게재된 Open Vocabulary Object Detection 분야의 최신 연구라고 볼 수…
[NeurIPS 2024] Scene Graph Generation with Role-Playing Large Language Models
허 재연 05/19/2025 Leave a Comment on [NeurIPS 2024] Scene Graph Generation with Role-Playing Large Language Models
안녕하세요, 허재연입니다. 오늘도 Open-Vocabualry Scene Graph Generation(OV-SGG) 논문을 들고 왔습니다. 기존 OV-SGG 방법론들이 scene-agnostic하게 text classifier를 적용시킨 방식에 대해 문제를 제기하고, LLM을 적극적으로 활용하여 주어진…
[AAAI 2023] DPText-DETR: Towards Better Scene Text Detection with Dynamic Points in Transformer
류 지연 05/19/2025 Leave a Comment on [AAAI 2023] DPText-DETR: Towards Better Scene Text Detection with Dynamic Points in Transformer
안녕하세요 류지연입니다. TESTR 논문 리뷰에 이어서 TESTR의 검출 성능을 개선한 DPText-DETR 논문에 대해 리뷰 진행해보도록 하겠습니다. 1. Introduction Text spotting은 OCR(문자 인식) task 중 하나로…
[ICLR 2025] TempMe: Video Temporal Token Merging for Efficient Text-Video Retrieval
홍 주영 05/19/2025 Leave a Comment on [ICLR 2025] TempMe: Video Temporal Token Merging for Efficient Text-Video Retrieval
오늘은 연산량과 추론속도 해결에 집중한 Text-Video Retrieval 논문에 대해 리뷰해보겠습니다. Conference: ICLR 2025 Authors: Leqi Shen, Tianxiang Hao, Tao He, Sicheng Zhao, Yifeng Zhang, pengzhang liu,…
최신 댓글