[카테고리:] Paper

Paper Review

Posted in Paper X-Review

[NeurIPS 2023] Zero-shot Visual Relation Detection via Composite Visual Cues from Large Language Models

안녕하세요, 허재연입니다. 지난번에 이어서 OV-SGG 분야 논문을 가져왔습니다. SGG의 경우 일반적으로 <subject-predicate-object> triplet을 모두 잘 예측하고자 하는 흐름에 있는데(이를 Visual Relation Detection이라고도 합니다), 본 논문은…

Continue Reading
Posted in Paper X-Review

[ACM 2022] Reading and Writing: Discriminative and Generative Modeling for Self-Supervised Text Recognition

안녕하세요 류지연입니다. TESTR과 DPText-DETR에 이어서 텍스트 인식 task에 집중하며 논문을 읽고 교육받고 있습니다. 당분간은 이와 관련해서 리뷰를 작성할 듯 싶습니다. 이번에는 Text Recognition만을 다룬 연구인…

Continue Reading
Posted in Paper X-Review

[CVPR 2025] Completion as Enhancement: A Degradation-Aware Selective Image Guided Network for Depth Completion

안녕하세요, 66번째 x-review 입니다. 이번 논문은 CVPR 2025년도에 게재된 depth completion을 depth enhancement 관점에서 해결한 논문 입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction depth…

Continue Reading
Posted in Paper X-Review

[ECCV 2022] DualPrompt: Complementary Prompting for Rehearsal-free Continual Learning

안녕하세요, 예순 한번째 X-Review입니다. 이번 논문은 2022년도 ECCV에 올라온 DualPrompt: Complementary Prompting for Rehearsal-free Continual Learning논문으로 prompt learning을 continual learning에 적용한 논문입니다. 바로 시작하도록 하겠습니다….

Continue Reading
Posted in Paper X-Review

[CVPR 2024]YOLO-World:Real-Time Open-Vocabulary Object Detection

안녕하세요 이번에 첫번째 X-review를 작성하게된 안우현 이라고합니다. 제가 오늘 첫번재로 가져온 논문은 2024년 3월 CVPR에 게재된 Open Vocabulary Object Detection 분야의 최신 연구라고 볼 수…

Continue Reading
Posted in Paper X-Review

[NeurIPS 2024] Scene Graph Generation with Role-Playing Large Language Models

안녕하세요, 허재연입니다. 오늘도 Open-Vocabualry Scene Graph Generation(OV-SGG) 논문을 들고 왔습니다. 기존 OV-SGG 방법론들이 scene-agnostic하게 text classifier를 적용시킨 방식에 대해 문제를 제기하고, LLM을 적극적으로 활용하여 주어진…

Continue Reading
Posted in Paper X-Review

[AAAI 2023] DPText-DETR: Towards Better Scene Text Detection with Dynamic Points in Transformer

안녕하세요 류지연입니다. TESTR 논문 리뷰에 이어서 TESTR의 검출 성능을 개선한 DPText-DETR 논문에 대해 리뷰 진행해보도록 하겠습니다. 1. Introduction Text spotting은 OCR(문자 인식) task 중 하나로…

Continue Reading
Posted in Paper X-Review

[CVPR 2025] Distilling Monocular Foundation Model for Fine-grained Depth Completion

안녕하세요, 65번째 x-review 입니다. 이번 논문은 CVPR 2025년도에 게재된 depth completion 논문으로 Monocular Depth estimation의 결과를 depth completion에 활용한 논문 입니다. 그럼 바로 리뷰 시작하겠습니다…

Continue Reading
Posted in Conference News Paper X-Review

[CVPR 2025] Fast3R: Towards 3D Reconstruction of 1000+ Images in One Forward Pass

이번 리뷰 논문은 DUST3R이라는 dense feature matching 기법으로 획을 그은 DUST3R라는 연구의 2장 이상의 영상들로 재구성을 수행했을 때의 시간 문제를 해소하기 위해서 제안된 기법입니다. 해당…

Continue Reading
Posted in Paper X-Review

[arXiv 2025] CLIP-UP: A Simple and Efficient Mixture-of-Experts CLIP Training Recipe
with Sparse Upcycling

안녕하세요 이번에 리뷰할 논문은 2025년 Apple에서 발표한 논문으로 CLIP 모델에 Mixture-of-Experts(MoE)를 적용하여 다양한 실험을 통해 CLIP 모델 확장 과정에서 발생할 수 있는 문제점을 분석하고 새로운…

Continue Reading