Author: 류 지연

Posted in X-Review

[2025 arXiv] TEACH: TEXT ENCODING AS CURRICULUM HINTS FOR SCENE TEXT RECOGNITION

1. INTRODUCTION Scene Text Recognition은 이미지에서 텍스트를 읽어내는 태스크로 Optical Character Recognition (OCR)의 하위 범주에 속합니다. 문서 속 텍스트를 읽는 document OCR과 비교했을 때 더…

Continue Reading
Posted in X-Review

[arXiv 2024] Char-SAM: Turning Segment Anything Model into Scene Text Segmentation Annotator with Character-level Visual Prompts

안녕하세요. 이번엔 text 관련 태스크이지만 detection, recognition도 아닌 segmentation 논문을 가져왔습니다. Text segmentation 모델을 제안한 연구는 아니고요 Segment Anything Model로 text segmentation 을 수행하게 하는데…

Continue Reading
Posted in Peer Review X-Review

[ICASSP 2025] Improving Irregular Text Recognition with Adaptive Feature Compression

1. Introduction Scene Text Recognition(STR) task는 이미지의 feature 정보를 가지고 text 형태의 문자 시퀀스를 예측하는 즉, 두 모달리티에서의 데이터 전환을 다루는 태스크입니다. 꽤나 높은 정확도로…

Continue Reading
Posted in Conference Paper X-Review

[ICCV 2025] SVTRv2: CTCBeats Encoder-Decoder Models in Scene Text Recognition

안녕하세요 2025년 ICCV에 accept된 Scene Text Recognition (STR) 논문 중 한 편인 SVTRv2을 가져왔습니다. 기존에 많이 사용됐던 CTC 기반의 방법론에 모듈을 추가해 트랜스포머 기반의 text…

Continue Reading
Posted in X-Diary

2025년 상반기 회고

안녕하세요. 2025년도 상반기를 마무리하며 짧은 회고를 남깁니다. 올해는 연구실에 들어오고 동시에 석사과정 첫 학기를 보냈습니다 . 원래 같았으면 종강만을 손꼽아 기다렸을 텐데 이번학기는 오히려 그…

Continue Reading
Posted in X-Review

[TPAMI 2018] SEED: Semantics Enhanced Encoder-Decoder Framework for Scene Text Recognition

안녕하세요 오늘도 Scene text recognition 주제의 논문을 들고 왔습니다. 특히 단어가 가지는 의미 정보를 활용한 recognition 연구에 관심이 있어 해당 주제 위주로 공부하고 있습니다. 제가…

Continue Reading
Posted in X-Review

[TIP 2024] CLIP4STR: A Simple Baseline for Scene TextRecognition with Pre-trained Vision-LanguageModel

안녕하세요. 오늘은 CLIP을 Scene Text Recognition task에 적용한 연구에 대한 리뷰를 하게 되었습니다. CLIP이 가지는 text perception의 능력에 주목해 구조는 간단하지만서도 이를 효과적으로 활용해 SoTA…

Continue Reading
Posted in Conference Paper X-Review

[WACV 2024] DTrOCR: Decoder-only Transformer for Optical Character Recognition

안녕하세요 text recognition 연구를 다룬 논문을 하나 가져와 리뷰하겠습니다. 지금까지 제가 본 트랜스포머를 활용한 text spotting, text detection, recognition 연구는 인코더-디코더 구조를 사용하였지만 해당 연구는…

Continue Reading
Posted in Conference Paper X-Review

[CVPR 2024] Bridging the Gap Between End-to-End and Two-Step Text Spotting

안녕하세요 이번주에도 Text Spotting 논문을 가져와 리뷰해보겠습니다. 1. Introduction & Related Studies natural scene에서의 text를 인식하는 text spotting 태스크는 실제 세계에서 다양한 분야에 적용되기 때문에…

Continue Reading
Posted in Conference Paper X-Review

[NeurIPS 2021] Aligning Pretraining for Detection via Object-Level Contrastive Learning

1. Introduction 컵퓨터 비전 분야에서는 사전학습 후 파인튜닝하는 방법으로 딥러닝 모델을 학습시키는 게 보편적으로 사용이 되어왔습니다. ImageNet과 같이 대량의 데이터셋으로 사전학습한 가중치를 불러와 실제 수행하고자…

Continue Reading