Author: 정 윤서
[TPAMI 2024] Turning a CLIP Model Into a Scene Text Spotter
1. Introduction Scene text spotting은 natural image내에 있는 text instance의 위치를 찾고 그 text가 무엇인지 인식하는 task입니다. 지금까지 이 spotting은 fully-supervised 방식으로 발전해오고 있었는데요, 본…
2024년을 보내며
안녕하세요. 이번 주는 올 한 해를 되돌아보고, 다가오는 2025년은 어떻게 보낼지에 대해 정리하는 시간을 갖고자 합니다. 2024년을 마무리하며 벌써, 2024년이 고작 이틀밖에 남지 않았는데요. 이번…
ICAN 제2회 네이버랩스 전문가초청세미나 참관기
안녕하세요. 오늘은 네이버랩스 권재운 연구원님의 네이버의 기술적 비전과 실제 세계와 디지털 세계를 연결하려는 다양한 시도에 대해 소개해 주신 자리였습니다. 처음 발표는 네이버가 단순히 지식인,,,이나 검색이…
[CVPR 2022] DN-DETR: Accelerate DETR Training by Introducing Query DeNoising
안녕하세요, 마흔여덟 번째 X-Review입니다. 이번 논문은 2022년도 CVPR에 게재된 DN-DETR: Accelerate DETR Training by Introducing Query DeNoising 논문입니다. 바로 시작하도록 하겠습니다. 🦙 1. Introduction DETR은…
[CVPR 2023] DeepSolo: Let Transformer Decoder with Explicit Points Solo for Text Spotting
안녕하세요, 마흔일곱 번째 X-Review입니다. 이번 논문은 2023년도 CVPR에 게재된 DeepSolo: Let Transformer Decoder with Explicit Points Solo for Text Spotting 논문입니다. 바로 시작하도록 하겠습니다. 🦍…
[CVPR 2023] Towards Unified Scene Text Spotting based on Sequence Generation
안녕하세요, 마흔여섯 번째 X-Review입니다. 이번 논문은 2023년도 CVPR에 게재된 Towards Unified Scene Text Spotting based on Sequence Generation 논문입니다. 바로 시작하도록 하겠습니다. 🦭 1. Introduction…
[ECCV 2022] Language Matters – A Weakly Supervised Vision-Language Pre-training Approach for Scene Text Detection and Spotting
안녕하세요, 마흔다섯 번째 X-Review입니다. 이번 논문은 2022년도 ECCV에 게재된 Language Matters – A Weakly Supervised Vision-Language Pre-training Approach for Scene Text Detection and Spotting 논문입니다….
[CVPR 2023] Turning a CLIP Model into a Scene Text Detector
안녕하세요, 마흔네 번째 X-Review입니다. 이번 논문은 2023년도 CVPR에 게재된 Turning a CLIP Model into a Scene Text Detector 논문입니다. 바로 시작하도록 하겠습니다. 🦩 1. Introduction…
[CVPR 2023] DPText-DETR: Towards Better Scene Text Detection with Dynamic Points in Transformer
안녕하세요, 마흔세 번째 X-Review입니다. 이번 논문은 2023년도 CVPR에 게재된 DPText-DETR: Towards Better Scene Text Detection with Dynamic Points in Transformer 논문입니다. 바로 시작하도록 하겠습니다. 🦩…
[ICCV 2023] Open-Vocabulary Video Question Answering: A New Benchmark for Evaluating the Generalizability of Video Question Answering Models
안녕하세요, 마흔두 번째 X-Review입니다. 이번 논문은 2023년도 ICCV에 게재된 Open-Vocabulary Video Question Answering: A New Benchmark for Evaluating the Generalizability of Video Question Answering Model로…
최신 댓글