[IJCV 2022] Learning to Prompt for Vision-Language Models
안녕하세요. 이번 주 X-Review에서 소개해드릴 논문의 제목은 <Learning to Prompt for Vision-Language Models>입니다. 22년도 IJCV에 게재되었고, NLP 분야의 학습 기반 prompt learning 방법론을 영상 분야에…
[ICCV-2019] Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network
안녕하세요. 열 두 번째 X-Review입니다. 금주 리뷰할 논문은 ICCV 2019에 게재된 <Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network>입니다. 바로 시작하도록 하겠습니다. 1….
[CVPR2023] FastViT: A Fast Hybrid Vision Transformer using Structural Reparameterization
이번에 리뷰할 논문은 FastViT라는 논문입니다. 논문 제목에서 보실 수 있다시피 모델의 경량화에 초점을 맞추고 있습니다. 그리고 해당 논문을 쓴 저자들이 애플 소속이라서 단순히 GPU 뿐만…
[ICASSP 2023] Knowledge-Aware Bayesian Co-Attention for Multimodal Emotion Recognition
안녕하세요. 최근에 VQA 논문 리뷰하다가 다시 감정 인식 논문으로 돌아왔습니다. 이전에 external knowledge를 이용하여 ERC를 수행했던 논문을 읽은 경험이 있어서 multimodal emotion recognition 논문 중에서…
[CVPR 2023] Devil’s on the Edges : Selective Quad Attention for Scene Graph Generation
Before Review 제가 KCCV 2023에 참석하면서 알게 된 논문 입니다. 그전에도 알고 있긴 했지만 구체적인 내용은 몰랐고 이번 KCCV 다녀오면서 저자에게 직접 설명을 들으면서 궁금한…
[AAAI 2023] Self-Supervised Video Representation Learning via Latent Time Navigation
오늘은 시간적 정보를 가이드하는 부분을 포함해서 학습하는 SSL 논문을 가져왔습니다. Introduction Temporal한 정보가 Video에 도움이 되는지 되지 않는지에 대한 많은 연구들이 있습니다. 어떻게 학습을 하는지에…
[CVPR 2023] Revisiting Temporal Modeling for CLIP-based Image-to-Video Knowledge Transfering
이런 분들께 이 논문을 추천드립니다. Image-Text 모델인 CLIP을 Video Understanding에 활용하는 방법이 궁굼하신 분 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. CLIP에 대한 이해 (CLIP…
[2023-하계][백승우] URP를 마치며
안녕하세요, 지능기전공학부 스마트기기공학전공 21학번 백승우입니다. 2023년 하계 URP 프로그램을 마치게 되었습니다. URP 프로그램 시작 직전까지 개발과 연구 사이에서 고민해왔기 때문에 같은 고민을 하고 있으신 분들께…
[2023-하계][김이나] URP를 마치며
안녕하세요! 저는 2023년 하계 URP를 이수한 컴퓨터공학과 21학번 김이나입니다! 다음 URP에 지원을 고민 하시거나 , 이미 URP 진행중이지만 갈피를 못 잡고 계신 분들에게 조금이라도 제…
[2023-하계][박성준] URP를 마치며
안녕하세요 저는 2023년 하계 URP를 이수한 컴퓨터공학과 19학번 박성준입니다. URP를 진행하면서 제가 한 고민과 느낀 점을 솔직하게 후기로 남기며, 이 글을 읽으시는 URP에 지원을 고민하시는…
1. CTC 기반의 텍스트 인식 모델의 학습 과정에 대해 설명을 드리면 대답이 될 것 같네요! 입력된 텍스트 이미지[H x W…