[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[CVPR 2023] Self-supervised Implicit Glyph Attention for Text Recognition
안녕하세요, 마흔한 번째 X-Review입니다. 이번 논문은 2023년도 CVPR에 게재된 Self-supervised Implicit Glyph Attention for Text Recognition입니다. 바로 시작하도록 하겠습니다. 🧙🏽♂️ 1. Introduction Scene text recognition…
[ICML 2022] Characterizing and Overcoming the Greedy Nature of Learning in Multi-modal Deep Neural Networks
pdf 안녕하세요. 저번 논문에 이어서 이번에도 multi-modal learning에서 imbalance하게 학습이 되는 요인과 해결책을 제시하는 논문을 들고 왔습니다. 이전에 리뷰한 multimodal cooperation 논문 같은 경우와 비슷하면서도…
[CVPR 2021] Contrastive Learning for Compact Single Image Dehazing
안녕하세요, 이번에는 새로운 Image Dehazing 논문을 리뷰해보았습니다. haze(안개, 연기, 연무, 먼지, …) 이미지에 존재하는 haze를 없애는(dehazing) 이미지 전처리 과정이라고도 볼 수 있습니다. 제가 취득하고 있는…
[WACV 2024] Boosting Weakly Supervised Object Detection using Fusion and Priors from Hallucinated Depth
논문 이름이 꽤 깁니다. 금일 리뷰 하는 논문은 지난 GOOD 논문의 리뷰에 이어, Geometric Cue를 활용한 논문에 대해 읽어보고자 하였습니다. 해당 아이템을 제 논문에 적용하고…
[IEEE Transaction 2023] GraSS: Contrastive Learning With Gradient-Guided Sampling Strategy for Remote Sensing Image Semantic Segmentation
안녕하세요 정의철 연구원입니다. 이번 논문은 원격 감지 이미지(RSI:remote sensing image)에서 Self-supervised contrastive learning (SSCL) strategy에 대해 연구한 논문입니다. 이 논문을 읽게된 계기는 이미지넷과 같이 object…
[CVPR 2023] EcoTTA: Memory-Efficient Continual Test-time Adaptation via Self-distilled Regularization
오늘 리뷰할 논문은 CVPR 2023년도에 발표된 TTA 분야의 논문입니다.이전 방법론들과 비교했을 때 효율성 측면을 더욱 고려하여 모델 구조를 설계하고, 추가적으로 error accumulation, catastrophic forgetting 문제까지…
[Neurips 2020] What Makes for Good Views for Contrastive Learning
1. Introduction 대조 학습(contrastive multiview learning)은 동일한 장면의 두 view을 representation space에서 가깝게 하고, 다른 장면의 두 view을 멀어지게 합니다. 이는 자연스럽고 강력한 아이디어이지만 중요한…
[ECCV2022]Detecting Twenty-thousand Classes using Image-level Supervision
#676478 이번에 리뷰드릴 논문은 Object Detection 데이터셋의 다양성 한계를 극복하는 방법론을 다루는 논문입니다. Meta AI(이하, 메타)와 텍사스 대학에서 발표된 연구이며 ECCV 2022에 등재되었습니다. 그럼 리뷰를…
[NerulPS 2022] Flamingo: a Visual Language Model for Few-Shot Learning
당분간 LMM 및 여러 VLM를 리뷰해보려고 하는데요, 이번에 리뷰할 논문은 구글 딥마인드에서 발표한 Visual Language Model(VLM)인 Flamingo 라는 논문입니다. 제목에서와 같이 Few-shot으로도 다양한 task를 수행할…
[ICASSP 2023]Unifying Speech Enhancement and Separation with Gradient Modulation for End-to-End Noise-Robust Speech Separation
본 논문은 speech enhancemeht와 speech separation task를 e2e 방식으로 수행하며, downstream인 separation에 유효한 정보의 손실을 막기 위해 gradient modulation을 사용하는 방법론에 관한 것으로, speech enhancemet를…
최신 댓글