[ICLR 2022] Understanding Dimensional Collapse In Contrastive Self-Supervised Learning
안녕하세요. 허재연입니다. 이번 주차 세미나에서 Self-Supervised Learning의 collapse 문제에 대한 언급이 있었는데요, 이에 관심이 생겨 관련 논문을 읽어보게 되었습니다. 제목에서 알 수 있다시피 contrastive learning의…
[NIPS 2017] Neural Discrete Representation Learning
오늘은 평소 리뷰했던 논문과는 다소 다른 분야의 논문을 리뷰하려고 합니다. 최근 GPT를 사용하며 그림을 그려달라는 요청을 할 때, 잘 워킹하는 것을 보고 이게 어떤 원리지?…
[ICLR 2023 Oral] Towards Stable Test-Time Adaptation in Dynamic Wild World
오늘 리뷰할 논문도 마찬가지로 TTA와 관련된 논문입니다.제목 속의 Dynamic Wild World 라는 워딩이 매력적으로 보여서 읽어보게 되었는데, contribution적인 부분 보다도 wild world상황에서 등장할 수 있는…
[ICCV2023]Unified Coarse-to-Fine Alignment for Video-Text Retrieval
안녕하세요. 오늘 다룰 논문은 ICCV 2023의 Unified Coarse-to-Fine Alignment for Video-Text Retrieval(UCoFIA)입니다. CLIP 기반의 text-video task에서 SOTA를 달성했었던 모델입니다. Abstract Moment Retrieval에서 흔히 사용되는 방법…
[arXiv 2023] Point-GCC: Universal Self-supervised 3D Scene Pre-training via Geometry-Color Contrast
안녕하세요, 서른 한번째 x-review 입니다. 이번 논문은 2023년도 arXiv에 올라온 Point-GCC: Universal Self-supervised 3D Scene Pre-training via Geometry-Color Contrast입니다. 일년 동안 SUN RGB-D 데이터셋에서 SOTA를…
[CVPR 2023] Query-Dependent Video Representation for Moment Retrieval and Highlight Detection
안녕하세요. 이번 주 X-Review에서는 23년도 CVPR에 게재된 <Query-Dependent Video Representation for Moment Retrieval and Highlight Detection>이라는 논문을 소개해드리겠습다. 성균관대 허재필 교수님 연구실에서 나온 논문이며, 해당…
[INTERSPEECH 2021] Rethinking Evaluation in ASR: Are Our Models Robust Enough?
이번이 읽은 논문은 Interspeech 2021에서 발표된 “Rethinking Evaluation in ASR: Are Our Models Robust Enough?”논문으로, 음성인식 task에 관한 논문입니다. 음성 모델의 일반화 성능을 올리기 위해…
[CVPR 2023] Pooling Revisited: Your Receptive Field is Suboptimal
안녕하세요, 서른세 번째 X-Review입니다. 이번 논문은 2023년도 CVPR에 올라온 Pooling Revisited: Your Receptive Filed is Suboptimal입니다. 바로 시작하도록 하겠습니다. ? 1. Introduction Computer vision을 포함한…
[NeurIPS 2020] Bootstrap Your Own Latent A New Approach to Self-Supervised Learning
안녕하세요 정의철 연구원입니다. 제가 이번에 소개할 논문은 ‘Bootstrap Your Own Latent A New Approach to Self-Supervised Learning’이고 흔히 BYOL이라고 불리는 논문입니다. 저는 최근 Self-supervised learning…
[CVPR 2021] Towards Open World Object Detection – Code Review
안녕하세요. 이번 주는 논문 리뷰가 아닌, OWOD 논문의 코드 리뷰를 진행해보고자 합니다. 제가 OWOD (Open World Object Detection)에 관한 연구를 진행하고 있음은 다들 아실텐데요, 본…
1. CTC 기반의 텍스트 인식 모델의 학습 과정에 대해 설명을 드리면 대답이 될 것 같네요! 입력된 텍스트 이미지[H x W…