Category: X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[ICCVw 2017] Introducing MVTec ITODD – A Dataset for 3D Object Recognition in Industry
안녕하세요, 이번에는 BOP 챌린지의 코어 데이터셋 중 하나인 ITODD 데이터셋에 대해 리뷰해보았습니다. 원래는 다른 논문을 읽었는데 이해가 잘 안가는 부분이 많이 이번 논문으로 읽게 되었네요.. ?…
[ACM MM 2023] MH-DETR: Video Moment and Highlight Detection with Cross-modal Transformer
안녕하세요, 이번 X-Review에선 23년도 MM 학회에 게재된 MH-DETR이라는 논문을 소개해드리고자 합니다. 기본적으로 저번 리뷰에서도 설명드렸던 Moment Retrieval (MR)과 Highlight Detection (HD)를 동시에 수행하는 방법론 중…
[arXiv 2024] Grounded SAM: Assembling Open-World Models for Diverse Visual Tasks
이번 리뷰는 Grounding-DINO와 SAM을 결합한 Grounded SAM이란 기법에 대한 기술 보고서에 대한 내용입니다. 해당 내용에서는 다양한 태스크들을 어떻게 수행했는지에 대한 내용들이 작성되어져 있습니다. 해당 리뷰를…
[ICLR 2022] Understanding Dimensional Collapse In Contrastive Self-Supervised Learning
안녕하세요. 허재연입니다. 이번 주차 세미나에서 Self-Supervised Learning의 collapse 문제에 대한 언급이 있었는데요, 이에 관심이 생겨 관련 논문을 읽어보게 되었습니다. 제목에서 알 수 있다시피 contrastive learning의…
[NIPS 2017] Neural Discrete Representation Learning
오늘은 평소 리뷰했던 논문과는 다소 다른 분야의 논문을 리뷰하려고 합니다. 최근 GPT를 사용하며 그림을 그려달라는 요청을 할 때, 잘 워킹하는 것을 보고 이게 어떤 원리지?…
[ICLR 2023 Oral] Towards Stable Test-Time Adaptation in Dynamic Wild World
오늘 리뷰할 논문도 마찬가지로 TTA와 관련된 논문입니다.제목 속의 Dynamic Wild World 라는 워딩이 매력적으로 보여서 읽어보게 되었는데, contribution적인 부분 보다도 wild world상황에서 등장할 수 있는…
[ICCV2023]Unified Coarse-to-Fine Alignment for Video-Text Retrieval
안녕하세요. 오늘 다룰 논문은 ICCV 2023의 Unified Coarse-to-Fine Alignment for Video-Text Retrieval(UCoFIA)입니다. CLIP 기반의 text-video task에서 SOTA를 달성했었던 모델입니다. Abstract Moment Retrieval에서 흔히 사용되는 방법…
[arXiv 2023] Point-GCC: Universal Self-supervised 3D Scene Pre-training via Geometry-Color Contrast
안녕하세요, 서른 한번째 x-review 입니다. 이번 논문은 2023년도 arXiv에 올라온 Point-GCC: Universal Self-supervised 3D Scene Pre-training via Geometry-Color Contrast입니다. 일년 동안 SUN RGB-D 데이터셋에서 SOTA를…
[CVPR 2023] Query-Dependent Video Representation for Moment Retrieval and Highlight Detection
안녕하세요. 이번 주 X-Review에서는 23년도 CVPR에 게재된 <Query-Dependent Video Representation for Moment Retrieval and Highlight Detection>이라는 논문을 소개해드리겠습다. 성균관대 허재필 교수님 연구실에서 나온 논문이며, 해당…
[INTERSPEECH 2021] Rethinking Evaluation in ASR: Are Our Models Robust Enough?
이번이 읽은 논문은 Interspeech 2021에서 발표된 “Rethinking Evaluation in ASR: Are Our Models Robust Enough?”논문으로, 음성인식 task에 관한 논문입니다. 음성 모델의 일반화 성능을 올리기 위해…
안녕하세요 태주님 댓글 감사합니다. 답변을 드리자면, A1. 저자가 real data 수를 바꿔가며 실험을 진행할 때, Real data가 150개일땐 Real data…