[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[ICASSP 2024] SERC-GCN: Speech Emotion Recognition In Conversation Using Graph Convolutional Networks
저번 리뷰에서는 텍스트 위주의 논문을 읽었다면, 이번에는 speech 단일 모달에서는 ERC를 어떻게 해결하고 있지라는 궁금증이 들어 ICASSP 논문을 가지고 와봤습니다. 이제까지 multi-modal ERC 논문 혹은…
[ICLR 2022] Learning strides in convolutional neural networks
안녕하세요, 서른네 번째 X-Review입니다. 이번 논문은 2022년도 ICLR에 게재된 Learning strides in convolutional neural networks입니다. 바로 시작하도록 하겠습니다. 👽 1. Introduction CNN은 이미지 분류, 오디오…
[ICCVw 2023] SAM3D: Segment Anything in 3D Scenes
안녕하세요, 서른 두번째 x-review 입니다. 이번 논문은 2023년도 ICCV workshop에 게재된 SAM3D: Segment Anything in 3D Scenes 입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction…
[ICCVw 2017] Introducing MVTec ITODD – A Dataset for 3D Object Recognition in Industry
안녕하세요, 이번에는 BOP 챌린지의 코어 데이터셋 중 하나인 ITODD 데이터셋에 대해 리뷰해보았습니다. 원래는 다른 논문을 읽었는데 이해가 잘 안가는 부분이 많이 이번 논문으로 읽게 되었네요.. 🥲…
[ACM MM 2023] MH-DETR: Video Moment and Highlight Detection with Cross-modal Transformer
안녕하세요, 이번 X-Review에선 23년도 MM 학회에 게재된 MH-DETR이라는 논문을 소개해드리고자 합니다. 기본적으로 저번 리뷰에서도 설명드렸던 Moment Retrieval (MR)과 Highlight Detection (HD)를 동시에 수행하는 방법론 중…
[arXiv 2024] Grounded SAM: Assembling Open-World Models for Diverse Visual Tasks
이번 리뷰는 Grounding-DINO와 SAM을 결합한 Grounded SAM이란 기법에 대한 기술 보고서에 대한 내용입니다. 해당 내용에서는 다양한 태스크들을 어떻게 수행했는지에 대한 내용들이 작성되어져 있습니다. 해당 리뷰를…
[ICLR 2022] Understanding Dimensional Collapse In Contrastive Self-Supervised Learning
안녕하세요. 허재연입니다. 이번 주차 세미나에서 Self-Supervised Learning의 collapse 문제에 대한 언급이 있었는데요, 이에 관심이 생겨 관련 논문을 읽어보게 되었습니다. 제목에서 알 수 있다시피 contrastive learning의…
[NIPS 2017] Neural Discrete Representation Learning
오늘은 평소 리뷰했던 논문과는 다소 다른 분야의 논문을 리뷰하려고 합니다. 최근 GPT를 사용하며 그림을 그려달라는 요청을 할 때, 잘 워킹하는 것을 보고 이게 어떤 원리지?…
[ICLR 2023 Oral] Towards Stable Test-Time Adaptation in Dynamic Wild World
오늘 리뷰할 논문도 마찬가지로 TTA와 관련된 논문입니다.제목 속의 Dynamic Wild World 라는 워딩이 매력적으로 보여서 읽어보게 되었는데, contribution적인 부분 보다도 wild world상황에서 등장할 수 있는…
[ICCV2023]Unified Coarse-to-Fine Alignment for Video-Text Retrieval
안녕하세요. 오늘 다룰 논문은 ICCV 2023의 Unified Coarse-to-Fine Alignment for Video-Text Retrieval(UCoFIA)입니다. CLIP 기반의 text-video task에서 SOTA를 달성했었던 모델입니다. Abstract Moment Retrieval에서 흔히 사용되는 방법…
최신 댓글