[일:] 2023년 09월 03일
[NeurIPS 2021] VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and Text
오늘 리뷰할 논문은 transformers for multi model sept supervised to learning from low video, adeo and text라는 papar입니다. 본격적인 리뷰에 앞서 본 논문을 간단하게 소개하자면…
[CVPR 2021]DSC-PoseNet: Learning 6DoF Object Pose Estimation via Dual-scale Consistency
Abstract 3차원의 object pose를 annotation하는 것은 2D bounding box를 라벨링하는 것에 비해 어렵고, depth정보가 주어지지 않을 경우에는 더 어려운 문제입니다. 본 논문에서는 depth 이미지를 사용하지…
[ICIP 2023] TR3D: TOWARDS REAL-TIME INDOOR 3D OBJECT DETECTION
안녕하세요, 열두번째 x-review 입니다. 이번 논문은 ICIP 2023에 게재된 TR3D라는 논문으로 RGB와 포인트 클라우드를 fusion하는 방식의 3D Object Detection 논문 입니다. 그럼 바로 리뷰 시작하겠습니다 !…
[CVPR 2020] Momentum Contrast for Unsupervised Visual Representation Learning
이번에도 Representation Learning 논문을 들고 왔습니다. MoCo는 Kaiming He 등의 저자들이 Facebook AI Research에서 낸 논문으로, contrastive 기법을 이용한 self-supervised learning 방법들 중 SimCLR과 함께…
[IJCV 2022] Learning to Prompt for Vision-Language Models
안녕하세요. 이번 주 X-Review에서 소개해드릴 논문의 제목은 <Learning to Prompt for Vision-Language Models>입니다. 22년도 IJCV에 게재되었고, NLP 분야의 학습 기반 prompt learning 방법론을 영상 분야에…
[ICCV-2019] Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network
안녕하세요. 열 두 번째 X-Review입니다. 금주 리뷰할 논문은 ICCV 2019에 게재된 <Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network>입니다. 바로 시작하도록 하겠습니다. 1….
[CVPR2023] FastViT: A Fast Hybrid Vision Transformer using Structural Reparameterization
이번에 리뷰할 논문은 FastViT라는 논문입니다. 논문 제목에서 보실 수 있다시피 모델의 경량화에 초점을 맞추고 있습니다. 그리고 해당 논문을 쓴 저자들이 애플 소속이라서 단순히 GPU 뿐만…
[ICASSP 2023] Knowledge-Aware Bayesian Co-Attention for Multimodal Emotion Recognition
안녕하세요. 최근에 VQA 논문 리뷰하다가 다시 감정 인식 논문으로 돌아왔습니다. 이전에 external knowledge를 이용하여 ERC를 수행했던 논문을 읽은 경험이 있어서 multimodal emotion recognition 논문 중에서…
[CVPR 2023] Devil’s on the Edges : Selective Quad Attention for Scene Graph Generation
Before Review 제가 KCCV 2023에 참석하면서 알게 된 논문 입니다. 그전에도 알고 있긴 했지만 구체적인 내용은 몰랐고 이번 KCCV 다녀오면서 저자에게 직접 설명을 들으면서 궁금한…
최신 댓글