[월:] 2023년 09월

Posted in X-Review

[CVPR 2023] Exploring Discontinuity for Video Frame Interpolation

안녕하세요. 오늘은 좀 새로운 분야의 논문을 가져왔습니다. 바로 Video Frame interpolation인데요. 요즘 하는 실험과 논문에서 말하는 내용이 도움이 될까 싶어서 읽었는데, 될 것 같기도 하고…

Continue Reading
Posted in Conference X-Review

[CVPR2021](Oral)RobustNet: Improving Domain Generalization in Urban-Scene Segmentation via Instance Selective Whitening

이번에 소개드릴 논문은 21년도 CVPR에 게재된 RobustNet이라는 방법론입니다. 해당 논문은 Semantic Segmentation task의 Domain Generalization 성능을 향상시키기 위한 방법론입니다. Intro 먼저 Domain Generalization에 대해서 간단히…

Continue Reading
Posted in Conference X-Review

[CVPR 2022] LDM: High-Resolution Image Synthesis with Latent Diffusion Models

이번 리뷰 논문은 Diffusion model을 다루고자 합니다. 이번 Diffusion model은 그중 가장 유명한 방법론에 해당하는 stable diffusion을 다루고자 합니다. stable diffusion의 정식 명칭은 Latent Diffusion…

Continue Reading
Posted in X-Review

[NeurIPS 2021] VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and Text

오늘 리뷰할 논문은 transformers for multi model sept supervised to learning from low video, adeo and text라는 papar입니다. 본격적인 리뷰에 앞서 본 논문을 간단하게 소개하자면…

Continue Reading
Posted in X-Review

[CVPR 2021]DSC-PoseNet: Learning 6DoF Object Pose Estimation via Dual-scale Consistency

Abstract 3차원의 object pose를 annotation하는 것은 2D bounding box를 라벨링하는 것에 비해 어렵고, depth정보가 주어지지 않을 경우에는 더 어려운 문제입니다. 본 논문에서는 depth 이미지를 사용하지…

Continue Reading
Posted in Paper X-Review

[ICIP 2023] TR3D: TOWARDS REAL-TIME INDOOR 3D OBJECT DETECTION

안녕하세요, 열두번째 x-review 입니다. 이번 논문은 ICIP 2023에 게재된 TR3D라는 논문으로 RGB와 포인트 클라우드를 fusion하는 방식의 3D Object Detection 논문 입니다. 그럼 바로 리뷰 시작하겠습니다 !…

Continue Reading
Posted in Paper X-Review

[CVPR 2020] Momentum Contrast for Unsupervised Visual Representation Learning

이번에도 Representation Learning 논문을 들고 왔습니다. MoCo는 Kaiming He 등의 저자들이 Facebook AI Research에서 낸 논문으로, contrastive 기법을 이용한 self-supervised learning 방법들 중 SimCLR과 함께…

Continue Reading
Posted in Paper X-Review

[IJCV 2022] Learning to Prompt for Vision-Language Models

안녕하세요. 이번 주 X-Review에서 소개해드릴 논문의 제목은 <Learning to Prompt for Vision-Language Models>입니다. 22년도 IJCV에 게재되었고, NLP 분야의 학습 기반 prompt learning 방법론을 영상 분야에…

Continue Reading
Posted in News Paper X-Review

[ICCV-2019] Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network

안녕하세요. 열 두 번째 X-Review입니다. 금주 리뷰할 논문은 ICCV 2019에 게재된 <Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network>입니다. 바로 시작하도록 하겠습니다. 1….

Continue Reading
Posted in Conference X-Review

[CVPR2023] FastViT: A Fast Hybrid Vision Transformer using Structural Reparameterization

이번에 리뷰할 논문은 FastViT라는 논문입니다. 논문 제목에서 보실 수 있다시피 모델의 경량화에 초점을 맞추고 있습니다. 그리고 해당 논문을 쓴 저자들이 애플 소속이라서 단순히 GPU 뿐만…

Continue Reading