[카테고리:] Paper
Paper Review
[RA-L 2019] SilhoNet: An RGB Method for 6D Object Pose Estimation
안녕하세요. 이번에도 6D pose estimation 방법론에 대한 논문을 리뷰해보았습니다. CNN-based 논문이기 때문에 전체적인 네트워크 구조 자체는 어렵지 않으나 디테일한 방법들은 여전히 어려운 것 같습니다. 리뷰…
Faster R CNN, ResNet, FPN (Part.1)
Before Review 이번 리뷰는 Object Detection(Faster R CNN , FPN)과 ResNet에 대해서 다루게 되었습니다. 지금 해야 되는 실험이 Faster R CNN + ResNet50 + FPN…
[ICIP 2023] TR3D: TOWARDS REAL-TIME INDOOR 3D OBJECT DETECTION
안녕하세요, 열두번째 x-review 입니다. 이번 논문은 ICIP 2023에 게재된 TR3D라는 논문으로 RGB와 포인트 클라우드를 fusion하는 방식의 3D Object Detection 논문 입니다. 그럼 바로 리뷰 시작하겠습니다 !…
[CVPR 2020] Momentum Contrast for Unsupervised Visual Representation Learning
안녕하세요, 허재연입니다. 이번에도 Representation Learning 논문을 들고 왔습니다. MoCo는 Kaiming He 등의 저자들이 Facebook AI Research에서 낸 논문으로, contrastive 기법을 이용한 self-supervised learning 방법들 중…
[IJCV 2022] Learning to Prompt for Vision-Language Models
안녕하세요. 이번 주 X-Review에서 소개해드릴 논문의 제목은 <Learning to Prompt for Vision-Language Models>입니다. 22년도 IJCV에 게재되었고, NLP 분야의 학습 기반 prompt learning 방법론을 영상 분야에…
[ICCV-2019] Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network
안녕하세요. 열 두 번째 X-Review입니다. 금주 리뷰할 논문은 ICCV 2019에 게재된 <Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network>입니다. 바로 시작하도록 하겠습니다. 1….
[CVPR 2023] Devil’s on the Edges : Selective Quad Attention for Scene Graph Generation
Before Review 제가 KCCV 2023에 참석하면서 알게 된 논문 입니다. 그전에도 알고 있긴 했지만 구체적인 내용은 몰랐고 이번 KCCV 다녀오면서 저자에게 직접 설명을 들으면서 궁금한…
[CVPR 2023] Revisiting Temporal Modeling for CLIP-based Image-to-Video Knowledge Transfering
이런 분들께 이 논문을 추천드립니다. Image-Text 모델인 CLIP을 Video Understanding에 활용하는 방법이 궁굼하신 분 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. CLIP에 대한 이해 (CLIP…
[CVPR2022]Active Teacher for Semi-Supervised Object Detection
[go to paper: pdf] 본 논문의 주제인 Active Teacher는 무엇인가요? Active Teacher란 active learning의 특징처럼 “주기적인 학습”을 하며 “teacher-student 구조를 갖는” 형태의 학습을 의미합니다. 즉,…
[ECCV 2022] Prompting Visual-Language Models for Efficient Video Understanding
안녕하세요. 이번 주에 리뷰할 논문은 22년도 ECCV에 게재된 <Prompting Visual-Language Models for Efficient Video Understanding>입니다. 논문 제목에서의 Video Understanding은 보통 비디오를 다루는 모든 task를 통칭하며…
최신 댓글