Category: Paper
Paper Review
[ICCV 2019] Meta Learning to Detect Rare Objects
안녕하세요. 스무 번째 리뷰입니다. 관심 영역의 새로운 태스크 논문을 읽는 것이 아직 쉽지 않네요. 이해력이 아직 부족하지만 Few-shot, Meta-learning을 Detection에 활용한 분야에 더욱 관심과 지식을…
[CVPR 2023] Boosting Weakly-Supervised Temporal Action Localization with Text Information
이런 분들께 이 논문을 추천드립니다. Weakly Supervised Temporal Action Localization의 최신 방법론이 궁굼하신 분 Weakly Supervised Learning에 Text label을 Training signal로 사용하는 방식에 흥미가 있으신…
[RA-L 2019] SilhoNet: An RGB Method for 6D Object Pose Estimation
안녕하세요. 이번에도 6D pose estimation 방법론에 대한 논문을 리뷰해보았습니다. CNN-based 논문이기 때문에 전체적인 네트워크 구조 자체는 어렵지 않으나 디테일한 방법들은 여전히 어려운 것 같습니다. 리뷰…
Faster R CNN, ResNet, FPN (Part.1)
Before Review 이번 리뷰는 Object Detection(Faster R CNN , FPN)과 ResNet에 대해서 다루게 되었습니다. 지금 해야 되는 실험이 Faster R CNN + ResNet50 + FPN…
[ICIP 2023] TR3D: TOWARDS REAL-TIME INDOOR 3D OBJECT DETECTION
안녕하세요, 열두번째 x-review 입니다. 이번 논문은 ICIP 2023에 게재된 TR3D라는 논문으로 RGB와 포인트 클라우드를 fusion하는 방식의 3D Object Detection 논문 입니다. 그럼 바로 리뷰 시작하겠습니다 !…
[CVPR 2020] Momentum Contrast for Unsupervised Visual Representation Learning
안녕하세요, 허재연입니다. 이번에도 Representation Learning 논문을 들고 왔습니다. MoCo는 Kaiming He 등의 저자들이 Facebook AI Research에서 낸 논문으로, contrastive 기법을 이용한 self-supervised learning 방법들 중…
[IJCV 2022] Learning to Prompt for Vision-Language Models
안녕하세요. 이번 주 X-Review에서 소개해드릴 논문의 제목은 <Learning to Prompt for Vision-Language Models>입니다. 22년도 IJCV에 게재되었고, NLP 분야의 학습 기반 prompt learning 방법론을 영상 분야에…
[ICCV-2019] Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network
안녕하세요. 열 두 번째 X-Review입니다. 금주 리뷰할 논문은 ICCV 2019에 게재된 <Efficient and Accurate Arbitrary-Shaped Text Detection with Pixel Aggregation Network>입니다. 바로 시작하도록 하겠습니다. 1….
[CVPR 2023] Devil’s on the Edges : Selective Quad Attention for Scene Graph Generation
Before Review 제가 KCCV 2023에 참석하면서 알게 된 논문 입니다. 그전에도 알고 있긴 했지만 구체적인 내용은 몰랐고 이번 KCCV 다녀오면서 저자에게 직접 설명을 들으면서 궁금한…
[CVPR 2023] Revisiting Temporal Modeling for CLIP-based Image-to-Video Knowledge Transfering
이런 분들께 이 논문을 추천드립니다. Image-Text 모델인 CLIP을 Video Understanding에 활용하는 방법이 궁굼하신 분 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. CLIP에 대한 이해 (CLIP…
안녕하세요 재윤님 답글 감사합니다. 우선 "is playing" 이라는 질문이 있는지는 모르겠으나 전체 질문 문장을 모델에 입력으로 줬을때, video, audio 에…