[ICCV 2019] Meta Learning to Detect Rare Objects
안녕하세요. 스무 번째 리뷰입니다. 관심 영역의 새로운 태스크 논문을 읽는 것이 아직 쉽지 않네요. 이해력이 아직 부족하지만 Few-shot, Meta-learning을 Detection에 활용한 분야에 더욱 관심과 지식을…
[AAAI 2021] Robust Lightweight Facial Expression Recognition Network with Label Distribution Training
최근에 distilation 기반 모델 경량화 논문을 읽으면서 모델의 knowledge를 학습에 활용하는 방법론에 관심이 생겼는데요, 논문 서베이를 진행하다 Label distribution Training이라는 task가 있어 한 번 공부해볼…
[CVPR 2023] Boosting Weakly-Supervised Temporal Action Localization with Text Information
이런 분들께 이 논문을 추천드립니다. Weakly Supervised Temporal Action Localization의 최신 방법론이 궁굼하신 분 Weakly Supervised Learning에 Text label을 Training signal로 사용하는 방식에 흥미가 있으신…
[RA-L 2019] SilhoNet: An RGB Method for 6D Object Pose Estimation
안녕하세요. 이번에도 6D pose estimation 방법론에 대한 논문을 리뷰해보았습니다. CNN-based 논문이기 때문에 전체적인 네트워크 구조 자체는 어렵지 않으나 디테일한 방법들은 여전히 어려운 것 같습니다. 리뷰…
Faster R CNN, ResNet, FPN (Part.1)
Before Review 이번 리뷰는 Object Detection(Faster R CNN , FPN)과 ResNet에 대해서 다루게 되었습니다. 지금 해야 되는 실험이 Faster R CNN + ResNet50 + FPN…
[CVPR 2022]Uni6D: A Unified CNN Framework without Projection Breakdown for 6D Pose Estimation
제가 이번에 리뷰할 논문은 Uni6D라는 논문입니다. 6D Pose Estimation 논문으로, RGBD를 입력으로 사용할 때, RGB와 D를 동일한 Feature Extractor를 이용한다는 점이 흥미로워 가져왔습니다. Abstract RGB-D…
[CVPR 2023] Exploring Discontinuity for Video Frame Interpolation
안녕하세요. 오늘은 좀 새로운 분야의 논문을 가져왔습니다. 바로 Video Frame interpolation인데요. 요즘 하는 실험과 논문에서 말하는 내용이 도움이 될까 싶어서 읽었는데, 될 것 같기도 하고…
[CVPR2021](Oral)RobustNet: Improving Domain Generalization in Urban-Scene Segmentation via Instance Selective Whitening
이번에 소개드릴 논문은 21년도 CVPR에 게재된 RobustNet이라는 방법론입니다. 해당 논문은 Semantic Segmentation task의 Domain Generalization 성능을 향상시키기 위한 방법론입니다. Intro 먼저 Domain Generalization에 대해서 간단히…
[CVPR 2022] LDM: High-Resolution Image Synthesis with Latent Diffusion Models
이번 리뷰 논문은 Diffusion model을 다루고자 합니다. 이번 Diffusion model은 그중 가장 유명한 방법론에 해당하는 stable diffusion을 다루고자 합니다. stable diffusion의 정식 명칭은 Latent Diffusion…
[NeurIPS 2021] VATT: Transformers for Multimodal Self-Supervised Learning from Raw Video, Audio and Text
오늘 리뷰할 논문은 transformers for multi model sept supervised to learning from low video, adeo and text라는 papar입니다. 본격적인 리뷰에 앞서 본 논문을 간단하게 소개하자면…
안녕하세요 질문 남겨주셔서 감사합니다 논문에서는 CTR 데이터에 대한 결과와 비교하면서 STR의 경우 이미지 내 텍스트가 갖는 특징 자체가 보다 덜…