Exploring Simple Siamese Representation Learning
°•°• 요약 •°•° siamese network의 collapsing solution 수렴을 막는 요인은 stop-gradient 다. °•°• 소개 •°•° 많은 self-learning 방법이 siamese network를 이용한다. 그리고 이러한 방법론은 주로…
[2020 arxiv] PP-YOLO: An Effective and Efficient Implementation of Object Detector
논문 소개하기전 안녕하세요. 제가 이번에 소개해드릴 논문은 PP-YOLO라고 불리는 논문입니다. 중국의 유명회사인 바이두에서 공개한 논문이고, 제목이 PP-YOLO인 이유도 바이두에서 사용하는 딥러닝 플랫폼인 PaddlePaddle로 implementation 하였기…
[ACCV 2018 Workshops] Summarizing Videos with Attention
이번 논문도 video summarization입니다. 이 논문은 RNN과 LSTM을 많이 사용하던 video summarization에 long-range dependence를 보존하기 위해 attention mechanism을 처음으로 적용한 논문입니다. 코드도 공개하고 있는데, 간단하긴…
[CVPR 2021] Action Unit Memory Network for Weakly Supervised Temporal Action Localization
Before Review 이번에도 Weakly supervised temporal localization 논문으로 준비를 했습니다. LSTM을 공부할 때 접했던 개념인 memory 개념을 Weakly supervised temporal action localization에 처음으로 도입한 논문이라고…
[ICCV2021] Is Pseudo-Lidar needed for Monocular 3D Object detection?
안녕하세요 한대찬 연구원입니다. 이번에 가져온 논문은 Monocular 3D object detection 관련 논문입니다. 저는 지속적으로 Self-supervised monocular depth estimation과 관련된 논문을 서베이와 연구를 진행하고 있습니다. 제가…
Defect Detection for Electrical Facilities based on Multispectral Imagery,” Journal of Institute of Control, Robotics, and Systems (JICROS), March 2022.
URP 조교를 마무리 하며 @이현주
저는 작년 여름 6기 URP에서 멘티였었고, 이번 겨울 7기 URP에서는 멘토로 활동했습니다. 우선 사전에 머신비전 시스템 강의를 보고 관련 이론 공부를 하고, 인공지능 수업 때…
[CVPR 2020] Momentum Contrast for Unsupervised Visual Representation Learning
[Link] Momentum Contrast for Unsupervised Visual Representation Learning Self-Supervised 의 대표적인 방법론인 Moco를 리뷰하겠습니다. Introduction MoCo는 contrastive loss를 사용하는 self-supervised model 입니다. 당시 contrastive learning…
[AAAI 2021] Enhancing Unsupervised Video Representation Learning by Decoupling the Scene and the Motion
오늘 리뷰할 논문은 AAAI 2021에 accept된 “Enhancing Unsupervised Video Representation Learning by Decoupling the Scene and the Motion” 이라는 논문 입니다. 최근 video representation을 목적으로한…
Bootstrap Your Own Latent A New Approach to Self-Supervised Learning
요약self-supervised image representation learning 을 위한 새로운 접근법으로 제안하는 Bootstrap Your Own Latent (BYOL) 를 소개하는 논문이다. Neural Information Processing Systems에 2020년 공개된 논문으로 당시에…
1. CTC 기반의 텍스트 인식 모델의 학습 과정에 대해 설명을 드리면 대답이 될 것 같네요! 입력된 텍스트 이미지[H x W…