Author: 황 유진
TSP: Temporally-Sensitive Pretraining of Video Encoders for Localization Tasks
논문이 집중한 문제해당 논문은 Temporal Action Localization, Action Proposal Generation, Dense Video Captioning 세가지 task의 성능을 향상 시키기 위한 pretrain 기법을 소개하는 논문이다. 본 논문에서…
Consistency-based Active Learning for Object Detection
본 논문은 Active Learning에 관한 논문이다. learning-based 알고리즘의 가장 큰 bottlenecks 중 하나는 labeled data의 부족이다. 이를 해결하기 위해 unlabeled, semi-supervised learning 기법들이 소개되었으나, 몇몇…
ACTION-Net: Multipath Excitation for Action Recognition
논문 소개본 논문은 video understanding의 핵심적인 문제인 video action recognition task를 해결하기 위한 모델을 2D CNNs, 3D CNNs으로 나눈다. 본 논문은 2D CNNs는 비디오의 시간적…
Circle Loss: A Unified Perspective of Pair Similarity Optimization
소개 본 논문은 Contrastive Learning 에서 유사성 최적화에 대한 새로운 관점을 소개한다. Contrastive Learning 은 Self-supervised learning에서 많이 사용되는 접근법으로 한국어로는 대조 학습이라 불리며 within-class(클리스…
Only Time Can Tell: Discovering Temporal Data for Temporal Modeling
본 논문은 기존의 temporal understanding을 진행하지 않았던 (비디오 중 하나의 영상으로만 예측을 진행했던) 학습법의 문제를 언급하며 이에 대한 원인으로 데이터셋의 문제를 든다. 따라서 frame shuffling이…
“3rd Place Solution to NAVER LABS Mapping & Localization Challenge 2020: Outdoor Track,” 33rd Workshop on Image Processing and Image Understanding (IPIU), Feb 2021.
“실내 수직농장의 재배 제어 방식 자동화를 위한 영상 기반의 작물 성장 상태 모니터링,” 33rd Workshop on Image Processing and Image Understanding (IPIU), Feb 2021.
FRAME ATTENTION NETWORKS FOR FACIAL EXPRESSION RECOGNITION IN VIDEOS
SMART논문을 보다가 보게 된 논문이다. 논문을 소개하기 전에 SMART에서 나온 Attention and Relation models에 대해 소개하겠다. (SMART는 지난번 리뷰한 논문으로 링크는 다음과 같다)1. Attentionattention의 개념은…
다중 스펙트럼 영상 변환 방법 및 그 장치, (10-23249160000) 등록완료
다중 스펙트럼 영상 변환 방법 및 그 장치 2020.02.14. 특허 출원 완료 (10-2020-0018234) 2021.06.29 보정서 제출 완료 2021.11.05. 특허 등록 완료 (10-23249160000)
최신 댓글