Author: 황 유진

Posted in Paper X-Review

Contrastive Learning of Image Representations with Cross-Video Cycle-Consistency

논문 소개본 논문은 에서 다루는 contrastive Learning는 self-supervised learning 에서 주로 사용되는 학습 기법으로, 군집 내의 (positive pair)간의 유사도를 높이고, 군집 간의 (negative pair) 유사도를…

Continue Reading
Posted in Paper X-Review

Weakly Supervised Action Selection Learning in Video

소개 [Link]본 논문은 video에서 action part를 찾는 task 를 위한 논문이다(Temporal action localization task 이하, TAL).기존의 Weakly Supervised 기반의 TAL 방법론들은 비디오 단위의 레이블을 이용하여…

Continue Reading
Posted in Paper X-Review

TSP: Temporally-Sensitive Pretraining of Video Encoders for Localization Tasks

논문이 집중한 문제해당 논문은 Temporal Action Localization, Action Proposal Generation, Dense Video Captioning 세가지 task의 성능을 향상 시키기 위한 pretrain 기법을 소개하는 논문이다. 본 논문에서…

Continue Reading
Posted in Paper X-Review

Consistency-based Active Learning for Object Detection

본 논문은 Active Learning에 관한 논문이다. learning-based 알고리즘의 가장 큰 bottlenecks 중 하나는 labeled data의 부족이다. 이를 해결하기 위해 unlabeled, semi-supervised learning 기법들이 소개되었으나, 몇몇…

Continue Reading
Posted in Paper X-Review

ACTION-Net: Multipath Excitation for Action Recognition

논문 소개본 논문은 video understanding의 핵심적인 문제인 video action recognition task를 해결하기 위한 모델을 2D CNNs, 3D CNNs으로 나눈다. 본 논문은 2D CNNs는 비디오의 시간적…

Continue Reading
Posted in Paper X-Review

Circle Loss: A Unified Perspective of Pair Similarity Optimization

소개 본 논문은 Contrastive Learning 에서 유사성 최적화에 대한 새로운 관점을 소개한다. Contrastive Learning 은 Self-supervised learning에서 많이 사용되는 접근법으로 한국어로는 대조 학습이라 불리며 within-class(클리스…

Continue Reading
Posted in Paper X-Review

Only Time Can Tell: Discovering Temporal Data for Temporal Modeling

본 논문은 기존의 temporal understanding을 진행하지 않았던 (비디오 중 하나의 영상으로만 예측을 진행했던) 학습법의 문제를 언급하며 이에 대한 원인으로 데이터셋의 문제를 든다. 따라서 frame shuffling이…

Continue Reading
Posted in Paper X-Review

FRAME ATTENTION NETWORKS FOR FACIAL EXPRESSION RECOGNITION IN VIDEOS

SMART논문을 보다가 보게 된 논문이다. 논문을 소개하기 전에 SMART에서 나온 Attention and Relation models에 대해 소개하겠다. (SMART는 지난번 리뷰한 논문으로 링크는 다음과 같다)1. Attentionattention의 개념은…

Continue Reading
Posted in Paper X-Review

What Makes a Video a Video: Analyzing Temporal Information in Video Understanding Models and Datasets

본 논문은 Do these Models Really Capture Temporal Information? 라는 질문에 관한 논문이다. 보통 모델이 깊어질수록 낮은 수준의 정보는 점점 사라진다. 아래 그림1은 원본 비디오…

Continue Reading
Posted in Paper X-Review

SMART Frame Selection for Action Recognition

본 논문은 action recognition을 위한 video frame selection 문제를 다룬다. 아카이브 기준으로 2020.12.19일 공개 되어 코드는 공개되지 않았다.명칭을 SMART frame selection으로 하였는데 SMART는 Sampling through…

Continue Reading