Author: 황 유진

Posted in Paper X-Review

A Large-Scale Study on Unsupervised Spatiotemporal Representation Learning

해당 논문은 이미지 기반 unsupervised 방법론 모델을 통해 video에 대한 representation learning 실험을 진행한다.이미지 기반 방법론은 SimCLR, MoCo, BYOL, SwAV를 이용한다. 이미지기반 unsupervised 방법론들은 하나의…

Continue Reading
Posted in Paper X-Review

[CVPR2021] On Semantic Similarity in Video Retrieval

해당 논문은 Semantic Similarity의 범위에 대해 논하는 논문이다. 처음 논문을 선택한 이유는 similarity의 범위에 대해 분석하고 있는 내용인지 궁금하여 선택하였다. 해당 논문에서 다루는 video retrieval은…

Continue Reading
Posted in Paper X-Review

A Generalizable Approach to Learning Optimizers

[논문 Link]논문에서 정의한 문제:deep neural network optimization을 자동적으로 하지 못하는 이유는 무엇일까? 대부분의 학습이 학습의 상황(훈련된 모델 등)에 의존적이기 때문이다. 해당 연구는 일반화에 초점을 맞춘…

Continue Reading
Posted in X-Review

Energy-Based model for self-supervised learning

본 리뷰는 해당 영상을 참고하였습니다. 1. 왜 Self-supervised learning을 연구해야 하는가AI와 Machine Learning 에는 다음의 3가지 도전과제가 있다.1. 적은 labeled samples 로 학습하기2. 추론을 위한…

Continue Reading
Posted in Peer Review X-Review

보호된 글: [ICCV 2021, PeerReview] 2478

보호하고 있는 글이라서 요약이 없습니다.

Continue Reading
Posted in Paper X-Review

Contrastive Learning of Image Representations with Cross-Video Cycle-Consistency

논문 소개본 논문은 에서 다루는 contrastive Learning는 self-supervised learning 에서 주로 사용되는 학습 기법으로, 군집 내의 (positive pair)간의 유사도를 높이고, 군집 간의 (negative pair) 유사도를…

Continue Reading
Posted in Paper X-Review

Weakly Supervised Action Selection Learning in Video

소개 [Link]본 논문은 video에서 action part를 찾는 task 를 위한 논문이다(Temporal action localization task 이하, TAL).기존의 Weakly Supervised 기반의 TAL 방법론들은 비디오 단위의 레이블을 이용하여…

Continue Reading
Posted in Paper X-Review

TSP: Temporally-Sensitive Pretraining of Video Encoders for Localization Tasks

논문이 집중한 문제해당 논문은 Temporal Action Localization, Action Proposal Generation, Dense Video Captioning 세가지 task의 성능을 향상 시키기 위한 pretrain 기법을 소개하는 논문이다. 본 논문에서…

Continue Reading
Posted in Paper X-Review

Consistency-based Active Learning for Object Detection

본 논문은 Active Learning에 관한 논문이다. learning-based 알고리즘의 가장 큰 bottlenecks 중 하나는 labeled data의 부족이다. 이를 해결하기 위해 unlabeled, semi-supervised learning 기법들이 소개되었으나, 몇몇…

Continue Reading
Posted in Paper X-Review

ACTION-Net: Multipath Excitation for Action Recognition

논문 소개본 논문은 video understanding의 핵심적인 문제인 video action recognition task를 해결하기 위한 모델을 2D CNNs, 3D CNNs으로 나눈다. 본 논문은 2D CNNs는 비디오의 시간적…

Continue Reading