Author: 조 원
[CVPR2018] What Makes a Video a Video: Analyzing Temporal Information in Video Understanding Models and Datasets
이번 리뷰에서 다룰 논문은 Video-to-video retrieval 연구를 하면서 video의 특성에 대해 재고할 기회를 준 “What Makes a Video a Video” 입니다. 이 논문은 이전 황유진…
“3rd Place Solution to NAVER LABS Mapping & Localization Challenge 2020: Indoor Track,” 33rd Workshop on Image Processing and Image Understanding (IPIU), Feb 2021.
발표자료 : [pdf]
[NeurIPS 2020] FixMatch: Simplifying Semi-Supervised Learning with Consistency and Confidence
일반적으로 딥러닝을 시작할 때, 데이터와 그에 대한 label로 학습하는 Supervised Learning을 먼저 접하게 됩니다. Supervised Learning 내의 Classification 분야같은 경우 이미지 내 물체의 종류에 대해서만…
[ICCV 2019] SlowFast Networks for Video Recognition
이 논문은 사람의 시각 인식 세포가 Fast motion과 Slow motion에 동시에 반응하는 것에서 영감을 얻게된 논문입니다. 주로 어떤 사람이 걷다가 속도를 올려 뛰게 된다해도 그…
[ECCV2020] AR-Net: Adaptive Frame Resolution for Efficient Action Recognition
동적인 비디오 프레임 선정과 관련된 방법론을 서베이하던 중 특이한 논문이 있었고, 이 논문의 이름은 AR-Net이며 효율성을 고려했을때 비디오의 프레임마다 다른 scale을 선정하는 방법론을 제안합니다. 이…
[arXiv2019] ViSiL: Fine-grained Spatio-Temporal Video Similarity Learning
해당 논문은 video들 간의 similarity를 계산하기 위해 방법론인 ViSiL을 제안한 논문입니다. 주로 video-to-video retrieval시 video의 전체 frame에서 spatio-temporal한 정보를 추출하고 이를 aggregate하여 하나의 vector로 만들게…
[IEEE 2019] FIVR: Fine-grained Incident Video Retrieval
Image retrieval의 경우, 주로 query 한 장에 대해 유사한 영상을 한 장씩 찾아내게 됩니다. 그러나 비디오는 영상처럼 한 장으로 길이가 정해져 있는 것이 아닌 각기…
네이버 초청 세미나 리뷰
지난 주 월요일에 온라인으로 네이버 연구원 두 분의 세미나를 듣게 되어 리뷰를 작성합니다. 세미나의 큰 주제는 metric learning에 관한 것이었습니다. 주로 같은 것을 더 같게,…
[KCCV 2020] Consistency-based Semi-supervised learning for object Detection (NeurIPS2019)
이번 KCCV 2020 기간에 다른 프로젝트와 겹치면서 주의 깊게 못들었어서 녹화된 영상으로 다시 시청하게 되었습니다. 영상을 들으면서 인상 깊었던 논문을 이 글을 통해 리뷰해보려합니다. 첫번째는…
[CVPR 2019] Long-Term Feature Banks for Detailed Video Understanding
기존 Video 에서 action recognition 연구를 할 때 주로 2~5초 가량의 clip을 추출하여 예측했었습니다. 그러나 현재의 어떤 행동을 판단하기 위해서는 과거와 미래라는 맥락 또한 중요시…
최신 댓글