Author: 황 유진
Only Time Can Tell: Discovering Temporal Data for Temporal Modeling
본 논문은 기존의 temporal understanding을 진행하지 않았던 (비디오 중 하나의 영상으로만 예측을 진행했던) 학습법의 문제를 언급하며 이에 대한 원인으로 데이터셋의 문제를 든다. 따라서 frame shuffling이…
FRAME ATTENTION NETWORKS FOR FACIAL EXPRESSION RECOGNITION IN VIDEOS
SMART논문을 보다가 보게 된 논문이다. 논문을 소개하기 전에 SMART에서 나온 Attention and Relation models에 대해 소개하겠다. (SMART는 지난번 리뷰한 논문으로 링크는 다음과 같다)1. Attentionattention의 개념은…
What Makes a Video a Video: Analyzing Temporal Information in Video Understanding Models and Datasets
본 논문은 Do these Models Really Capture Temporal Information? 라는 질문에 관한 논문이다. 보통 모델이 깊어질수록 낮은 수준의 정보는 점점 사라진다. 아래 그림1은 원본 비디오…
SMART Frame Selection for Action Recognition
본 논문은 action recognition을 위한 video frame selection 문제를 다룬다. 아카이브 기준으로 2020.12.19일 공개 되어 코드는 공개되지 않았다.명칭을 SMART frame selection으로 하였는데 SMART는 Sampling through…
[CVPR2020]Central similarity quantization hashing for efficient image and video retrieval
본 논문은 제목에서 알 수 있듯이 영상(image, video)의 retrieval 문제의 해결에 관한 논문이다. 간단하게 작성자가 이해한 컨셉을 정리하였다. (이는 조원 연구원이 세미나와 x-review를 했던 논문입니다.)…
[CVPR2020]BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation
BlendMask는 빠른 segmentation을 가능하게 한 [ICCV2019]YOLACT 을 안다면 빠르게 이해할 수 있을 것이다. YOLACT 은 Real-time Instance Segmentation 즉, instance segmentation 문제를 real-time으로 해결하기 위한…
[CVPR2020]Single-Stage Semantic Segmentation from Image Labels
본 논문은 weakly supervised learning (약 지도학습)을 single stage로 진행한 논문이다. 기존 많은 약지도학습 기법에서는 CAMs(class activation maps)를 seed로 하여 이를 수정하는 등 multi-stage 방식이…
네이버 초청 세미나 리뷰
9월 28일 듣게된 세미나에 대한 리뷰를 작성합니다. 자리를 마련해 주신 교수님과 연구원님들께 감사드립니다. 세미나의 큰 주제는 앞서 다른 연구원님들의 리뷰에서 확인할 수 있듯이 Metric Learning…
서울대학교 AI 여름학교
서울대학교에서 AI 여름학교를 온라인으로 공개하였다. 덕분에 너무 유용하고 좋은 강의를 들을 수 있어 감사했고, 다양한 좋은 강의가 있었지만 듣는 당시 본인에게는 너무 어려워 이해하지 못한…
[KCCV2020] Review
KCCV2020을 온라인으로 참석하게 되어 정말 좋았고, 포스터 세션등에 적극적으로 참여하지 못한것 같아 아쉬움이 있습니다. 이 포스트에서는 제가 KCCV2020 참여 당시 인상깊었던 강연 몇가지를 정리하려 합니다!…
안녕하세요. 현우님 좋은 댓글 감사합니다. 네, 현우님이 댓글에 남겨주신 것처럼 Table 3에서 A와 B는 샘플링하는 프레임수가 32개와 4개로 sparse하게 샘플링했을…