Category: Paper
Paper Review
[arXiv2019] ViSiL: Fine-grained Spatio-Temporal Video Similarity Learning
해당 논문은 video들 간의 similarity를 계산하기 위해 방법론인 ViSiL을 제안한 논문입니다. 주로 video-to-video retrieval시 video의 전체 frame에서 spatio-temporal한 정보를 추출하고 이를 aggregate하여 하나의 vector로 만들게…
[NeurIPS 2017]”Attention is all you need” – Transformer
현재 이미지 분류 분야에서 SOTA를 달성한 “AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE “(ViT)는 NLP의 “Attention is all you need”…
[CVPR2020]Unsupervised Learning from Video with Deep Neural Embeddings
Chengxu Zhuang Tianwei She Alex Andonian Max Sobol Mark Daniel Yamins Stanford University MIT Introduction 1.비디오의 temporal sequence엔 (그것이 무질서한 형태로 존재했을 대 보다 더…
[ICCV2019] Digging Into Self-Supervised Monocular Depth Estimation
1. Introduction RGB를 Depth로 변환 시킬때는 그림 1 의 왼쪽 처럼 Texture copy 가 발생 한다. 이 Texture Copy는 RGB의 특성을 Depth가 따라 가는 것으로…
Visual Localization methods list
해당 글은 Visual Localization 관련 방법론들을 survey하면서 다 읽지는 않았지만 찾아놓은 논문들 리스트입니다. 1. 2D Image-based Localization 영상 기반 위치인식 방식(또는 Image retrieval methods)은 쿼리…
[CVPR2020]BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation
BlendMask는 빠른 segmentation을 가능하게 한 [ICCV2019]YOLACT 을 안다면 빠르게 이해할 수 있을 것이다. YOLACT 은 Real-time Instance Segmentation 즉, instance segmentation 문제를 real-time으로 해결하기 위한…
[CVPR2020][1편]A Multigrid Method for Efficiently Training Video Models
Chao-Yuan Wu , Ross Girshick , Kaiming He The University of Texas at Austin ,Facebook AI Research (FAIR) 들어가며 이번 논문은 흥미가 있어서 총 2편의…
Depression Screening from Text message Reply Latency & Mobile Phone Sensor Correlates of Depressive Symptom Severity in Daily-Life Behavior: An Exploratory Study
이번주에 읽은 우울감(증) 과 관련된 2개의 논문입니다. Depression Screening from Text message Reply Latency 2020년 나온 해당 논문은 문자메세지의 응답시간으로 만든 피처로 실제 우울감(증)을 예측할…
[CVPR2020]Single-Stage Semantic Segmentation from Image Labels
본 논문은 weakly supervised learning (약 지도학습)을 single stage로 진행한 논문이다. 기존 많은 약지도학습 기법에서는 CAMs(class activation maps)를 seed로 하여 이를 수정하는 등 multi-stage 방식이…
Multiview Geometry(Pseudo Inverse ~ RANSAC)
오랜만에 Multi view Geometry에 대한 내용으로 리뷰를 쓰려고 합니다. 지난번까지는 Homogeneous coordinate 부터 Perspective Transformation에 대한 내용들을 다루었었고, 마지막에 Perspective Transformation을 계산하는 방법에 대해 간략히…
안녕하세요 질문 남겨주셔서 감사합니다 논문에서는 CTR 데이터에 대한 결과와 비교하면서 STR의 경우 이미지 내 텍스트가 갖는 특징 자체가 보다 덜…