Category: Paper
Paper Review
Long-Term Feature Banks for Detailed Video Understanding[1편]
Chao-Yuan Wu1,2 Christoph Feichtenhofer2 Haoqi Fan2 Kaiming He2 Philipp Krahenb ¨ uhl ¨ 1 Ross Girshick2 1The University of Texas at Austin 2Facebook AI Research…
6-DOF Object Pose Estimation – 1. Pose CNN
가능하다면 금주부터는 6-DOF Object Pose Estimation과 관련된 논문들을 읽어보고 리뷰를 진행하고자 합니다. 오늘은 첫 리뷰이기 때문에 6-DOF는 무엇인지에 대한 내용과 2017년 나온 ‘PoseCNN: A Convolutional…
SuperThermal: Matching Thermal as Visible Through Thermal Feature Exploration
이번 리뷰 글은 논문 리뷰 연습을 위해 읽은 논문으로 해당 X-review는 예약설정을 통해 올릴 예정입니다. 해당 논문의 주제는 논문 제목에도 나와있듯이 열화상 영상의 feature extraction…
[arXiv2019] ViSiL: Fine-grained Spatio-Temporal Video Similarity Learning
해당 논문은 video들 간의 similarity를 계산하기 위해 방법론인 ViSiL을 제안한 논문입니다. 주로 video-to-video retrieval시 video의 전체 frame에서 spatio-temporal한 정보를 추출하고 이를 aggregate하여 하나의 vector로 만들게…
[NeurIPS 2017]”Attention is all you need” – Transformer
현재 이미지 분류 분야에서 SOTA를 달성한 “AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE “(ViT)는 NLP의 “Attention is all you need”…
[CVPR2020]Unsupervised Learning from Video with Deep Neural Embeddings
Chengxu Zhuang Tianwei She Alex Andonian Max Sobol Mark Daniel Yamins Stanford University MIT Introduction 1.비디오의 temporal sequence엔 (그것이 무질서한 형태로 존재했을 대 보다 더…
[ICCV2019] Digging Into Self-Supervised Monocular Depth Estimation
1. Introduction RGB를 Depth로 변환 시킬때는 그림 1 의 왼쪽 처럼 Texture copy 가 발생 한다. 이 Texture Copy는 RGB의 특성을 Depth가 따라 가는 것으로…
Visual Localization methods list
해당 글은 Visual Localization 관련 방법론들을 survey하면서 다 읽지는 않았지만 찾아놓은 논문들 리스트입니다. 1. 2D Image-based Localization 영상 기반 위치인식 방식(또는 Image retrieval methods)은 쿼리…
[CVPR2020]BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation
BlendMask는 빠른 segmentation을 가능하게 한 [ICCV2019]YOLACT 을 안다면 빠르게 이해할 수 있을 것이다. YOLACT 은 Real-time Instance Segmentation 즉, instance segmentation 문제를 real-time으로 해결하기 위한…
[CVPR2020][1편]A Multigrid Method for Efficiently Training Video Models
Chao-Yuan Wu , Ross Girshick , Kaiming He The University of Texas at Austin ,Facebook AI Research (FAIR) 들어가며 이번 논문은 흥미가 있어서 총 2편의…

![[arXiv2019] ViSiL: Fine-grained Spatio-Temporal Video Similarity Learning](http://server.rcv.sejong.ac.kr:8080/wp-content/uploads/2020/11/image-104.png)
안녕하세요 인택님, 리뷰 잘 읽었습니다. AVQA task에 대해 조금이나마 알아갈 수 있는(?) 시간이었던 것 같습니다. 정말 간단한 질문 두 가지만…