[월:] 2021년 09월
[CVPR 2016] Convolutional pose machines
이번 리뷰는 카네기 멜론 대학에서 제안한 Open Pose 방법론의 전신인 방법론에 대해 소개해보려고 합니다. 해당 방법은 local한 구역에서 스테이지가 변해가면서 global한 부분을 보는 방법을 적용함으로써…
[AAAI 2018] Deep Reinforcement Learning for Unsupervised Video Summarization with Diversity-Representativeness Reward
Before Review 오늘도 Video Summarization 관련 논문을 리뷰해도록 하겠습니다. 저번에 리뷰했던 [IEEE 2015] Adaptive key-frame Selection for video Summarization 논문은 Neural Network 기반은 아니고 Submodular-Optimization…
[ICCV2021]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
오늘 리뷰할 논문은 Transformer 입니다. 지난번 리뷰도 Transformer로 한 것 같은데, 지난번 리뷰가 Vision Transformer의 문제점에 대한 분석을 위주로 한 논문이었다면, 이번에는 일반적인 논문들처럼 새로운…
[IEEE RA-L] STA-VPR: Spatio-Temporal Alignment for Visual Place Recognition
금일 리뷰는 좀 다르게 진행하겠습니다. 해당 논문에서 풀고자 하는 문제 본 논문에서는 Visual Place Recognition에서 어려운 문제인 ‘Viewpoint invariance’ 문제를 해결하고자 합니다. 더욱 정확히 이야기하자면…
[2021 IEEE TNNLS] Weakly Aligned Feature Fusion for Multimodal Object Detection
안녕하세요 이번에 가지고 온 논문은 2021년 IEEE Transactions on Neural Networks and Learning Systems에 나온 멀티스펙트럴 기반 보행자 인식관련 논문 입니다. AR-CNN의 확장판이라고 보시면 됩니다….
Propagate Yourself: Exploring Pixel-Level Consistency for Unsupervised Visual Representation Learning
해당 논문은 pixel-level로 Contrastive learning을 하는 방식을 제안한다. 기존의 unsupervised learning에서 Contrastive learning은 이미지 전체인 instance level로 이루어지곤 했다. 이러한 학습 방식은 image classification task에서는…
[KCCV 2021] 첫 학회에 참가하며
시작에 앞서… 사실 본 참관기를 KCCV가 끝난 주말에 작성해두었는데… 내용을 조금 더 보강하고 올려야겠다 생각하고 그대로 서랍장에 넣어뒀었네요 … 앞으로 그냥 바로바로 업로드 해야겠다는 것을…
[ICCV 2017] How far are we from solving the 2D & 3D Face Alignment problem? (and a dataset of 230,000 3D facial landmarks)
저는 지난 학기동안 캡스톤에서 얼굴 이미지로 체중 변화를 알아내는 것에 대해 알아보았습니다. 저희가 얼굴 이미지로 체중 변화를 어떻게 예측하였는지 간단하게 설명하자면 그 과정은 다음과 같습니다:…
[KCCV 2021] Review
Towards Diverse and Robust High-level Scene Understanding (권인소 교수님) 컴퓨터 비전의 초기에 사람의 시각적 인지에 대한 연구를 통해 시각적 인지에 영향을 미치는 세 가지가 제시되었다….
[NeurIPS 2020] Labelling unlabelled videos from scratch with multi-modal self-supervision
비디오 연구와 Self-supervised Learning과는 꽤나 연결고리가 있습니다. 연구를 위한 비디오 프레임 수의 경우 적게는 백 장부터 많게는 몇 만장까지 대용량의 데이터를 포함하고 있어 Labeled 데이터를…
최신 댓글