[카테고리:] Paper
Paper Review
Combining Events and Frames using Recurrent Asynchronous Multimodal Networks for Monocular Depth Prediction
이벤트 카메라란 픽셀 당 밝기 변화(이벤트)를 촬영하는 새로운 비전 센서이다. 이 센서는 높은 시간적 정보와 동적 범위, 모션 블러가 없음 과 같은 장점을 제공한다. 하지만…
[NeurlIPS2021]TransGAN : Two Transformers Can Make One Strong GAN
이번에 리뷰로 작성할 논문은 generator와 discriminator를 모두 transformer 구조로 만들어 영상을 생성하는 GAN 방법론입니다. Introduction 일단 Generative adversarial networks(GANs)은 매우 많은 발전을 이루어왔습니다. 말을 얼룩말로…
Contrastive Learning of Image Representations with Cross-Video Cycle-Consistency
논문 소개본 논문은 에서 다루는 contrastive Learning는 self-supervised learning 에서 주로 사용되는 학습 기법으로, 군집 내의 (positive pair)간의 유사도를 높이고, 군집 간의 (negative pair) 유사도를…
[arXiv2021] MLP-Mixer: An all-MLP Architecture for Vision
이전에는 Convolution Neural Network가 대다수였던 것에 비해 최근에는 Transformer 구조가 Computer Vision 내의 여러 분야에서 좋은 성능을 보이며 주목을 끌고 있습니다. 이러한 와중에 Google에서는 MLP…
Object-Contextual Representations for Semantic Segmentation
제가 이번에 리뷰할 논문은 OCRNet입니다. segmentation을 할 때 사용할 모델인 OCRNet에 대한 논문이라 리뷰를 하게 되었고, 기존의 OCRNet에 transformer 방식을 적용한 내용을 포함하고 있습니다. 내용은…
Weakly Supervised Action Selection Learning in Video
소개 [Link]본 논문은 video에서 action part를 찾는 task 를 위한 논문이다(Temporal action localization task 이하, TAL).기존의 Weakly Supervised 기반의 TAL 방법론들은 비디오 단위의 레이블을 이용하여…
An overview of gradient descent optimization algorithms (part.2)
Before Reivew 지난주에 작성하던 Gradient Descent optimization review를 계속 이어서 진행하겠습니다. 본격적으로 시작하기 전에 지난에 작성했던 Review를 다시 복습해보도록 하겠습니다. Development of Gradient Descent Vanilla…
[CVPR 2016] Deep Residual Learning for Image Recognition
근간이 되는 네트워크에 대해 알아보고자 ResNet 논문을 읽어보았습니다. 기본이 되는 논문들을 많이 읽어보고자 합니다. Abstract Nerual Network는 layer가 깊어질수록 학습이 어렵다. 본 논문은 기존 방법론보다…
[Challenge] ActivityNet Challenge 2020
약 한달간 CVPR workshop 에서 열리는 ActivityNet Challenge 2021에 참여하게 되어 본격적으로 시작하기에 앞서 전년도 ActivityNet Challenge 2020에 대한 리뷰를 진행합니다. 제가 나가는 분야로는 Action…
TSP: Temporally-Sensitive Pretraining of Video Encoders for Localization Tasks
논문이 집중한 문제해당 논문은 Temporal Action Localization, Action Proposal Generation, Dense Video Captioning 세가지 task의 성능을 향상 시키기 위한 pretrain 기법을 소개하는 논문이다. 본 논문에서…
최신 댓글