[카테고리:] Paper
Paper Review
[CVPR2021] High-Resolution Photorealistic Image Translation in Real-Time: A Laplacian Pyramid Translation Network
이번 리뷰는 역시나 Image translation 논문을 가져와봤습니다. 아마 당분간은 CVPR2021에 나온 Image Translation 기반 논문들을 쭉 읽으면서 리뷰할 것 같습니다. Introduction 일단 Image to Image…
[CoRL 2020] Volumetric Grasping Network: Real-time 6 DOF Grasp Detection in Clutter
안녕하세요 이번에는 조금 신기한 주제로 X-review를 써보려고합니다. 그 주제는 바로 Grasping 인데요. 이는 로봇이 물체를 잡는 것을 뜻합니다. 물체를 잡기위해서는 해당 물체의 pose를 알아야하기에 6DoF…
[CVPR2021]LiDAR R-CNN: An Efficient and Universal 3D Object Detector
이번 CVPR2021에 재미있는 논문이 나와서 리뷰를 진행하겠습니다. 페이퍼 : https://arxiv.org/pdf/2103.15297.pdf 코드 : https://github.com/tusimple/LiDAR_RCNN Introduction ” We propose an R-CNN style second-stage detector for 3D object…
[ICLR 2016] Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks
Before Review 이번 Review는 GAN으로 준비했습니다. GAN에 대해서는 이미 한번 2014년도에 나온 Ian Good fellow 가 제안한 원조 GAN을 Review를 진행한바 있습니다. 오늘은 그 연장선상에…
[CVPR 2015] Image Super-Resolution Using Deep Convolutional Networks
이번에 리뷰할 논문은, 저해상도 이미지를 고해상도로 복원시키는 Super-Resolution (SR) 문제를 다룬 논문입니다. 본 논문에서는 기존 방법들과 다르게 SR에 처음으로 CNN을 적용하여 single image super-resolution을 해결하도록…
Multi-Scale Context Aggregation by Dilated Convolutions
저번 주에 리뷰한 논문에서 언급된 mulit-scale segmentation에 관한 논문을 읽어보고 정리해보았습니다. Abstract 기존의 SOTA방식은 convolution network를 이용하는 방식으로 이미지 분류를 위해 디자인 된 모델이다. 하지만…
Combining Events and Frames using Recurrent Asynchronous Multimodal Networks for Monocular Depth Prediction
이벤트 카메라란 픽셀 당 밝기 변화(이벤트)를 촬영하는 새로운 비전 센서이다. 이 센서는 높은 시간적 정보와 동적 범위, 모션 블러가 없음 과 같은 장점을 제공한다. 하지만…
[NeurlIPS2021]TransGAN : Two Transformers Can Make One Strong GAN
이번에 리뷰로 작성할 논문은 generator와 discriminator를 모두 transformer 구조로 만들어 영상을 생성하는 GAN 방법론입니다. Introduction 일단 Generative adversarial networks(GANs)은 매우 많은 발전을 이루어왔습니다. 말을 얼룩말로…
Contrastive Learning of Image Representations with Cross-Video Cycle-Consistency
논문 소개본 논문은 에서 다루는 contrastive Learning는 self-supervised learning 에서 주로 사용되는 학습 기법으로, 군집 내의 (positive pair)간의 유사도를 높이고, 군집 간의 (negative pair) 유사도를…
[arXiv2021] MLP-Mixer: An all-MLP Architecture for Vision
이전에는 Convolution Neural Network가 대다수였던 것에 비해 최근에는 Transformer 구조가 Computer Vision 내의 여러 분야에서 좋은 성능을 보이며 주목을 끌고 있습니다. 이러한 와중에 Google에서는 MLP…
최신 댓글