[월:] 2021년 04월
[arXiv2021] ViViT: A Video Vision Transformer
지난번에 리뷰 중, Video classification task에 transformer 구조를 처음 도입한 Facebook 의 TimeSformer가 2021년 2월 9일에 나왔다면 조금 지난 2021년 3월 29일 Google에서도 Video classification…
[CVPR 2017]Pyramid Scene Parsing Network
segmentation을 하면서 PSPNet을 이용해서 해당 논문에 대해 리뷰하게 되었습니다. Abstract pyramid scene parsing network (PSPNet)인 pyramid pooling module을 통해 다양한 영역에서 나온 cotext 정보를 이용한다….
ALADIN: All Layer Adaptive Instance Normalization for Fine-grained Style Similarity
해당 논문은 영상의 스타일의 유사성을 기반으로 하여 영상을 서칭하는 방법론에 대해 연구한 논문인 듯 합니다. 먼저 해당 논문의 초록 부분을 간략하게 설명드리면, 영상의 표현법을 학습하는…
[2021]MBA-VO: Motion Blur Aware Visual Odometry
이번 리뷰는 기본 연구에 관련된 주제를 가진 논문을 가져왔습니다.해당 논문은 영상 블러 현상에 강인함을 가진 visual odometry에 대해 소개합니다. Intro Visual odoemtry는 상대적인 카메라의 움직임을…
[WACV2021]An Alternative of LiDAR in Nighttime: Unsupervised Depth Estimation Based on Single Thermal Image
이미지 하나로부터 깊이영상(Depth)를 추정하는 연구인 Monocular Depth estimation 은 RGB를 베이스로 굉장히 발전되어왔습니다. 하지만 RGB는 illumination에 약하는 단점 때문에 열화상 영상을 활용한 깊이 추정들이 아주…
[2021CVPR] Depth from Camera Motion and Object Detection
해당 논문은 카메라 모션 정보를 통해서 Object 의 Depth를 추정하는 방법을 제안합니다. 이때 카메라 모션 정보는 uncalibrated 상태라고 합니다. 본 논문의 티저영상 입니다. 해당 영상에…
[CVPR 2020]PVN3D: A Deep Point-wise 3D Keypoints Voting Network for 6DoF Pose Estimation
이번에 다루게된 주제는 6DoF pose estimation으로 RGBD 이미지를 활용하여 물체의 자세를 추정하는 과제 입니다. 해당 논문에서는 제가 저번에 리뷰를 작성했던 pvnet과 3D keypoint를 뽑는 방식,…
[NIPS 2014] Generative Adversarial Network
Before Review 오늘 리뷰할 Paper는 그 유명한 GAN 입니다. 주워듣기만 하다가 논문이랑 관련 자료들을 참고해서 GAN에 대해 나름대로 공부를하고 정리를 해보려고 합니다. 읽으면서 정말 간단하면서도…
최신 댓글