Category: Paper
Paper Review
[IROS2020] DeepURL – Deep Pose Estimation Framework for Underwater Relative Localization
본 논문은 Underwater 환경에서 6DOF Object Detection을 수행하는 연구입니다. 해당 논문은 코드도 함께 공개하고 있습니다. Abstract & Introduction 본 논문은 딥러닝 기반의 실시간 6D Relative…
[CVPR2019]Fast Human Pose Estimation
이번 리뷰는 저가 한번도 다뤄보지 않은 주제인 Human Pose Estimation 관련 논문에 대해서 작성해보고자 합니다. 해당 분야에 대해 다른사람의 리뷰는 종종 보았지만 직접 읽고 리뷰하는…
6-DOF Object Pose Estimation – 2.DenseFusion
지난시간 PoseCNN에 대해서 리뷰를 진행하였고, 오늘은 Dense Fusion에 대해서 리뷰를 진행하겠습니다. Dense Fusion에서의 Contribution을 소개하면 다음과 같습니다. RGB-D를 Fusion하여 6DoF를 예측하는 네트워크를 제안하였다. end to…
[AAAI2018] Multispectral Transfer Network: Unsupervised Depth Estimation for All-Day Vision
Introduction Single-Depth estimation은 자율주행에서 필수요소로 사용된다. 따라서 Deep Neural Network(DNN)을 사용한 다양한 방법론들이 제시되고 좋은 성능 또한 내고 있다. 하지만 RGB 카메라의 고질적인 문제인 낮과…
[CVPR2020]Central similarity quantization hashing for efficient image and video retrieval
본 논문은 제목에서 알 수 있듯이 영상(image, video)의 retrieval 문제의 해결에 관한 논문이다. 간단하게 작성자가 이해한 컨셉을 정리하였다. (이는 조원 연구원이 세미나와 x-review를 했던 논문입니다.)…
[CVPR 2019] Deep Metric Learning to Rank
논문의 내용은 간단합니다. 새로운 Loss function 을 도입하여 Metric Learning의 Image retrieval 성능을 높힌것입니다. Fast AP Loss 새로 도입한 loss function은 Fast AP Loss라고 명명하였습니다.Average…
[SIGGRAPH2018]Deep Exemplar-based Colorization
이번 리뷰도 역시 Colorization 관련 논문을 가져왔습니다. 하지만 이전에 논문들은 non-reference기반의 방법론들이었다면, 이번 논문은 exemplar-based라는 것이 큰 차이가 있을 것 같습니다. Introduction colorization은 아시다시피 gray…
Long-Term Feature Banks for Detailed Video Understanding[1편]
Chao-Yuan Wu1,2 Christoph Feichtenhofer2 Haoqi Fan2 Kaiming He2 Philipp Krahenb ¨ uhl ¨ 1 Ross Girshick2 1The University of Texas at Austin 2Facebook AI Research…
6-DOF Object Pose Estimation – 1. Pose CNN
가능하다면 금주부터는 6-DOF Object Pose Estimation과 관련된 논문들을 읽어보고 리뷰를 진행하고자 합니다. 오늘은 첫 리뷰이기 때문에 6-DOF는 무엇인지에 대한 내용과 2017년 나온 ‘PoseCNN: A Convolutional…
SuperThermal: Matching Thermal as Visible Through Thermal Feature Exploration
이번 리뷰 글은 논문 리뷰 연습을 위해 읽은 논문으로 해당 X-review는 예약설정을 통해 올릴 예정입니다. 해당 논문의 주제는 논문 제목에도 나와있듯이 열화상 영상의 feature extraction…
좋은 포인트를 지적해주신 것 같네요. 말씀하신 내용처럼, DiscoVLA는 PImgAlign 모듈에서 멀티모달 LLM인 LLaVA-NeXT를 활용해 프레임 단위의 pseudo-caption을 생성하고, 이를 통해…