[ICCV2021] Self-supervised Product Quantization for Deep Unsupervised Image Retrieval
이번에 리뷰할 논문은 기존과는 매우 다른 테스크에서 가져왔습니다. 이 논문은 영상 검색을 위해서 영상을 vector로 만드는 테스크입니다. 본 논문을 고른 이유는 현재 제가 하려고 하는…
Web-Scale Responsive Visual Search at Bing
최근에 visual search와 관련된 논문들을 읽고 있습니다. 대부분의 논문에서 visual search를 Content-based Image Retrieval과 동일한 용어로 정의합니다. 이 task는 이미지가 주어 졌을 때, 해당 이미지와…
[CVPR 2020] A U-Net Based Discriminator for Generative Adversarial Networks
이번에 읽은 논문은 Thermal to RGB translation (image-to-image translation, I2IT) 을 하기 위해 여러 논문들을 찾아보면서 알게된 논문입니다. 이 논문은 I2IT 를 직접적으로 다루지는 않았지만…
[CVPR2021]Encoding in Style: a StyleGAN Encoder for Image-to-Image Translation
이번 논문은 Image Generation, Image to Image Translation 쪽 분야 논문입니다. Image Generation 분야에서 매우 유명한 StyleGAN을 기반으로 자신들이 제안하는 새로운 Encoder를 통해 Image Translation까지…
YOLOv4: Optimal Speed and Accuracy of Object Detection
이번 X-review에서 제가 소개해드릴 논문은 YOLOv4이며 해당 논문은 이전 김지원 연구원에 의해 리뷰된적이 있습니다. 좀 더 자세히 작성하는걸 목표로 할 것이고, 해당 x-review를 기반으로 아듀세미나에서도…
[TM] 모델의 추론속도를 높여보자 2 – TensorRT with C++
이번에는 TensorRT를 적용한 모델을 C++에서 사용하는 방법에 대해서 이야기하고자 합니다. 이전에 포테닛에서는 qmake를 사용하였는데, 이번에는 gcc를 이용하여 진행할 예정입니다. https://github.com/NVIDIA/Torch-TensorRT 우선 1편에서 위의 깃허브를 통해…
[CVPR 2019] Learning Loss for Active Learning
이번 리뷰할 논문은 다크데이터 과제에서 베이스가 되었던 논문입니다. 제목은 “Learning Loss for Active Learning”으로, 제목에서 알 수 있듯이 Active Learning를 다룬 논문입니다. 많은 연구실 분들이…
[TM] 모델의 추론속도를 높여보자 – TensorRT
이번주에 논문리뷰를 진행하려고 하였는데, 생각보다 마음에 드는 논문을 찾는것도 힘드네요.. 따라서 지난주에 진행했떤 TensorRT에 대해서 설명드리는 글을 작성하고자 합니다. 참고자료 : https://developer.nvidia.com/tensorrt TensorRT란? 많은 분들이…
[ICCV2021] AdaAttn : Revisit Attention Mechanism in Arbitrary Neural Style Transfer
오랜만에 Style Transfer 관련 논문을 가져왔습니다. ICCV2021에 게제된 논문으로 논문 제목을 딱 보면 style transfer에서 가장 잘 알려진 방법론인 Adaptive Instance Normalization에 Attention Mechanism을 적절힌…
[ISPRS 2021]Pose-aware monocular localization of occluded pedestrians in 3D scene space
이번 리뷰는 3D Pedestrian Localization ~ MonoLoco의 확장 연구에 해당합니다. 군중이나 물체에 의해 가려진 보행자의 신체 정보를 예측하는 네트워크를 추가하여 성능을 향상 시켰습니다. 해당 방법론에서…
1. CTC 기반의 텍스트 인식 모델의 학습 과정에 대해 설명을 드리면 대답이 될 것 같네요! 입력된 텍스트 이미지[H x W…