[카테고리:] Paper
Paper Review
Understanding SSIM
Pixel Level prediction 방법론에서 영상과 영상을 비교할때 제일 많이 사용되고 있는 방법론인 SSIM을 좀 더 자세히 이해하고 문제를 찾기 위해서 이 논문을 읽게 되었습니다. Self…
[CVPR2021] T2VLAD: Global-Local Sequence Alignment for Text-Video Retrieval
이전부터 컴퓨터 비전에서는 특정 Center의 의미를 부여하고 local descriptor를 할당해 global descriptor를 기술하는 VLAD 기반 방법론들이 좋은 성능을 보였었습니다. 딥러닝이 발달하기 시작하며, Center까지 학습하는 NetVLAD라는…
[CVPR2021] UPFlow : Upsampling Pyramid for Unsupervised Optical Flow Learning
매우매우 오랜만에 Optical Flow 논문을 가져와봤습니다. 가져오게된 계기는 Depth Estimation에서 물체 경계가 잘 살지 못하는 경우가 종종 관측되는데, Optical Flow도 이러한 문제점이 종종 있다보니 해당…
[2018] CNN-based thermal infrared person detection by domain adaptation
안녕하세요 이번 X-review 주제는 보행자 인식입니다. 해당 논문을 읽게된 계기는 domain adaptation을 MLPD에 적용하기위해 카이스트 데이터셋을 인용한 논문중 domain adaptation으로 검색한 결과 가장 인용수가 높은…
[ICRA2021]MonStereo: When Monocular and Stereo Meet at the Tail of 3D Human Localization
이번 리뷰는 지난주에 리뷰를 진행한 Monoloco의 Stereo 확장 버전에 해당합니다. 해당 논문의 핵심은 3차원 보행자 검출 시, 발생하는 스테레오 매칭의 한계로 발생하는 long tail 문제와…
[CVPR 2021] Self Supervised Learning for Semi-Supervised Temporal Action Proposal
Before Review 이번 논문 리뷰는 Semi-Supervised 형식의 Temporal Action Proposal 논문을 가져왔습니다. 현재 비디오 팀에서 연구하고 있는 방향이 Untrimmed Video를 가지고 ForeGround와 BackGround를 효과적으로 구분해내는…
[MVA2021] Multi-Modal Pedestrian Detection with Large Misalignment Based on Modal-Wise Regression and Multi Modal IoU
(ICCAS, UR과 같이) MVA2021은 일본에서 열리는 국제학회 같습니다. 해당 논문에서 다루는 Large Misalignment는 MLPD에서도 앞으로 해결해야할 문제이기 때문에 논문을 읽게됐습니다. Introduction 논문의 시작은 모든 멀티스펙트럴…
[CVPR2020] SDC-Depth: Semantic Divide-and-Conquer Network for Monocular Depth Estimation
제가 이번에 리뷰할 논문은 segmentation을 depth에 이용하는 또 다른 논문입니다. 이미지를 object instance와 background stuff class로 분해한 뒤 각 부분에 대해 크기와 shift canonical depth…
[CVPR 2017] Adversarial Discriminative Domain Adaptation
최근 Anomaly Detection에서 MLPD의 확장연구로 연구 방향을 전환하며, Domain Adaptation 에 대해 알아보기 위해 읽어본 논문입니다. 참고로 최근에 김지원 연구원이 리뷰한 논문의 기반이 되는 논문이라고…
[arXiv2021] DynamicViT: Efficient Vision Transformers with Dynamic Token Sparsification
Youtube : https://youtu.be/O6GQGia4VdE 올해 들어 transformer 구조가 기존 Computer vision을 장악했던 CNN 구조를 대체하기 시작하면서, CNN 구조를 지닌 모델들에 적용했던 방법들 또한 transformer 구조 방법론에…
최신 댓글