[ICCV 2019] Digging Into Self-Supervised Monocular Depth Estimation
저번 Mono Depth1 에 이어서 오늘은 ‘Digging Into Self-Supervised Monocular Depth Estimation’ 라는 논문을 리뷰하고자 합니다. Mono Depth2 라고도 불리는 논문입니다. 그럼 리뷰 시작하겠습니다. Abstract…
[ICCV2021]SDWNet: A Straight Dilated Network with Wavelet Transformation for image Deblurring
제가 이번에 리뷰할 논문은 deblurring과 관련된 논문입니다. 이 논문을 읽게 된 이유는 위치인식 과제에서 motion blur를 해결하기 위한 방법론으로 DeblurGAN-v2 방법론이 있었는데 이 방법론은 2019년에…
Protected: [Peer Review] Induced Iterative FLS Image Registration with Multi-scale Slim Networks
There is no excerpt because this is a protected post.
[2021 IROS] Cross-Modal Analysis of Human Detection for Robotics: An Industrial Case Study
이번에 제가 리뷰할 논문은 Timm Linder라는 저자가 작성한 논문으로, 저자는 현재 보쉬에서 일하고 있습니다. 제가 2주전에 발표했던 yolo기반의 detection 및 centroid regression과 동일한 저자이며, 해당…
[CVPR2022 Oral]QueryDet: Cascaded Sparse Query for Accelerating High-Resolution Small Object Detection
오랜만에 디텍션 논문을 들고 왔습니다. 해당 논문은 CVPR 2022 Oral로 선정된 논문으로 작은 물체를 잘 검출하기 위한 방법을 제안합니다. 작은 물체를 검출하기 위한 접근 방법으로…
[CVPR 2022] A Large-scale Comprehensive Dataset and Copy-overlap Aware Evaluation Protocol for Segment-level Video Copy Detection
오늘은 오랫만에 video copy detection 논문으로 돌아왔습니다. 이 논문은 “Learning segment similarity and alignment in large-scale content based video retrieval”라는 제목의 후속 연구 논문으로 x-review에도…
[CVPR 2022] Exploring Denoised Cross-Video Contrast for Weakly-Supervised Temporal Action Localization
Before Review 이번 논문은 Weakly Supervised Temporal Action Localization로 읽었습니다. 개인적으로는 Code가 공개되지 않아서 아쉬움이 드는 논문입니다. 방법론이 인상 깊어서 원복을 해보려고 코드를 짜보고 있는데…
[CVPR 2018]Pyramid Stereo Matching Network
요즘 Monocular Pseudo-LiDAR 의 성능을 올리기 위해서 기존 Depth estimation 방법론들을 분석하고 있습니다. 분석 중에 가장 인상 깊었던 것은 Stereo depth estimation의 성능이 였는데요. 전…
[CVPR 2022] ViewAL: Active Learning With Viewpoint Entropy for Semantic Segmentation
이번 X-Review 역시 Active Learning 에 대해 가져왔습니다. 다크데이터 정례회의를 준비하며 읽어본 논문인데요, 다크데이터 과제에서는 다양한 모델을 지원합니다. Classification, Segmentation, Object Detection, Image Captioning 등이…
[CVPR2022](Oral) GMFlow : Learning Optical Flow via Global Matching
이번에 리뷰할 논문은 오랜만에 optical flow 논문입니다. 해당 논문을 읽게 된 이유는 제가 요새 관심 있어 하는 homography estimation 분야는 image registration을 수행할 수 있으며…
좋은 포인트를 지적해주신 것 같네요. 말씀하신 내용처럼, DiscoVLA는 PImgAlign 모듈에서 멀티모달 LLM인 LLaVA-NeXT를 활용해 프레임 단위의 pseudo-caption을 생성하고, 이를 통해…