[월:] 2023년 12월

Posted in Paper X-Review

[CVPR 2018] Pyramid Stereo Matching Network

안녕하세요, 열아홉 번째 X-Review입니다. 이번 논문은 2018년도 ICCV에 게재된 Pyramid Stereo Matching논문입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction Stereo Matching은 서로 다른 시점의 stereo…

Continue Reading
Posted in X-Review

[ACCV 2022] Cross-Architecture Knowledge Distillation

transformer는 global relation을 잘 파악한다는 장점으로 인해 여러 분야에서 좋은 성능을 달성하였습니다. 여기까지는 우리가 익히 알고 있는 것과 같죠. 이렇듯 transformer가 좋은 성능을 달성하여 논문의…

Continue Reading
Posted in X-Review

[PMLR 2023]Uni6Dv2: Noise Elimination for 6D Pose Estimation

제가 이번에 리뷰 할 논문은 RGB와 Depth에 동일한 backbone을 적용하는 Uni6D 논문의 후속 논문입니다. 이번에 6D 데이터 셋을 촬영할 때 스팀을 분사하여 노이즈를 추가할 경우…

Continue Reading
Posted in Paper X-Review

[RA-L 2022]MP6D: An RGB-D Dataset for Metal Parts’ 6D Pose Estimation

안녕하세요, 이번에도 6D pose estimation을 위한 데이터셋을 구성하기 위해 데이터셋 논문을 읽어보았습니다. 이번 논문의 핵심은 GT pose를 구성하였을 때, 좀 더 정확한 GT pose 정보를…

Continue Reading
Posted in X-Review

[NIPS 2014] Generative Adversarial Nets

안녕하세요 오늘은 생성형 모델로 유명한 GAN입니다. GAN이 어떻게 이미지를 생성해낼 수 있는지 왜 기존의 생성형 모델들이 아닌 GAN에 사람들이 관심을 갖게 되었는지 논문 리뷰를 통해…

Continue Reading
Posted in X-Review

[arXiv 2015] Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

안녕하세요 제가 이번에 리뷰할 논문은 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 입니다. Object Detection 모델은 Object 위치를 추정하기 위해 영역 추정(region…

Continue Reading
Posted in Paper X-Review

[CVPR 2023] Clover: Towards A Unified Video-Language Alignment and Fusion Model

이 논문의 주요 키워드 Universal Video-Language Pre-training Multi-modal Fusion & Alignment Semantic Enhanced Masked Language Modeling 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Multi-modal contrastive…

Continue Reading