[카테고리:] Paper

Paper Review

Posted in Paper X-Review

[ICML 2017] On Calibration of Modern Neural Networks

안녕하세요, 허재연입니다. 이번에는 model calibration을 다룬 논문을 들고 왔습니다. Active Learning의 confidence 관련 논문을 읽다 calibration 관련 이해가 필요하겠다 싶어 읽어본 논문인데, 인용 수도 많고(약…

Continue Reading
Posted in Conference Paper X-Review

[NeurIPS 2023] SAM-CLIP: Merging Vision Foundation Models towards Semantic and Spatial Understanding

이번 리뷰 논문은 세그멘테이션과 언어 모델에서 핫한 두 개의 파운데이션 모델 SAM과 CLIP을 하나의 모델로 병합하는 방법(model merging)을 제시하는 방법론에 해당합니다. 두 모델의 특징을 살리면서…

Continue Reading
Posted in Paper X-Review

[TPAMI 2007] Stereo processing by Semi-Global matching and Mutual Information

안녕하세요, 스물한 번째 X-Review입니다. 이번 논문은 2007년도 TPAMI에게재된 Stereo processing by Semi-Global matching and Mutual Information 논문으로 딥러닝 기반이 아닌 전통적인 방식으로 stereo matching을 수행하는…

Continue Reading
Posted in Paper X-Review

보호된 글: [RA-L UnderReview] FDENet: Fusion Depth Semantics and Edge-Attention Information for Multispectral Pedestrian Detection

보호하고 있는 글이라서 요약이 없습니다.

Continue Reading
Posted in Paper X-Review

[ECCV 2020] End to End Object Detection with Transformers

Before Review 새해 맞이 첫 논문 리뷰는 DETR 입니다. 신년 세미나에서도 간단하게 연구 방향을 설명 드리긴 했지만, 다시 한번 말씀 드리자면 올해 해보고 싶은 연구…

Continue Reading
Posted in Paper X-Review

[WACV 2022] ImVoxelNet: Image to Voxels Projection for Monocular and Multi-View General-Purpose 3D Object Detection

안녕하세요, 스무번째 x-review 입니다. 이번 논문은 2022년도 WACV에 게재된 RGB 기반 3D Object Detection 논문 입니다. 정말 오랜만에 3D detection 논문을 읽어봤는데요, 이전과 다르게 오로지…

Continue Reading
Posted in Paper X-Review

[CVPR 2023] Text-Visual Prompting for Efficient 2D Temporal Video Grounding

이번 주차 X-Review 또한 Temporal Sentence Grounding in Videos(TSGV) 관련 논문입니다. 본 논문은 23년도 CVPR에 게재되었으며, 20, 21년도 근처의 초창기 방법론들을 익히던 와중 23년도 CVPR에…

Continue Reading
Posted in Paper X-Review

[ICCV 2021]StereOBJ-1M: Large-scale Stereo Image Dataset for 6D Object Pose Estimation

안녕하세요, 이번에도 6D pose estimation 관련 논문입니다. 6D pose 데이터셋을 구축하기 위해 계속해서 새로운 데이터셋 논문들을 팔로우업하고 있는데요. 이제 작성 중인 국문 논문을 마무리 하는…

Continue Reading
Posted in Paper X-Review

[arxiv 2023] Weakly Supervised Vision-and-Language Pre-training with Relative Representation

이 논문의 주요 키워드 Weakly Supervised Vision-Language Pre-training (UVLP, WVLP) Non-parallel Image-Text Data Relative Representation 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Multi-modal contrastive learning에…

Continue Reading
Posted in Paper X-Review

[CVPR 2020] Local-Global Video-Text Interactions for Temporal Grounding

안녕하세요. 이번 주차 X-Review의 주제는 지난 세미나 때 말씀드렸듯, 제가 관심갖고 살펴보려한 task인 Temporal Sentence Grounding in Videos(TSGV)의 초창기 방법론입니다. 2020년도 CVPR에 게재되었으며, 서울대 한보형…

Continue Reading