[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[NeurIPS 2023] SAM-CLIP: Merging Vision Foundation Models towards Semantic and Spatial Understanding
이번 리뷰 논문은 세그멘테이션과 언어 모델에서 핫한 두 개의 파운데이션 모델 SAM과 CLIP을 하나의 모델로 병합하는 방법(model merging)을 제시하는 방법론에 해당합니다. 두 모델의 특징을 살리면서…
[TPAMI 2007] Stereo processing by Semi-Global matching and Mutual Information
안녕하세요, 스물한 번째 X-Review입니다. 이번 논문은 2007년도 TPAMI에게재된 Stereo processing by Semi-Global matching and Mutual Information 논문으로 딥러닝 기반이 아닌 전통적인 방식으로 stereo matching을 수행하는…
보호된 글: [RA-L UnderReview] FDENet: Fusion Depth Semantics and Edge-Attention Information for Multispectral Pedestrian Detection
보호하고 있는 글이라서 요약이 없습니다.
[ECCV 2020] End to End Object Detection with Transformers
Before Review 새해 맞이 첫 논문 리뷰는 DETR 입니다. 신년 세미나에서도 간단하게 연구 방향을 설명 드리긴 했지만, 다시 한번 말씀 드리자면 올해 해보고 싶은 연구…
[WACV 2022] ImVoxelNet: Image to Voxels Projection for Monocular and Multi-View General-Purpose 3D Object Detection
안녕하세요, 스무번째 x-review 입니다. 이번 논문은 2022년도 WACV에 게재된 RGB 기반 3D Object Detection 논문 입니다. 정말 오랜만에 3D detection 논문을 읽어봤는데요, 이전과 다르게 오로지…
[CVPR 2023] Text-Visual Prompting for Efficient 2D Temporal Video Grounding
이번 주차 X-Review 또한 Temporal Sentence Grounding in Videos(TSGV) 관련 논문입니다. 본 논문은 23년도 CVPR에 게재되었으며, 20, 21년도 근처의 초창기 방법론들을 익히던 와중 23년도 CVPR에…
[ICCV 2021]StereOBJ-1M: Large-scale Stereo Image Dataset for 6D Object Pose Estimation
안녕하세요, 이번에도 6D pose estimation 관련 논문입니다. 6D pose 데이터셋을 구축하기 위해 계속해서 새로운 데이터셋 논문들을 팔로우업하고 있는데요. 이제 작성 중인 국문 논문을 마무리 하는…
[ICLR 2016] Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks
안녕하세요. 이번 x-review로 DCGAN에 대해 글을 써보자 합니다. 이전에 초기 gan 모델에 대해 공부했을 때 다층 퍼셉트론(MLP)를 사용해서 당연히 CNN을 사용한 모델도 있을 것이고 DCGAN의…
[CVPR2023] DistractFlow: Improving Optical Flow Estimation via Realistic Distractions and Pseudo-Labeling
24년도를 맞이해서 처음 작성하는 x리뷰네요. 이번에 소개드릴 논문은 DistractFlow라는 방법론으로 mix-up 기반 data augmentation을 통해 optical flow의 성능을 향상시키는 방법론입니다. Intro optical flow는 두 연속되는…
[arxiv 2023] Weakly Supervised Vision-and-Language Pre-training with Relative Representation
이 논문의 주요 키워드 Weakly Supervised Vision-Language Pre-training (UVLP, WVLP) Non-parallel Image-Text Data Relative Representation 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Multi-modal contrastive learning에…
최신 댓글