[카테고리:] Paper
Paper Review
[ICML 2021] Learning Transferable Visual Models From Natural Language Supervision (CLIP) – Part 2
안녕하세요. 백지오입니다. 열세 번째 X-REVIEW는 지난 리뷰에 이은 CLIP 리뷰 파트 2입니다. 지난 파트 1 리뷰에서 CLIP의 개념과 방법론을 알아보았는데, 이번 리뷰에서는 저자들이 수행한 실험과…
[CVPR workshop 2020] NH-HAZE: An Image Dehazing Benchmark with Non-Homogeneous Hazy and Haze-Free Images
이번 리뷰 논문은 Image Dehazing 분야에서 처음으로 real-world의 데이터 셋을 구성하여 챌린지(NTIRE 중 Dehazing 분야)를 개최한 NH-HAZE라는 데이터 셋에 다루고자 합니다. 해당 데이터 셋은 기존…
[NeurIPS 2021] Unleashing the Power of Contrastive Self-Supervised Visual Models via Contrast-Regularized Fine-Tuning
안녕하세요, 허재연입니다. 요즘 Self-supervised learning을 활용해 pretrain한 이후 finetuning하는 과정에서 어떻게 하면 성능을 올릴 수 있을까 고민하고 있는데, 고민 도중 찾아본 논문을 소개하고자 합니다. 보통…
[ECCV 2018] Implicit 3D Orientation Learning for 6D Object Detection from RGB Images
안녕하세요. 이번에도 6D pose estimation 논문입니다. 좀 지난 논문이긴 하지만, 아직까지도 reference가 달리기도 하고 6D 관련 논문에서는 꽤 많은 인용수를 가지고 있는 논문이라 읽으려고 항상…
[CVPR 2023] Learning Situation Hyper-Graphs for Video Question Answering
Before Review 이번 X-Review는 처음 읽어보는 Video Question Answering(이하 VQA) 논문 입니다. VQA에 관심이 생긴 건 아니고, Graph Representation을 활용하여 semantic representation을 고도화하는 논문을 찾다가…
[ICML 2021] Learning Transferable Visual Models From Natural Language Supervision (CLIP) – Part 1
이런 분들께 이 논문을 추천드립니다. CLIP이 도대체 뭔지 궁굼하신 분 Multi-modal Joint Embedding에 관심이 있으신 분 27 페이지에 달하는 이 논문을 읽을 엄두가 안 나시는…
[ICCV 2021] Group-Free Object Detection via Transformers
안녕하세요, 열번째 x-review 입니다. 이번 논문은 ICCV 2021에 게재된 Group-Free Object Detection via Transformers라는 논문으로 3D 데이터인 포인트 클라우드로 기존의 그룹화를 하지 않고 detection이 가능한…
[AAAI-2020] Real-time Scene Text Detection with Differentiable Binarization
안녕하세요. 열 번째 X-Review입니다. 금주 리뷰할 논문은 AAAI 2020에 게재된 <Real-time Scene Text Detection with Differentiable Binarization>입니다. 본 논문 저자는 지지난번 리뷰했던 Mask TextSpotter 논문의…
[CVPR 2023] Localized Semantic Feature Mixers for Efficient Pedestrian Detection in Autonomous Driving
안녕하세요. 열 여덟번째 x-review입니다. 이번에 리뷰할 논문은 올해 CVPR에 게재된 pedestrian detection 논문으로, 2D pedestrian detection과 관련하여 3-4편 가량의 논문 중 한 편입니다. 본 논문의…
[CVPR2023] PiMAE:Point Cloud and Image Interactive Masked Autoencoders for 3D Object Detection
Masked autoencoder는 시각적인 표현력을 잘 학습할 수 있어 몇몇의 독립적인 modality에서 좋을 결과를 보였지만 multi-modal의 경우 많이 적용이 되지 못했다. 본 논문에서는 point cloud와 rgb…
최신 댓글