Author: rcvlab
[NIPS 2023] Efficient Coding of Natural Images using Maximum Manifold Capacity Representations
이 논문의 주요 키워드 Representation Learning Self-supervised Learning 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Self-supervised representation learning에 대한 이해 SimCLR (주영님 리뷰) Barlow Twins…
[CVPR 2020] KeyPose: Multi-View 3D Labeling and Keypoint Estimation for Transparent Objects
안녕하세요, 이번에도 6D pose estimation의 데이터셋 논문입니다. KeyPose라는 모델을 사용하여 저자가 제안한 데이터셋에 적용한 것 까지가 해당 논문의 전체적인 흐름인데요. 특별한 점은 투명한 물체를 사용한 것…
[ICCV 2023] Localizing Moments in Long Video Via Multimodal Guidance
이 논문의 주요 키워드 Temporal Grounding Moment Retrieval Long-form video 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Temporal Grounding에 대한 이해 (Moment-DETR 리뷰) 안녕하세요. 백지오입니다….
[ICRA 2020] YCB-M: A Multi-Camera RGB-D Dataset for Object Recognition and 6DoF Pose Estimation
안녕하세요, 이번에도 데이터셋 논문입니다. 기존 6D pose estimation 테스크에서 사용되었던 YCB-V라는 데이터셋의 단일 센서가 아닌 여러 센서를 통해 취득한 데이터셋입니다. YCB는 Yale-CMU-Berkeley의 약어로 3개의 대학에서…
[NIPS 2021] QVHIGHLIGHTS: Detecting Moments and Highlights in Videos via Natural Language Queries (Moment-DETR)
이 논문의 주요 키워드 Temporal Grounding Moment Retrieval Highlight Detection DETR 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Multi-modal contrastive learning에 대한 이해 (CLIP 리뷰…
[IROS 2019] Large-scale 6D Object Pose estimation for Industrial Bin-Picking
안녕하세요, 이번에도 데이터셋 논문 리뷰입니다. 아마존에서 bin-picking 관련해서 챌린지 관련 논문으로 알고 봤는데 아닌 것 같네요. 다시 한 번 찾아봐야 할 것 같습니다. 이번 논문은…
[ICLR 2022] Open-Vocabulary Object Detection via Vision and Language Knowledge Distillation
이 논문의 주요 키워드 Open-Vocabulary Object Detection Knowledge Distillation 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Multi-modal contrastive learning에 대한 이해 (CLIP 리뷰 파트 1,…
[ICCV 2021]StereOBJ-1M: Large-scale Stereo Image Dataset for 6D Object Pose Estimation
안녕하세요, 이번에도 6D pose estimation 관련 논문입니다. 6D pose 데이터셋을 구축하기 위해 계속해서 새로운 데이터셋 논문들을 팔로우업하고 있는데요. 이제 작성 중인 국문 논문을 마무리 하는…
[arxiv 2023] Weakly Supervised Vision-and-Language Pre-training with Relative Representation
이 논문의 주요 키워드 Weakly Supervised Vision-Language Pre-training (UVLP, WVLP) Non-parallel Image-Text Data Relative Representation 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Multi-modal contrastive learning에…
[CVPR 2022] Unsupervised Vision-and-Language Pre-training via Retrieval-based Multi-Granular Alignment
이 논문의 주요 키워드 Weakly Supervised Vision-Language Pre-training (UVLP, WVLP) Non-parallel Image-Text Data 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Multi-modal contrastive learning에 대한 이해…
최신 댓글