Author: rcvlab

RCV연구실 홈페이지 관리자 입니다.
Posted in Paper X-Review

[ICCV 2023] Localizing Moments in Long Video Via Multimodal Guidance

이 논문의 주요 키워드 Temporal Grounding Moment Retrieval Long-form video 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Temporal Grounding에 대한 이해 (Moment-DETR 리뷰) 안녕하세요. 백지오입니다….

Continue Reading
Posted in Paper X-Review

[ICRA 2020] YCB-M: A Multi-Camera RGB-D Dataset for Object Recognition and 6DoF Pose Estimation

안녕하세요, 이번에도 데이터셋 논문입니다. 기존 6D pose estimation 테스크에서 사용되었던 YCB-V라는 데이터셋의 단일 센서가 아닌 여러 센서를 통해 취득한 데이터셋입니다. YCB는 Yale-CMU-Berkeley의 약어로 3개의 대학에서…

Continue Reading
Posted in Paper X-Review

[NIPS 2021] QVHIGHLIGHTS: Detecting Moments and Highlights in Videos via Natural Language Queries (Moment-DETR)

이 논문의 주요 키워드 Temporal Grounding Moment Retrieval Highlight Detection DETR 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Multi-modal contrastive learning에 대한 이해 (CLIP 리뷰…

Continue Reading
Posted in Paper X-Review

[IROS 2019] Large-scale 6D Object Pose estimation for Industrial Bin-Picking

안녕하세요, 이번에도 데이터셋 논문 리뷰입니다. 아마존에서 bin-picking 관련해서 챌린지 관련 논문으로 알고 봤는데 아닌 것 같네요. 다시 한 번 찾아봐야 할 것 같습니다. 이번 논문은…

Continue Reading
Posted in Paper X-Review

[ICLR 2022] Open-Vocabulary Object Detection via Vision and Language Knowledge Distillation

이 논문의 주요 키워드 Open-Vocabulary Object Detection Knowledge Distillation 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Multi-modal contrastive learning에 대한 이해 (CLIP 리뷰 파트 1,…

Continue Reading
Posted in Paper X-Review

[ICCV 2021]StereOBJ-1M: Large-scale Stereo Image Dataset for 6D Object Pose Estimation

안녕하세요, 이번에도 6D pose estimation 관련 논문입니다. 6D pose 데이터셋을 구축하기 위해 계속해서 새로운 데이터셋 논문들을 팔로우업하고 있는데요. 이제 작성 중인 국문 논문을 마무리 하는…

Continue Reading
Posted in Paper X-Review

[arxiv 2023] Weakly Supervised Vision-and-Language Pre-training with Relative Representation

이 논문의 주요 키워드 Weakly Supervised Vision-Language Pre-training (UVLP, WVLP) Non-parallel Image-Text Data Relative Representation 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Multi-modal contrastive learning에…

Continue Reading
Posted in Paper X-Review

[CVPR 2022] Unsupervised Vision-and-Language Pre-training via Retrieval-based Multi-Granular Alignment

이 논문의 주요 키워드 Weakly Supervised Vision-Language Pre-training (UVLP, WVLP) Non-parallel Image-Text Data 이 논문을 깊게 이해하려면 다음 지식이 필요합니다. Multi-modal contrastive learning에 대한 이해…

Continue Reading
Posted in M.S. X-Diary

2023년을 마무리 하며 – 양희진

INTRO 23년 1월부터 URP를 시작하여 지금까지 이 시간까지 정확히 1년이라는 시간이 흘렀습니다. 1년 전의 생각과 지금의 생각은 어떻게 달라졌는지, 1년이라는 시간을 지내면서 어떤 것을 했는지,…

Continue Reading
Posted in B.S. X-Diary

2023년을 보내면서 – 백지오

안녕하세요. 백지오입니다. 어느새 제가 연구실에 들어온 지도 1년이 지났습니다.작년 이맘때 URP를 진행하며 연구라는 진로에 대해 고민한 기억이 생생한데 어느새 연구실에 점차 적응해나가고 있는 스스로의 모습을…

Continue Reading