[일:] 2025년 03월 31일
[CVPR 2023] CORA: Adapting CLIP for Open-Vocabulary Detection with Region Prompting and Anchor Pre-Matching
허 재연 03/31/2025 [CVPR 2023] CORA: Adapting CLIP for Open-Vocabulary Detection with Region Prompting and Anchor Pre-Matching에 댓글 1개
안녕하세요, 허재연입니다. 이번 리뷰에서 다룰 논문은 CVPR 2023에 게재된 CORA: Adapting CLIP for Open-Vocabulary Detection with Region Prompting and Anchor Pre-Matching 라는 논문으로, 기존 VLM을…
Posted in X-Review
[ASCC 2017]Vision-based Deep Reinforcement Learning to Control a Manipulation
김 영규 03/31/2025 [ASCC 2017]Vision-based Deep Reinforcement Learning to Control a Manipulation에 댓글 1개
안녕하세요, 이번주는 미니 챌린지 마지막 단계의 목표인 강화학습을 통한 복잡한 모션 수행을 위해 공부하던 중 발견 한 논문 리뷰입니다. 이 논문에서는 강화학습을 적용하여 카메라 영상만을…
Posted in News
[CVPR 2021] FFB6D: A Full Flow Bidirectional Fusion Network for 6D Pose Estimation
류 지연 03/31/2025 Leave a Comment on [CVPR 2021] FFB6D: A Full Flow Bidirectional Fusion Network for 6D Pose Estimation
안녕하세요 PVNet, PVN3D에 이어서 FFB6D 논문으로 찾아왔습니다. 세 논문 모두 6자유도를 갖는 3차원 물체의 자세를 추정하기 위한 방법을 다룬 논문들입니다. 6자유도를 갖는 3차원 물체의 자세를…
[2022 Neurocomputing]CLIP4Clip: An empirical study of CLIP for end to end video clip retrieval and captioning
홍 주영 03/31/2025 [2022 Neurocomputing]CLIP4Clip: An empirical study of CLIP for end to end video clip retrieval and captioning에 댓글 3개
오늘 리뷰할 논문은 이미지-텍스트 사전학습 모델인 CLIP을 비디오-텍스트 검색(Video-Text Retrieval)으로 확장한 모델인 CLIP4Clip에 관한 것입니다. 저자는 CLIP의 강력한 멀티모달 표현력을 활용하면서도, 비디오라는 시간 정보를 가진…
최신 댓글