[일:] 2024년 12월 02일
[2023 ICLR ] CLIP-VIP: ADAPTING PRE-TRAINED IMAGE-TEXT MODEL TO VIDEO-LANGUAGE ALIGNMENT
정 의철 12/02/2024 [2023 ICLR ] CLIP-VIP: ADAPTING PRE-TRAINED IMAGE-TEXT MODEL TO VIDEO-LANGUAGE ALIGNMENT에 댓글 1개
이번에 소개할 논문은 CLIP 모델을 대규모 비디오 데이터로 post-pretraining하여 비디오-텍스트 작업에서 성능을 향상시키는 방법을 제안한 논문입니다. 먼저, 기존 CLIP 모델을 비디오 데이터로 학습할 때 발생하는…
Posted in X-Diary
ICAN 제2회 네이버랩스 전문가 초청 세미나 참관기
안녕하세요. 11월 13일(수)에 참석했던 제 2회 전문가 초청 세미나에 대한 이야기를 다뤄보고자 합니다. 본 초청 세미나는 “네이버와 실제 세상의 물리적 연결”이라는 주제로 네이버랩스의 권재운 연구원님께서…
Posted in X-Diary
ICAN 제2회 네이버랩스 전문가초청세미나 참관기
안녕하세요. 오늘은 네이버랩스 권재운 연구원님의 네이버의 기술적 비전과 실제 세계와 디지털 세계를 연결하려는 다양한 시도에 대해 소개해 주신 자리였습니다. 처음 발표는 네이버가 단순히 지식인,,,이나 검색이…
[arXiv2024] SAMPart3D: Segment Any Part in 3D Objects
제가 이번에 리뷰할 논문은 SAM을 3D Part segmentation에 적용한 논문입니다. 11월에 공개된 따끈따끈한 논문으로, 최근 로봇의 grasping 관점에서 인식을 위한 방법론에도 관심을 가지고있다보니, part segmentation에…
[NeurIPS 2024] Large Spatial Model: End-to-end Unposed Images to Semantic 3D
김 태주 12/02/2024 Leave a Comment on [NeurIPS 2024] Large Spatial Model: End-to-end Unposed Images to Semantic 3D
이번 리뷰 논문은 전에 소개해드린 3DLF의 느릴 수 밖에 없는 파이프라인과 추론 속도를 보강하기 위한 기법입니다. 해당 기법은 입력 영상으로부터 0.1 second 정도의 온보딩 과정만…
최신 댓글