[arXiv 2024] PAVLM: Advancing Point Cloud based Affordance Understanding Via Vision-Language Model
안녕하세요. 제가 이번에 리뷰할 논문은 올해 10월에 공개된 논문입니다. 최근 affordance 관련 연구들을 리뷰하였는데, 이번에 리뷰할 논문은 3D point cloud에서의 Affordance 영역을 찾는 논문이라 읽어보게…
[NeurIPS 2024] Training an Open-Vocabulary Monocular 3D Object Detection Model without 3D Data
안녕하세요, 마흔 여덟번째 x-review 입니다. 이번 논문은 2024년도 NeurIPS에 게재된 OV3D 논문으로,처음으로 monocular 3D detection에서 ov 개념을 도입한 논문 입니다. 그럼 바로 리뷰 시작하겠습니다. 1….
[CVPR 2022] RegionCLIP: Region-based Language-Image Pretraining
안녕하세요. 이번 리뷰할 논문은 RegionCLIP으로, 한 문장으로 요약하자면 “CLIP이 Detection, Segmentation 등에서 조금 더 유용히 활용되고자 제안된 방법”입니다. 비록 2년 전의 방법론이나, 최근의 VLM 기반의…
[TNNLS 2023] Domain Adaptation via Prompt Learning
오늘 리뷰할 논문은 Prompt Learning 을 DA 에 접목한 연구입니다.2022년에 arxiv, 그리고 2023년에 TNNLS에 게재된 논문이고 인용수가 160회에 육박하는 논문입니다. DA 수행을 위해 Prompt Learning…
[EMNLP 2024] Interpretable Composition Attribution Enhancement for Visio-linguistic Compositional Understanding
안녕하세요, 이번 주 X-Review는 24년도 EMNLP에 게재된 논문 <Interpretable Composition Attribution Enhancement for Visio-linguistic Compositional Understanding>을 주제로 작성하겠습니다. 연구 중인 Video Moment Retrieval task도 결국…
ICAN 제2회 네이버랩스 전문가 초청 세미나 참관기
안녕하세요, 이번에 RCV에 새로 합류하게 된 안우현입니다. 저는 11월 13일에 참여했던 네이버랩스 전문가 초청 세미나에 대한 후기를 공유하고자 합니다. 이번 세미나의 연사로는 네이버랩스의 권재운 연구원님이…
[arXiv2024] LLaVA-MR: Large Language-and-Vision Assistant for Video Moment Retrieval
안녕하세요. 오늘 제가 리뷰할 논문은 아직 아카이브에만 등재된 논문이지만, 제목을 보고 궁금증이 생겨서 읽게된 LLaVA-MR입니다. 올해 하반기부터해서 Video Moment Retrieval(VMR) task에서도 사전학습된 foundation 모델을 활용하는…
[2023 ICLR ] CLIP-VIP: ADAPTING PRE-TRAINED IMAGE-TEXT MODEL TO VIDEO-LANGUAGE ALIGNMENT
이번에 소개할 논문은 CLIP 모델을 대규모 비디오 데이터로 post-pretraining하여 비디오-텍스트 작업에서 성능을 향상시키는 방법을 제안한 논문입니다. 먼저, 기존 CLIP 모델을 비디오 데이터로 학습할 때 발생하는…
ICAN 제2회 네이버랩스 전문가 초청 세미나 참관기
안녕하세요. 11월 13일(수)에 참석했던 제 2회 전문가 초청 세미나에 대한 이야기를 다뤄보고자 합니다. 본 초청 세미나는 “네이버와 실제 세상의 물리적 연결”이라는 주제로 네이버랩스의 권재운 연구원님께서…
ICAN 제2회 네이버랩스 전문가초청세미나 참관기
안녕하세요. 오늘은 네이버랩스 권재운 연구원님의 네이버의 기술적 비전과 실제 세계와 디지털 세계를 연결하려는 다양한 시도에 대해 소개해 주신 자리였습니다. 처음 발표는 네이버가 단순히 지식인,,,이나 검색이…
안녕하세요 질문 남겨주셔서 감사합니다 논문에서는 CTR 데이터에 대한 결과와 비교하면서 STR의 경우 이미지 내 텍스트가 갖는 특징 자체가 보다 덜…