[ICRA 2025] HeLiOS: Heterogeneous LiDAR Place Recognition via Overlap-based Learning and Local Spherical Transformer
오랜만에 엑스리뷰 작성 감 좀 잡을 겸 인턴 기간동안 읽었던 논문 한편을 가볍게 리뷰할까 합니다. ICRA 2025 에 게재된 HeLiOS 라고 하는 논문이며, 서울대 김아영…
[ICCV 2023] Progressive Spatio-Temporal Prototype Matching for Text-Video Retrieval
지난주 리뷰와 마찬가지로, Text-Video Retrieval 페이퍼에 대해 리뷰해보겠습니다. 1. Introduction Text-Video Retrieval(TVR) 은 문장 하나를 입력하면, 그에 맞는 비디오를 찾는 연구입니다. 그런데 기존 모델들은 문장…
[2025 상반기] 산업체 인턴쉽 후기
안녕하세요, 2025년 4월~ 9월, 총 6개월간 네이버랩스 Robot Vision & Learning 팀에서 인턴쉽을 진행한 석사과정 3학기 권석준입니다. 제가 진행했던 인턴쉽에 대해 후기로 남겨보고자 합니 1….
CoRL 2025 참관기
안녕하세요. 9월 27일~10월 2일까지 4일간 진행된 CoRL 학회 참관기 입니다. 우선, 해당 학회는 robot learning 학회로, 최근 핫한 연구 분야인 로보틱스 학회입니다. 먼저 이런 학회에…
[arXiv2025]Does Your Vision-Language Model Get Lost in the Long Video Sampling Dilemma?
본 논문은 비디오 연구에서 Sampling Dilemma 문제를 수면 위로 올리며, 이를 위한 벤치마크 데이터셋을 공개하는 논문입니다. Sampling Dilemma란 무엇인지에서 부터 논문이 어떻게 벤치마크를 구성했는지 리뷰를…
CoRL 2025 참관기
안녕하세요. 교수님이 주신 좋은 기회로 저희 로보틱스 팀원들이 모두 참석했던 CoRL 2025 참관기를 작성해보고자 합니다. 학회는 9/27(토)~9/30(화)까지 4일간 코엑스에서 진행되었습니다. 국제 탑티어 학회는 처음 참관하기도…
[ICRA 2023]GNM: A General Navigation Model to Drive Any Robot
안녕하세요. 이번에 소개드릴 논문은 Visual Navigation 분야의 연구로 ICRA 2023에 게재된 GNM: A General Navigation Model to Drive Any Robot 입니다. Visual Navigation 분야는 저에게…
[ICML 2021] Learning Transferable Visual Models From Natural Language Supervision
< Intro > 1. Zero-shot image classification 제로샷 이미지 분류는 한마디로 말하자면 학습데이터에 존재하지 않는 새로운 class에 대해 classification을 할수 있는 기술을 말합니다전통적인 이미지 분류에서는…
[CVPR2023] Teaching Structured Vision & Language Concepts to Vision & Language Models
안녕하세요. 박성준 연구원입니다. 오늘 리뷰할 논문은 Vision-Language 모델의 compositional 이해 능력을 개선한 논문입니다. Introduction CLIP과 같은 Vision-Language 모델은 이미지와 텍스트를 함께 학습하는 것으로 Classification, Detection,…
CoRL 2025 참관 후기
안녕하세요, 이번에는 CoRL 학회 참석 후기를 작성해보려고 합니다. 운이 좋게 현재 관심을 뜨겁게 받고 있는 로봇 분야의 학회가 한국에서 열려 너무 좋았고, 그것을 직접 체험할…
안녕하세요 인하님 리뷰 잘 읽었습니다~ 열심히 로봇 만드는거는 자주 봤는데 저랑는 다른 분야다 보니 구체적으로 이 손으로 어떤걸 하고 계신지는…