ICAN 제2회 네이버랩스 전문가 초청세미나 참관기
안녕하세요, 김영규입니다. 이번 후기는 11월 13일에 참석했던 제 2회 전문가 초청 세미나에 대한 내용입니다. 이번 세미나에서는 네이버랩스의 권재운 연구원님께서 ‘네이버와 실제 세상의 물리적 연결’이라는 주제로…
2024 자율주행 인공지능 챌린지 후기
한 주 늦은 인공지능 챌린지 후기가 되었습니다. 이번 10월 한 달 간, 신정민 연구원 및 권석준 연구원과 자율주행 DNA 기술포럼 (과학기술정보통신부) 주최의 자율주행 인공지능에 참가하였습니다….
2024 자율주행 인공지능 챌린지 참관기
오늘의 X-Diary로는 10월에 진행되었던 2024년 자율주행 인공지능 챌린지에 참석하고 수상했던 후기를 간단하게 작성해보고자 합니다. 모델 방법론적인 이야기는 다루지 않을 생각이고, 소감 위주로 작성할 생각입니다. 대회는…
[ICRA 2024] How to Prompt Your Robot: A PromptBook for Manipulation Skills with Code as Policies
안녕하세요. 저번주 목요일에 KRoC에 LLM, VLM을 활용한 매니퓰레이터 제어 정책 생성 관련 서베이 논문을 작성하고 제출하는 동안 여러 논문도 훑어봤겠다, 정신을 가다듬고 리뷰를 작성해보고자 합니다….
[CVPR 2024]GLID: Pre-training a Generalist Encoder-Decoder Vision Model
제가 이번에 리뷰할 논문은 CVPR2024 논문으로, 다양한 task로의 task-agnostic한 사전학습된 encoder-decoder를 만드는 논문입니다. 미학습물체파지 과제에서 기하정보를 기반으로 미학습 물체 후보 선정 및 의사(pseudo) 라벨 생성…
[NIPS2024] Temporal Grounding with Relevance Feedback in Videos
안녕하세요. 오늘 리뷰할 논문은 NIPS2014에 게재된 Temporal Sentence Grounding(TSG) 논문으로 이름만 다를 뿐 Video Moment Retrieval과 같은 연구입니다. Introduction TSG는 Temporal Sentence Grounding 연구로 영상…
[CVPR 2019] Relational Knowledge Distillation
논문 : 링크 / Github : 링크 / 참고 : 링크 안녕하세요, 허재연입니다. 오늘 다룰 논문은 2019년 POSTECH CVlab에서 CVPR에 게재한 Relational Knowledge Distillation 입니다….
[CVPR 2022] Bridging Video-text Retrieval with Multiple Choice Questions
안녕하세요, 오늘의 X-Review는 Video-Text 간 상호작용을 극대화하는 사전학습 방식에 관련된 22년도 CVPR 논문 <Bridging Video-text Retrieval with Multiple Choice Questions>입니다. 효율성과 정확도 모두 가져가고자하는 사전학습…
[CVPR 2024]Amodal Ground Truth and Completion in the Wild
안녕하세요, 3번 째 X-Review 입니다. 이번주도 Amodal Completion에 대한 논문을 읽어봤습니다. 이 논문의 저자들은 3D 데이터를 활용하여 가려진 물체의 Amodal Masks를 자동 생성하는 Pipeline을 제안하고…
[arXiv 2024] Point-SAM: Promptable 3D Segmentation Model for Point Clouds
안녕하세요, 마흔 일곱번째 x-review 입니다. 이번 논문은 arXiv에 올라온 논문이긴 하나, 3D FM을 구성하기 위한 연구를 수행했다고 하여 읽고 리뷰를 작성해 보았습니다. 그럼 바로 리뷰…
안녕하세요 지연님 좋은 리뷰 감사합니다. SGM 설명해주시는 부분에서 저는 문맥상 SGM이 학습시에만 사용되서 visual feature가 context정보를 학습하도록 돕는다고 이해했는데 "SGM은…