2024년 11월 – Robotics and Computer Vision Lab

2024 자율주행 인공지능 챌린지 참관기

오늘의 X-Diary로는 10월에 진행되었던 2024년 자율주행 인공지능 챌린지에 참석하고 수상했던 후기를 간단하게 작성해보고자 합니다. 모델 방법론적인 이야기는 다루지 않을 생각이고, 소감 위주로 작성할 생각입니다. 대회는…

X-Review

[ICRA 2024] How to Prompt Your Robot: A PromptBook for Manipulation Skills with Code as Policies

안녕하세요. 저번주 목요일에 KRoC에 LLM, VLM을 활용한 매니퓰레이터 제어 정책 생성 관련 서베이 논문을 작성하고 제출하는 동안 여러 논문도 훑어봤겠다, 정신을 가다듬고 리뷰를 작성해보고자 합니다….

Conference X-Review

[CVPR 2024]GLID: Pre-training a Generalist Encoder-Decoder Vision Model

제가 이번에 리뷰할 논문은 CVPR2024 논문으로, 다양한 task로의 task-agnostic한 사전학습된 encoder-decoder를 만드는 논문입니다. 미학습물체파지 과제에서 기하정보를 기반으로 미학습 물체 후보 선정 및 의사(pseudo) 라벨 생성…

X-Review

[NIPS2024] Temporal Grounding with Relevance Feedback in Videos

안녕하세요. 오늘 리뷰할 논문은 NIPS2014에 게재된 Temporal Sentence Grounding(TSG) 논문으로 이름만 다를 뿐 Video Moment Retrieval과 같은 연구입니다. Introduction TSG는 Temporal Sentence Grounding 연구로 영상…

X-Review

[CVPR 2019] Relational Knowledge Distillation

논문 : 링크 / Github : 링크 / 참고 : 링크 안녕하세요, 허재연입니다. 오늘 다룰 논문은 2019년 POSTECH CVlab에서 CVPR에 게재한 Relational Knowledge Distillation 입니다….

Paper X-Review

[CVPR 2022] Bridging Video-text Retrieval with Multiple Choice Questions

안녕하세요, 오늘의 X-Review는 Video-Text 간 상호작용을 극대화하는 사전학습 방식에 관련된 22년도 CVPR 논문 <Bridging Video-text Retrieval with Multiple Choice Questions>입니다. 효율성과 정확도 모두 가져가고자하는 사전학습…

X-Review