[월:] 2024년 11월

Posted in M.S. X-Diary

2024 자율주행 인공지능 챌린지 참관기

오늘의 X-Diary로는 10월에 진행되었던 2024년 자율주행 인공지능 챌린지에 참석하고 수상했던 후기를 간단하게 작성해보고자 합니다. 모델 방법론적인 이야기는 다루지 않을 생각이고, 소감 위주로 작성할 생각입니다. 대회는…

Continue Reading
Posted in X-Review

[ICRA 2024] How to Prompt Your Robot: A PromptBook for Manipulation Skills with Code as Policies

안녕하세요. 저번주 목요일에 KRoC에 LLM, VLM을 활용한 매니퓰레이터 제어 정책 생성 관련 서베이 논문을 작성하고 제출하는 동안 여러 논문도 훑어봤겠다, 정신을 가다듬고 리뷰를 작성해보고자 합니다….

Continue Reading
Posted in Conference X-Review

[CVPR 2024]GLID: Pre-training a Generalist Encoder-Decoder Vision Model

제가 이번에 리뷰할 논문은 CVPR2024 논문으로, 다양한 task로의 task-agnostic한 사전학습된 encoder-decoder를 만드는 논문입니다. 미학습물체파지 과제에서 기하정보를 기반으로 미학습 물체 후보 선정 및 의사(pseudo) 라벨 생성…

Continue Reading
Posted in X-Review

[NIPS2024] Temporal Grounding with Relevance Feedback in Videos

안녕하세요. 오늘 리뷰할 논문은 NIPS2014에 게재된 Temporal Sentence Grounding(TSG) 논문으로 이름만 다를 뿐 Video Moment Retrieval과 같은 연구입니다. Introduction TSG는 Temporal Sentence Grounding 연구로 영상…

Continue Reading
Posted in X-Review

[CVPR 2019] Relational Knowledge Distillation

논문 : 링크 / Github : 링크 / 참고 : 링크 안녕하세요, 허재연입니다. 오늘 다룰 논문은 2019년 POSTECH CVlab에서 CVPR에 게재한 Relational Knowledge Distillation 입니다….

Continue Reading
Posted in Paper X-Review

[CVPR 2022] Bridging Video-text Retrieval with Multiple Choice Questions

안녕하세요, 오늘의 X-Review는 Video-Text 간 상호작용을 극대화하는 사전학습 방식에 관련된 22년도 CVPR 논문 <Bridging Video-text Retrieval with Multiple Choice Questions>입니다. 효율성과 정확도 모두 가져가고자하는 사전학습…

Continue Reading
Posted in X-Review

[CVPR 2024]Amodal Ground Truth and Completion in the Wild

안녕하세요, 3번 째 X-Review 입니다. 이번주도 Amodal Completion에 대한 논문을 읽어봤습니다. 이 논문의 저자들은 3D 데이터를 활용하여 가려진 물체의 Amodal Masks를 자동 생성하는 Pipeline을 제안하고…

Continue Reading
Posted in Paper X-Review

[arXiv 2024] Point-SAM: Promptable 3D Segmentation Model for Point Clouds

안녕하세요, 마흔 일곱번째 x-review 입니다. 이번 논문은 arXiv에 올라온 논문이긴 하나, 3D FM을 구성하기 위한 연구를 수행했다고 하여 읽고 리뷰를 작성해 보았습니다. 그럼 바로 리뷰…

Continue Reading
Posted in Paper X-Review

[ICLR 2021] Free lunch for few-shot learning: Distribution calibration

안녕하세요. 본 논문은 few-shot learning에 관한 논문입니다. 제목에서 알 수 있듯이 데이터 수집 비용 없이 기존의 정보를 활용해 추가 데이터를 생성하여 few-shot learning의 성능을 높인…

Continue Reading
Posted in X-Review

[ECCCV2024] Uncertainty-Aware Sign Language Vido Retrieval with Probability Distribution Modeling

안녕하세요 박성준 연구원입니다. 제가 오늘 리뷰할 논문은 조금은 생소할 수 있는 task인 Sign Language(수화) Video Retrieval를 다룬 논문입니다. Introduction Sign Language Video Retrieval은 두가지의 목표를…

Continue Reading