Author: 이 재찬

Posted in B.S. X-Diary

KRoC 2025 참관기

안녕하세요. 이번 주는 X-Diary로 KRoC 2025 포스터 발표 및 참관 후기글을 작성해보고자 합니다. 이번 KRoC 2025는 평창 알펜시아 리조트에서 이루어졌고 학술대회 전체 기간은 25/02/12(수) ~…

Continue Reading
Posted in X-Review

[RSS 2024] MOKA: Open-World Robotic Manipulation through Mark-Based Visual Prompting

안녕하세요. 이번 논문은 VLM과 visual prompting을 활용한 open-world 환경에서의 Robot Manipulation 태스크 관련 논문입니다. 자세히는 free-form language instruction 에 대해 VLM visual prompting을 활용한 Marking…

Continue Reading
Posted in X-Review

[arXiv 2024] RAP: Retrieval-Augmented Planning with Contextual Memory for Multimodal LLM Agents

안녕하세요. 이번 논문은 과제 제안서 작업으로 MLLM + RAG 에 대한 서베이 중 알게 된 논문입니다. 정확히 말하면 본 논문의 큰 분야는 MLLM + RAG를…

Continue Reading
Posted in X-Review

[AAAI 2024] GroundVLP: Harnessing Zero-Shot Visual Grounding from Vision- Language Pre-training and Open-Vocabulary Object Detection

안녕하세요. 이번 논문은 Zero-shot Visual Grounding 태스크 중 VLP(Vision Language Pretraining model)와 OVD를 결합한 논문입니다. zero-shot grounding을 주제로 국문저널급을 한편을 쓰기로 되어 있어서 가장 최신의…

Continue Reading
Posted in X-Diary

[이재찬] 2024년 회고록

저에게 2024년 한 해는 RCV의 일원으로 함께하게 된 첫 해이자, 저의 인생의 전환점이라고도 볼 수 있는 한해라고 생각합니다.연구실 생활에 대해 전혀 모른 채 사실 어떻게…

Continue Reading
Posted in X-Review

[arXiv 2024] LLM-Optic: Unveiling the Capabilities of Large Language Models for Universal Visual Grounding

안녕하세요. 제가 학부 패턴인식 수업에서 프로젝트를 진행하는 데, 그것에 대한 작은 주제로 MLLM(Multimodal LLM)을 활용한 zero-shot Visual Grounding을 시도해보고 있었습니다. 원래 처음엔 단순히 gpt4o에 모호한…

Continue Reading
Posted in X-Diary

ICAN 제2회 네이버랩스 전문가 초청 세미나 참관기

안녕하세요. 11월 13일(수)에 참석했던 제 2회 전문가 초청 세미나에 대한 이야기를 다뤄보고자 합니다. 본 초청 세미나는 “네이버와 실제 세상의 물리적 연결”이라는 주제로 네이버랩스의 권재운 연구원님께서…

Continue Reading
Posted in X-Review

[ICRA 2024] How to Prompt Your Robot: A PromptBook for Manipulation Skills with Code as Policies

안녕하세요. 저번주 목요일에 KRoC에 LLM, VLM을 활용한 매니퓰레이터 제어 정책 생성 관련 서베이 논문을 작성하고 제출하는 동안 여러 논문도 훑어봤겠다, 정신을 가다듬고 리뷰를 작성해보고자 합니다….

Continue Reading
Posted in X-Review

[ICML 2024 Oral] Chain of Code: Reasoning with a Language Model-Augmented Code Emulator

안녕하세요. 이번 리뷰는 제가 과거에 리뷰했던 reasoning path를 생성하는 Prompt Engineering 방법론인 Chain of Thought (CoT)에 이어, 동일 계열의 후속 논문 중 python code 기반의…

Continue Reading
Posted in B.S. X-Diary

제 1회 AI Robot & Dining 행사 후기

1부 : Gen AI / LLM 시대에 개발자가 가져야 할 마음가짐 – 카카오 박준호 기술기획팀 파트리더 1. The Era of Generatvie AI / LLM 우리는…

Continue Reading