Author: 이 재찬
[arXiv 2024] LLM-Optic: Unveiling the Capabilities of Large Language Models for Universal Visual Grounding
안녕하세요. 제가 학부 패턴인식 수업에서 프로젝트를 진행하는 데, 그것에 대한 작은 주제로 MLLM(Multimodal LLM)을 활용한 zero-shot Visual Grounding을 시도해보고 있었습니다. 원래 처음엔 단순히 gpt4o에 모호한…
ICAN 제2회 네이버랩스 전문가 초청 세미나 참관기
안녕하세요. 11월 13일(수)에 참석했던 제 2회 전문가 초청 세미나에 대한 이야기를 다뤄보고자 합니다. 본 초청 세미나는 “네이버와 실제 세상의 물리적 연결”이라는 주제로 네이버랩스의 권재운 연구원님께서…
[ICRA 2024] How to Prompt Your Robot: A PromptBook for Manipulation Skills with Code as Policies
안녕하세요. 저번주 목요일에 KRoC에 LLM, VLM을 활용한 매니퓰레이터 제어 정책 생성 관련 서베이 논문을 작성하고 제출하는 동안 여러 논문도 훑어봤겠다, 정신을 가다듬고 리뷰를 작성해보고자 합니다….
[ICML 2024 Oral] Chain of Code: Reasoning with a Language Model-Augmented Code Emulator
안녕하세요. 이번 리뷰는 제가 과거에 리뷰했던 reasoning path를 생성하는 Prompt Engineering 방법론인 Chain of Thought (CoT)에 이어, 동일 계열의 후속 논문 중 python code 기반의…
제 1회 AI Robot & Dining 행사 후기
1부 : Gen AI / LLM 시대에 개발자가 가져야 할 마음가짐 – 카카오 박준호 기술기획팀 파트리더 1. The Era of Generatvie AI / LLM 우리는…
[ICIP 2023] TR3D: TOWARDS REAL-TIME INDOOR 3D OBJECT DETECTION
안녕하세요. 저번 주차에 FCAF3D 라는 Fully Convolutional 3D object detection 방법론 중 anchor-free 기법을 처음으로 제안한 논문을 리뷰했었습니다. FCAF3D에 대한 리뷰가 궁금하신 분들은 저의 리뷰…
[ECCV 2022] FCAF3D: Fully Convolutional Anchor-Free 3D Object Detection
안녕하세요. 이번 리뷰는 저희 로보틱스 팀 기초교육의 일환으로 공부 중인 3D detection task 관련 논문입니다. 사실 TR3D 논문을 읽고 그에 대한 코드 원복과 성능 개선을…
KCCV 2024 참관기
KCCV 2024 (24.08.12(월) ~ 14(수), 부산 BEXCO) 예기치 못한 희진님의 KCCV불참으로 인해 좋은 기회를 이어받아 대신 KCCV2024를 참관하고 오게 되었습니다. 출발 3일 전 급하게 참관…
[IEEE Access 2024] ChatGPT for Robotics: Design Principles and Model Abilities
안녕하세요. 이번 리뷰는 저번 리뷰에 이어 prompting에 관한 논문입니다. 학계의 평판은 좀 애매하다고 들어왔던 IEEE Access 에 개재된 논문이지만 그래도 무려 MS가 참여한 논문이고, 나름…
최신 댓글