Author: 이 재찬
[arxiv 2025.02] SOFAR: Language-Grounded Orientation Bridges Spatial Reasoning and Object Manipulation
manipulation task의 high-level planning 시 spatial 정보, 특히 semantic orientation 정보를 고려한 방법론을 들고 왔습니다. 복잡한 로봇 조작 액션을 위해선 ‘객체 중심의 의미론적 방향 이해’…
2025년도 URP 조교를 마치며
지난 x-diary들을 돌아보니 그 동안 항상 무언갈 배우는 입장이었고, 그 배움의 과정에서 느낀점들을 적어왔었는데요. URP 조교를 마무리하며 누군갈 멘토링하고 난 후 회고를 적는 건 처음이라…
[ICCV 2025] RoBridge: A Hierarchical Architecture Bridging Cognition and Execution for General Robotic Manipulation
안녕하세요. 이번엔 VLM high-level planning과 RL+IL의 low-level execution 간의 각각의 장단점을 보완해서 중간에 저자들이 제안한 symbolic bridge 방식으로 안정적으로 통합하는 general manipulation 프레임워크를 들고 왔습니다….
[arxiv 2025] LBAP: Improved Uncertainty Alignment of LLM Planners using Bayesian Inference
안녕하세요. 이번 리뷰도 LLM의 hallucination 현상을 완화하기 위한 방법으로 uncertainty 추정 관련 논문을 들고왔습니다. 제목을 보시면 bayesian inference란 내용이 나오는데요. 그동안 제가 리뷰해왔던 uncertainty 추정…
2025년 상반기 회고
저는 샤워를 오래합니다. 기본 30분 정도 걸리는데요. 진짜 열심히 깨끗이 씻어서 오래걸린다기 보단, 사실 물 맞으면서 생각하는 시간이 대부분입니다. 평소엔 물 맞으며 제 연구에 대해…
[NeurIPS 2024] Introspective Planning: Aligning Robots’ Uncertainty with Inherent Task Ambiguity
안녕하세요. 이번에도 로봇 작업 관점에서의 hallucination 및 작업 모호성 문제 해결을 위한 uncertainty 추정 관련 연구를 들고 왔습니다. 사실 NIPS 에 실린 논문이라 기대를 많이…
[ICRA 2024] Universal Visual Decomposer: Long-Horizon Manipulation Made Easy
안녕하세요. 저번 리뷰는 Long-text Uncertainty Quantification(LUQ) 이라는 불확실성 추정 기반으로 LLM의 Long-text response에서의 hallucination현상을 정량적으로 추론해보자는 개념의 방법론을 들고왔었는데요. 갑자기 또 매니퓰레이션과 policy 관점에서의 무언가를…
[EMNLP 2024] LUQ: Long-text Uncertainty Quantification for LLMs
안녕하세요. 이번엔 LLM에서의 Hallucination 문제를 uncertainty score 개념을 기반으로 인지하고 이를 정량적으로 수치화한 뒤 증상을 완화하기 위한 방법론에 대해 리뷰를 가져왔습니다. 1. Introduction LLM은 다양한…
[ICLR 2024] Online Continual Learning For Interactive Instruction Following Agents
안녕하세요. 이번 논문은 Online Continual Learning, 즉 Incremental Learning 과 관련된 논문입니다. 특히 embodied agent 혹은 로봇 에이전트를 그 대상으로 두고, 앞으로 이 agent가 세상을…
[CoRL 2023 Oral] Bootstrap Your Own Skills: Learning to Solve New Tasks with Large Language Model Guidance
안녕하세요. 이번 리뷰는 로봇 에이전트가 기존에 가지고 있는 skill policy들에 기반하여 LLM을 통해 가이던스를 얻어 적절한 skill 조합을 만들어내고 그것으로부터 로봇의 Long-horizon task 를 해결하는…
안녕하세요 우현님, 좋은 리뷰 감사합니다. 동적 비율 손실을 정의할 때, 레이어별 목표 유지 비율은 사용자가 직접 정의해야 하는 건가요? 직접…