Author: 이 재찬

Posted in X-Review

[arxiv 2025] LBAP: Improved Uncertainty Alignment of LLM Planners using Bayesian Inference

안녕하세요. 이번 리뷰도 LLM의 hallucination 현상을 완화하기 위한 방법으로 uncertainty 추정 관련 논문을 들고왔습니다. 제목을 보시면 bayesian inference란 내용이 나오는데요. 그동안 제가 리뷰해왔던 uncertainty 추정…

Continue Reading
Posted in X-Diary

2025년 상반기 회고

저는 샤워를 오래합니다. 기본 30분 정도 걸리는데요. 진짜 열심히 깨끗이 씻어서 오래걸린다기 보단, 사실 물 맞으면서 생각하는 시간이 대부분입니다. 평소엔 물 맞으며 제 연구에 대해…

Continue Reading
Posted in X-Review

[NeurIPS 2024] Introspective Planning: Aligning Robots’ Uncertainty with Inherent Task Ambiguity

안녕하세요. 이번에도 로봇 작업 관점에서의 hallucination 및 작업 모호성 문제 해결을 위한 uncertainty 추정 관련 연구를 들고 왔습니다. 사실 NIPS 에 실린 논문이라 기대를 많이…

Continue Reading
Posted in X-Review

[ICRA 2024] Universal Visual Decomposer: Long-Horizon Manipulation Made Easy

안녕하세요. 저번 리뷰는 Long-text Uncertainty Quantification(LUQ) 이라는 불확실성 추정 기반으로 LLM의 Long-text response에서의 hallucination현상을 정량적으로 추론해보자는 개념의 방법론을 들고왔었는데요. 갑자기 또 매니퓰레이션과 policy 관점에서의 무언가를…

Continue Reading
Posted in X-Review

[EMNLP 2024] LUQ: Long-text Uncertainty Quantification for LLMs

안녕하세요. 이번엔 LLM에서의 Hallucination 문제를 uncertainty score 개념을 기반으로 인지하고 이를 정량적으로 수치화한 뒤 증상을 완화하기 위한 방법론에 대해 리뷰를 가져왔습니다. 1. Introduction LLM은 다양한…

Continue Reading
Posted in X-Review

[ICLR 2024] Online Continual Learning For Interactive Instruction Following Agents

안녕하세요. 이번 논문은 Online Continual Learning, 즉 Incremental Learning 과 관련된 논문입니다. 특히 embodied agent 혹은 로봇 에이전트를 그 대상으로 두고, 앞으로 이 agent가 세상을…

Continue Reading
Posted in X-Review

[CoRL 2023 Oral] Bootstrap Your Own Skills: Learning to Solve New Tasks with Large Language Model Guidance

안녕하세요. 이번 리뷰는 로봇 에이전트가 기존에 가지고 있는 skill policy들에 기반하여 LLM을 통해 가이던스를 얻어 적절한 skill 조합을 만들어내고 그것으로부터 로봇의 Long-horizon task 를 해결하는…

Continue Reading
Posted in X-Review

[ICLR 2025] PhysBench: Benchmarking and Enhancing Vision-Language Models for Physical World Understanding

안녕하세요. 이번 리뷰는 조금 색다른 벤치마크 관련 논문을 가져와 보았습니다(무려 150장). 바로 physical 적인 정보를 다룬 VQA 데이터셋인데요. 특히 VLM(MLLM) 의 physical 이해 능력을 벤치마킹하며…

Continue Reading
Posted in X-Review

[ICRA 2017] Learning Modular Neural Network Policies for Multi-Task and Multi-Robot Transfer

안녕하세요. 이번 리뷰도 매니퓰레이터 강화학습에 관한 내용으로 들고 왔습니다. 로봇과 태스크 변화에도 일반화를 보이는 강화학습 기법에 대한 가능성을 풀어나간 논문입니다. 리뷰 시작하겠습니다. 1. Introduction 이게…

Continue Reading
Posted in X-Review

[RA-L 2022] Q-attention: Enabling Efficient Learning for Vision-based Robotic Manipulation

안녕하세요. 이번 리뷰는 로보틱스 팀에 핏한 매니퓰레이터 강화학습에 관한 내용으로 들고 왔습니다. 로봇 매니퓰레이터 작업을 비전 기반의 강화학습인 Q-attention이란 개념을 도입해 풀어나간 논문입니다. RLBench 기반이라…

Continue Reading