Author: 이 재찬

Posted in X-Review

[CoRL 2025] Steering Your Diffusion Policy with Latent Space Reinforcement Learning

논문 정보 저자: Andrew Wagenmaker1, Mitsuhiko Nakamoto1, Yunchu Zhang2, Seohong Park1, Waleed Yagoub2, Anusha Nagabandi3, Abhishek Gupta2, Sergey Levine1* 1: UC Berkeley, 2: University of Washington, 3: Amazon 링크: https://arxiv.org/abs/2506.15799 프로젝트페이지: https://diffusion-steering.github.io/ 안녕하세요. 이번 논문…

Continue Reading
Posted in X-Review

[RSS 2025 Workshop] From Foresight to Forethought VLM-In-the-Loop Policy Steering via Latent Alignment

안녕하세요. 이번 논문 리뷰는 DP같은 generative robot policy가 deployment-time 에 다양한 실패를 보이는 문제를 해결하기 위한 runtime policy steering 방법론입니다. 특히 해당 실패를 DreamerV3 기반…

Continue Reading
Posted in X-Review

[NeurIPS 2025] Chain-of-Action: Trajectory Autoregressive Modeling for Robotic Manipulation

안녕하세요. 저번 세미나 시간에 발표로 들고 왔던 Chain of Action 논문을 리뷰로 남기기 위해 가져왔습니다. ByteDance Seed에서 제안한 액션 역방향 생성의 새로운 패러다임인데요. 기존의 액션을…

Continue Reading
Posted in X-Review

[arxiv 2025] Motus: A Unified Latent Action World Model

이번 리뷰는 논문 작업이 끝난 후 다음 연구 주제인 Long-horizon Task와 Failure Detection 분야를 서칭하던 중, 자극적인 제목에 끌려 보게되었습니다. Latent Action, World Model 을…

Continue Reading
Posted in M.S. X-Diary

[이재찬] 2025년을 보내며

이번 회고글은 일요일 밤 자전거 길 위에서 가다서다 하며 핸드폰 메모장에 조각글처럼 모아놓은 생각들에서 시작되네요. 막상 회고글을 써볼까~하고 각 잡고 카페나 집에 죽치고 노트북 앞에만…

Continue Reading
Posted in X-Review

[IROS 2025] VLM See, Robot Do: Human Demo Video to Robot Action Plan via Vision Language Model

안녕하세요. 이번 리뷰는 Long-horizon human demo video를 인풋으로 받아, VLM 기반으로 sub-task decomposition을 수행하고, 이를 LMP(Language Model Program) code generation 방식과 연결지어 low-level primitive action까지…

Continue Reading
Posted in X-Diary

CoRL 2025 참관기

안녕하세요. 교수님이 주신 좋은 기회로 저희 로보틱스 팀원들이 모두 참석했던 CoRL 2025 참관기를 작성해보고자 합니다. 학회는 9/27(토)~9/30(화)까지 4일간 코엑스에서 진행되었습니다. 국제 탑티어 학회는 처음 참관하기도…

Continue Reading
Posted in X-Review

[CoRL 2025] Planning from Point Clouds over Continuous Actions for Multi-object Rearrangement

안녕하세요. CoRL 2025 Oral, Planning & Safety & Robustness 세션에서 발표될 논문이라고 하여 관심을 가지고 읽어보게 되었습니다. 해당 세션에 유독 oral paper가 적었는데요. 이 논문은…

Continue Reading
Posted in X-Review

[arxiv 2025.02] SOFAR: Language-Grounded Orientation Bridges Spatial Reasoning and Object Manipulation

manipulation task의 high-level planning 시 spatial 정보, 특히 semantic orientation 정보를 고려한 방법론을 들고 왔습니다. 복잡한 로봇 조작 액션을 위해선 ‘객체 중심의 의미론적 방향 이해’…

Continue Reading
Posted in X-Diary

2025년도 URP 조교를 마치며

지난 x-diary들을 돌아보니 그 동안 항상 무언갈 배우는 입장이었고, 그 배움의 과정에서 느낀점들을 적어왔었는데요. URP 조교를 마무리하며 누군갈 멘토링하고 난 후 회고를 적는 건 처음이라…

Continue Reading