Category: X-Review

Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.

Posted in X-Review

[CVPR 2025]AffordDP: Generalizable Diffusion Policy with Transferable Affordance

Abstract 해당 논문은 일반화 가능한 로봇 조작을 위해 Diffusion 기반의 모방학습에 Affordance 개념을 추가한 AffordDP를 제안합니다. Diffusion 기반의 policy는 로봇 작업에서 인상적인 성능을 보여주었으나, Out-of-Domain에…

Continue Reading
Posted in X-Review

[arXiv 2026] How to Peel with a Knife : Aligning Fine-Grained Manipulation with Human Preference

안녕하세요, 이번주 X-review는 fine-grained manipulation에 관련한 내용으로 작성해보려고 합니다. 최근 robot learning 패러다임에는 기존의 로봇데이터로만 학습하는것에 그치지 않고 human video와 같은 다른 소스를 통한 학습이나…

Continue Reading
Posted in Conference X-Review

[CVPR2026] Planning in 8 Tokens: A Compact Discrete Tokenizer for Latent World Model

Intro 해당 논문은 navigation과 manipulation에 사용할 수 있는 효율적인 World Model을 만드는 것을 목표로 합니다. World Model은 잘 아시다시피 해당 모델이 주변 환경의 역동성을 시뮬레이션하여…

Continue Reading
Posted in X-Review

[RSS 2025 Workshop] From Foresight to Forethought VLM-In-the-Loop Policy Steering via Latent Alignment

안녕하세요. 이번 논문 리뷰는 DP같은 generative robot policy가 deployment-time 에 다양한 실패를 보이는 문제를 해결하기 위한 runtime policy steering 방법론입니다. 특히 해당 실패를 DreamerV3 기반…

Continue Reading
Posted in Paper X-Review

[ICCV 2025]Multi-Granular Spatio-Temporal Token Merging for Training-Free Acceleration of Video LLMs

Video Large Language Models(Video-LMMs)는 시공간 토큰(spatiotemporal tokens)을 활용해서 강력한 비디오 이해 능력을 가지게 되었지만 토큰 개수가 많아질수록 연산량이 2차적으로 증가한다는 문제점을 가지고 있었습니다. 이에 저자들은…

Continue Reading
Posted in X-Review

[arXiv 2026] Observing and Controlling Features in Vision-Language-Action Models

안녕하세요, 이번주는 VLA의 action steering이 되는가?에 대한 분석을 담은 연구를 리뷰해보려고 합니다. LLM 쪽에선 action steering이 활발하지만, VLA 쪽에서는 멀티모달 입력이나 closed-loop로 실제 로봇이 상호작용…

Continue Reading
Posted in X-Review

[ICRA 2026]NavDP: Learning Sim-to-Real Navigation Diffusion Policy with Privileged Information Guidance

안녕하세요 이번에 리뷰할 논문은 internrobotics의 NavDP: Learning Sim-to-Real Navigation Diffusion Policy with Privileged Information Guidance 라는 논문입니다. 해당 논문은 시뮬레이션 데이터만으로 학습했음에도 불구하고 실제 로봇에…

Continue Reading
Posted in X-Review

[CoRL 2025] TypeTele: Releasing Dexterity in Teleoperation by Dexterous Manipulation Types

안녕하세요 최인하입니다. 이번에 리뷰할 논문은 Teleopration 논문입니다. 로봇 domain에서 learning based 방식의 발전과 large-scale의 robot datasets의 등장으로 현재 로봇은 다양한 task를 수행할 수 있게 되었는데요…

Continue Reading
Posted in X-Review

[CVPRW 2025]GoTrack: Generic 6DoF Object Pose Refinement and Tracking

안녕하세요 손우진입니다. 오늘 리뷰할 논문은 단일 RGB 기반의 6D 객체 포즈 refinement와Tracking에 관한 논문인 “GoTrack: Generic 6DoF Object Pose Refinement and Tracking” 입니다. 이전 리뷰들에서…

Continue Reading
Posted in X-Review

[ICLR 2023] CLIP-ViP: Adapting Pre-trained Image-Text Model to Video-Language Alignment

최근 ICML 피어 리뷰 중, 리뷰할 논문이 이 논문을 베이스로 삼았다는 것을 보았습니다. 그동안은 핵심 아이디어만 대략적으로 알고 있었는데, 이번 기회에 꼼꼼히 읽어봤고 해당 내용을…

Continue Reading