X-Review – Page 10 – Robotics and Computer Vision Lab

[IROS 2025]FlowNav: Combining Flow Matching and Depth Priors for Efficient Navigation

안녕하세요 이번에 리뷰로 가져온 논문은 IROS 2024에 올라온 FlowNav: Combining Flow Matching and Depth Priors for Efficient Navigation이라는 논문입니다. 이 논문은 기존 NoMaD처럼 diffusion policy를…

X-Review

[RSS 2025] V-HOP, Visuo-Haptic 6D Object Pose Tracking

안녕하세요 손우진입니다. 이번에 소개드릴 논문은 6D 정보와 Tactile 센서를 활용하여 물체를 조작하는 논문에 대해서 소개드리려 합니다. 특히 로봇이 물체를 잡고 있는 상황에서 발생하는 가림 문제를…

X-Review

[Arxiv 2026]PointWorld: Scaling 3D World Models for In-The-Wild Robotic Manipulation

이번 리뷰 논문은 Fei-Fei Li 교수님 연구실에서 나온 논문이며, VoxPoser, ReCap 저자인 Wenlong Huang이 1저자인 페이퍼 입니다. 해당 저자는 이전 논문부터 VA, VLA와는 다른 흐름의…

X-Review

[arXiv2026] Does Your Reasoning Model Implicitly Know When to Stop Thinking?

thinking은 large reasoning model(LRM)이 답변을 할 때, 추론의 과정을 나열하게 하여 응답의 정확도를 높이는 추론 기법입니다. 그러나 너무 장황하게 늘어놓는다거나 기존의 내용을 반복하는등의 문제가 발생하곤…

X-Review

[RSS 2026] Mimic Intent, Not Just Trajectories

안녕하세요. 이번 논문 리뷰는 RSS 2026′ MINT (Mimic Intent, Not Just Trajectories) 인데요, action chunk를 주파수 도메인에서 분해해서 intent(전역적인 행동 의도)와 execution(세부 실행 디테일)을 명시적으로…

X-Review

[CVPR 2026]AffordGen: Generating Diverse Demonstrations for Generalizable Object Manipulation with Affordance Correspondence

Abstract 최근 로봇 조작에서 imitation learning을 활용한 연구들이 성공을 이루고 있으나, 제한적인 데이터 다양성으로 인해 기하학적 변형에는 제약이 있습니다. 해당 논문은 3D 생성 모델과 VFMs를…

Paper X-Review

[CVPR 2026] STRNet: Visual Navigation with Spatio-Temporal Representation through Dynamic Graph Aggregation

안녕하세요. 이번에 리뷰로 가져온 논문은 CVPR 2026 Highlight로 선정된 STRNet: Visual Navigation with Spatio-Temporal Representation through Dynamic Graph Aggregation라는 논문입니다. NoMaD, ViNT, NaviBridger 같은 기존…

X-Review

GR00T : An Open Foundation Model for Generalist Humanoid Robots

안녕하세요, 이번주 X-review는 NVIDIA의 가장 간판 프로젝트 중 하나인 GR00T에 대해 작성하려고 합니다. 기존 로봇 파운데이션 모델들이 주로 단일 팔, 병렬 그리퍼, tabletop manipulation 중심으로…

X-Review

[Arxiv 2024] Pooling And Attention: What Are Effective Designs For LLM-Based Embedding Models?

오늘은 생성형 모델인 LLM을 임베딩 모델로 변환하는 것과 관련된 페이퍼를 리뷰해보겠습니다. Venue: Arxiv 2024Authors: Yixuan Tang, Yi YangAffiliation: The Hong Kong University of Science and TechnologyTitle: Pooling…

X-Review

[CVPR 2024] CricaVPR: Cross-image Correlation-aware Representation Learning for Visual Place Recognition

안녕하세요. 이번 리뷰는 CricaVPR(CRoss Image Correlation-Aware)입니다. 저자는 현재 VPR에서 혼자 SOTA를 찍고 부수고를 스스로 반복하는 Lu Feug입니다. CricaVPR은 그 중에서도 가장 많은 인용수를 달성한 논문입니다….

Category: X-Review

[IROS 2025]FlowNav: Combining Flow Matching and Depth Priors for Efficient Navigation

[RSS 2025] V-HOP, Visuo-Haptic 6D Object Pose Tracking

[Arxiv 2026]PointWorld: Scaling 3D World Models for In-The-Wild Robotic Manipulation

[arXiv2026] Does Your Reasoning Model Implicitly Know When to Stop Thinking?

[RSS 2026] Mimic Intent, Not Just Trajectories

[CVPR 2026]AffordGen: Generating Diverse Demonstrations for Generalizable Object Manipulation with Affordance Correspondence

[CVPR 2026] STRNet: Visual Navigation with Spatio-Temporal Representation through Dynamic Graph Aggregation

GR00T : An Open Foundation Model for Generalist Humanoid Robots

[Arxiv 2024] Pooling And Attention: What Are Effective Designs For LLM-Based Embedding Models?

[CVPR 2024] CricaVPR: Cross-image Correlation-aware Representation Learning for Visual Place Recognition

Conference Deadline

NEW POST

New Comment