Author: 김 영규
[arXiv 2025] Dream2Flow: Bridging Video Generation and Open-World Manipulation with 3D Object Flow
안녕하세요, 이번주는 3d object flow라는 개념을 활용한 open-world manipulation 연구를 리뷰해보려고 합니다. 최근 비디오 모델들의 물리적인, 시각적인 표현력이 급증하면서 manipulation 영상을 자연스럽게 생성할 수 있게…
[김영규] 2025년을 보내며
안녕하세요, 이번주는 한 해를 돌아보는 회고록을 작성하게 됐습니다. 벌써 2025년의 마지막 주말이 지나가고 있는데, 시간이 정말 빠르게 흘러가는 것 같습니다. 근데 또 올해 초를 생각해보면…
[CoRL 2025] Robot Learning from Any Images
안녕하세요 이번주는 real to sim to real 접근을 통한 나름(?) 참신한 방법을 통해 로봇 데이터 scaling의 가능성을 제안한 연구를 리뷰해보려고 합니다. 많은 연구들이 sim to…
What are World Models..?
안녕하세요, 이번주는 World Model에 관한 제 나름의 정리글을 작성하려고 합니다. 최근 world model이 급부상 하면서 다양한 연구에 활용되는 경향을 확인할 수 있었는데요, 제가 관심을 가지는…
[arXiv 2025] EgoDemoGen: Novel Egocentric Demonstration Generation Enables Viewpoint-Robust Manipulation
안녕하세요, 최근 비디오 생성모델을 통한 로봇 학습 데이터 증강 파이프라인에 관심을 가지고 있는데, Giga AI에서 며칠전 공개된 embodied AI 데이터용 비디오 생성 모델이 발표와 동시에…
[NeurIPS 2025] PhysX-3D: Physical-Grounded 3D Asset Generation
안녕하세요 이번주는 3D 생성 모델에 대한 리뷰를 진행해보려고 합니다. 3D 생성 모델들은 다량의 합성 데이터를 바탕으로 기하와 텍스쳐의 복원 능력이 좋아지면서 최근에 등장한 structured latent…
[IROS 2025] RoboEngine: Plug-and-Play Robot Data Augmentation with Semantic Robot Segmentation and Background Generation
안녕하세요, 이번주는 로봇 데이터 증강에 관한 논문입니다. 새로운 데이터 취득 없이 기존의 데이터셋을 효과적으로 증강하면 대규모 데이터셋이 더 의미있어 지지 않을까? 하던 와중에 보게된 논문이고…
[IROS 2025] Empirical Analysis of Sim-and-Real Cotraining of Diffusion Policies for Planar Pushing from Pixels
안녕하세요 이번주는 시뮬레이션 데이터와 real 데이터로 동시에 학습하는 Co-training에 대해 분석을 진행해본 논문을 리뷰해보려고 합니다. 시뮬레이션 데이터가 실제로 policy에 어떤 영향을 미치는지 다양한 형태의 시뮬레이션…
CoRL 2025 참관기
이번주는 CoRL 2025 참관기를 적어보려고 합니다. 9월 말에 참석했던 학회였고, 올해 초에 재찬이가 발표하러 간 학회 말고는 처음으로 제대로 참석한 학회라 기대도 많이하고 설렘도 가득했었는데,…
Human to Robot (H2R): Workshop on Sensorizing, Modeling, and Learning from Humans
안녕하세요, 이번주 X-review는 오늘 워크샵에서 들은 내용들이 자료가 따로 공유되지는 않을 뿐더러 휘발되기 전에 받아적은 내용들 토대로 정리를 하기 위해 워크샵을 총정리하는 글을 적어보려고 합니다….
좋은 리뷰 감사합니다. 분석 논문이라 재밌게 읽었네요. 쭉 읽다보면 전반적으로 internVL에 대한 실험 결과이고, appendix에 LLaVA에 대한 결과가 나와있는 것으로…