Author: 김 영규
2025년도 하계 URP 조교를 마치며
안녕하세요, 이번주는 2025년 하계 URP를 마치고 후기를 작성해보려 합니다. 이번 기수에 처음으로 메인 멘토도 하고, 교육 한 주차를 맡아서 진행한 만큼 URP 멘티로 참가할때나, 서브…
[ICCV 2025] RoboPearls: Editable Video Simulation for Robot Manipulation
안녕하세요, 이번주는 RoboPearls라는 비디오 기반의 시뮬레이션 환경을 제안한 논문을 리뷰해보려고 합니다. 이번 논문은 사실 승현님이 LLM과제에 활용할 수 있지 않을까 하시면서 알려주신 논문입니다. LLM과 3DGS를…
[CVPR Workshop 2025] Robotic Manipulation by Imitating Generated Videos Without Physical Demonstrations
안녕하세요 이번주 X-review는 Robotic Manipulation 데이터에 관한 논문을 리뷰해보도록 하겠습니다. Video Diffusion을 활용한 아이디어가 참신해서 읽어보게 되었습니다. Robots Imitating GeneratedVideos (RIGVid) 라는 프레임워크를 제안한 연구인데,…
[CVPR 2025] Any6D : Model-free 6D Pose Estimation of Novel Objects
안녕하세요 이번주는 Scene Complete과정에 속하는 6D Pose Estimation 논문을 리뷰하도록 하겠습니다. 단 한장의 RGB-D 앵커 이미지만 활용해 unknown 객체의 6D pose와 metric scale을 추정하는 model-free…
[arXiv 2025] SceneComplete : Open-World 3D Scene Completion in Cluttered Real World Environments for Robot Manipulation
안녕하세요 이번주는 Scene Completion이라는 task를 수행하는 논문을 가져왔습니다. Scene Completion 태스크는 Scene에 대한 불완전한 정보들을 채워넣어서 최대한 현실에 가까운 복원을 하는 task라고 생각하시면 될 것…
2025년 상반기 회고
안녕하세요, 이번주는 논문 리뷰대신 25년 상반기를 되돌아보며 솔직한 후기를 기록해보려 합니다.. 안 그래도 요새 생각이 좀 복잡한데, 학부를 졸업하고 석사과정 한 학기를 마친 시점에서 여러모로…
[ICRA 2025] Real2Gen : Imitation Learning from a Single Human Demonstration with Generative Foundation Models
안녕하세요 이번주 리뷰는 human demonstration 영상과 생성형 모델을 활용한 효율적인 모방학습 데이터셋을 취득하는 방법에 관한 논문입니다. 모방학습이 로봇을 조작하는 방법의 확실한 트렌드로 자리잡고 있지만 모방학습용…
[CVPR 2025] Ouroboros3D: Image-to-3D Generation via 3D-aware Recursive Diffusion
안녕하세요 이번주는 Image to 3D 논문을 읽어보았습니다. 현실을 시뮬레이터로 옮기는 Real to Sim의 자동화 방법을 고민하다 최근에 TRELLIS라는 모델의 데모를 해보면서 하나의 2D 이미지만 가지고…
[arXiv 2025] Splatting Physical Scenes: End-to-End Real-to-Sim from Imperfect Robot Data
안녕하세요, 이번주는 Google DeepMind의 end-to-end로 3DGS 기반으로 물리 시뮬레이션이 가능한 3d asset generation pipeline을 소개한 논문입니다. Synthetic data 활용을 한 로봇 학습에서는 asset generation이 필수적이고,…
[ICLR 2025] SINGAPO: SINGLE IMAGE CONTROLLED GENERATIONOF ARTICUALTED PARTS IN OBJECTS
안녕하세요 이번주 x-review는 image to 3D 논문입니다. 기존에 3D reconstruction을 진행하면서 3D-gaussian을 mesh화 한 뒤에 시뮬레이터를 위한 asset으로 활용하려고 했으나 gaussian -> mesh 과정에서 어려움이…
안녕하세요 예은님 댓글 감사합니다. 일단 ViNG이 classification을 채택한 이유는 거리의 불확실성과 이동 가능성의 확률적 특성을 반영하기 위해서라고 보시면 정확합니다. 여기서…