Author: 김기현

Posted in Paper X-Review

[ICRL 2026] HybridVLA: Collaborative Diffusion and Autoregression in a Unified Vision-Language-Action Model

안녕하세요. 오늘은 HybridVLA에 대해서 소개드리겠습니다. VLA를 많이 알아보고 있는 편임에도 불구하고 계속 새로운 모델이 나오고 있는데, 검색을 하면서 발견하여서 어떤 부분이 다를까? diffusion과 autoregressive? 내용에…

Continue Reading
Posted in Paper X-Review

[arXiv 2025] WorldVLA: Towards Autoregressive Action WorldModel

안녕하세요 오늘은 WorldVLA에 대해서 설명드리도록 하겠습니다. 최근 들어서 계속 VLA 관련 논문들을 읽고 있는데 세계에 대한 일반화? 능력에 대한 부분이 상당히 필요한 것 같다고 느꼈습니다….

Continue Reading
Posted in Paper X-Review

[arXiv 2025] DREAMGEN: Unlocking Generalization in Robot Learning through Video World Model

안녕하세요 오늘은 로봇 데이터에 관한 논문을 가지고 왔습니다. NVIDIA에서 제시한 DreamGen이라는 방법론입니다. VLA를 보면 볼 수록 아무래도 데이터의 갯수가 많지 않다보니까 특정 데이터에 편향되는 모습을…

Continue Reading
Posted in X-Diary

KRoC 2026 참관기

안녕하세요, 오늘은 2월 11일부터 2월 13일까지 다녀온 Kros에서 주관하는 KRoC에 다녀온 후기를 설명해드리고자 합니다. 이번에 방문해서는 주로 포스터 섹션을 위주로 보았고, 중간중간에 끼어 있는 발표…

Continue Reading
Posted in Paper X-Review

[arXiv 2025] GR00T N1: An Open Foundation Model for GeneralistHumanoid Robots

안녕하세요 오늘은 VLA 모델 중 하나인 GR00T N1 논문에 대해서 설명드리도록 하겠습니다. GR00T 같은 경우에는 기존에 있던 VLA들과 차별점을 둔 VLA의 구조 자체도 정의하긴 했지만…

Continue Reading
Posted in Paper X-Review

[RSS 2023] Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware

안녕하세요, 저번 주에는 VLA 모델의 대표작 중 하나인 SmolVLA에 대해서 리뷰를 했었습니다. 해당 논문에서 Baseline으로 언급된 것이 Vision Action(VA) 기반의 ACT였고, 이에 대해서 흥미가 생겨서…

Continue Reading
Posted in Paper X-Review

[arXiv 2025] SmolVLA: A Vision-Language-Action Model for Affordable and Efficient Robotics

안녕하세요! 첫 X-Review를 작성하게 된 김기현입니다. 첫 Review 논문으로는 석준님과 우현님과 함께 우편물 배달 task를 수행하기 위한 VLA, SmolVLA 논문을 들고 왔습니다. 간단하게 한 마디로…

Continue Reading
Posted in B.S. X-Diary

[김기현] 2025년을 보내며

안녕하세요, 연구실 막내 김기현입니다😁여름 URP 하고 나서 얼마 지나지 않은 것 같은데 벌써 한 학기가 지나고 새해를 앞두고 있습니다…우선 제 생활 근황은 마지막 부분에서 말씀…

Continue Reading
Posted in X-Diary

[2025-하계][김기현] URP를 마치며

🏁URP를 시작하기 전URP를 신청하던 당시에는 제가 흥미를 가지고 있던 분야인 Computer vision에 대해서 해당 분야의 지식의 폭을 넓히고 싶다는 생각을 가지고 있었습니다. 구체적으로는 Computer Vision과…

Continue Reading