Posted in Conference X-Review

[ICCV 2025] PASG: A Closed-Loop Framework for Automated Geometric Primitive Extraction and Semantic Anchoring in Robotic Manipulation

해당 논문은 ReKep, OmniManip와 같이 물체의 조작시 keypoint를 찾고 조작을 위한 방향과 같은 정보들을 primtive로 이용하는 논문이라 리뷰하게 되었습니다. 말이 참 복잡하지만, 정말 간단하게는 물체를…

Continue Reading
Posted in X-Review

[AAAI 2025] Super-class guided Transformer for Zero-Shot Attribute Classification

안녕하세요. 이번 X-Review에서는 super-class를 활용하여 attribute classification의 zero-shot 성능을 향상시킨 논문에 대해 리뷰해보도록 하겠습니다. 1. Introduction & Related Works attribute classification은 객체의 color, size와 같은…

Continue Reading
Posted in Paper X-Review

[CVPR 2022] Contrasitive Test Time Adaptation

안녕하세요 이번에 리뷰할 논문은 2022년에 CVPR에 개제된 Contrasitive Test Time Adaptation 이라는 논문입니다.Test Time Adaptation 이라는 Test time에 실제 그 도메인에 맞게끔 모델 자체가 스스로…

Continue Reading
Posted in X-Review

[Arxiv 2026] DeepSeek-OCR 2: Visual Causal Flow

최근에 DeepSeek 에서 공개한 논문을 좀 리뷰한 것 같네요. 리뷰 링크는 아래에 적어두겠습니다 오늘 리뷰할 페이퍼는 1번 논문인 DeepSeek-OCR 그 다음 버전으로 DeepSeek-OCR 2 입니다….

Continue Reading
Posted in Paper X-Review

[arXiv 2025] GR00T N1: An Open Foundation Model for GeneralistHumanoid Robots

안녕하세요 오늘은 VLA 모델 중 하나인 GR00T N1 논문에 대해서 설명드리도록 하겠습니다. GR00T 같은 경우에는 기존에 있던 VLA들과 차별점을 둔 VLA의 구조 자체도 정의하긴 했지만…

Continue Reading
Posted in X-Review

[ECCV 2024] FoundPose : Unseen Object Pose Estimation with Foundation Features

안녕하세요 손우진입니다. 오늘은 단일 모달리티(RGB)기반의 6D pose estimation 논문을 리뷰해보려고 합니다. 요즘 6D 에서 계속 연구되고있는것은 학습때 보지못한 객체에대한 6D 를 예측하고 싶어합니다. 하지만 이는…

Continue Reading
Posted in X-Review

[NeurIPS 2025] Chain-of-Action: Trajectory Autoregressive Modeling for Robotic Manipulation

안녕하세요. 저번 세미나 시간에 발표로 들고 왔던 Chain of Action 논문을 리뷰로 남기기 위해 가져왔습니다. ByteDance Seed에서 제안한 액션 역방향 생성의 새로운 패러다임인데요. 기존의 액션을…

Continue Reading
Posted in Paper X-Review

[ICCV 2025] LVAgent: Long Video Understanding by Multi-Round Dynamical Collaboration of MLLM Agents

안녕하세요 이번에 소개할 논문은 롱비디오 이해에서 단일 MLLM으로 추론 하는 한계를 지적하고 이를 multi-agent 협업 구조로 보완하는 LVAgent 프레임워크를 제안한 논문입니다. 그럼 바로 리뷰 시작하겠습니다….

Continue Reading
Posted in X-Review

MineWorld: A real-time and open-source interactive world model on minecraft.

이번에 소개드릴 논문은 지난주 세미나에서 발표한 MineWorld라는 논문입니다. Microsoft 연구팀이 테크니컬 리포트로 작성한 문서로 가볍게 읽어보기 좋을 것 같아서 가져왔습니다. 일단 논문 소개에 들어가기에 앞서서…

Continue Reading
Posted in Paper X-Review

[arXiv 2025] WorldMM:Dynamic MultiModal Memory Agent for Long Video Understanding

안녕하세요, 두 번 째 x-review로 WorldMM을 가지고 왔습니다. 저희 논문 작업에서 벤치마크를 만들면, 그걸 테스트할 여러 LVU methods 중 하나가 WorldMM인데, 처음에 아키텍처를 봤을 때…

Continue Reading