Category: X-Review

Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.

Posted in X-Review

[NeurIPS 2025] FIPER: Failure Prediction at Runtime for Generative Robot Policies

안녕하세요. 이번 논문 리뷰는 DP나 Flow Matching policy같은 generative IL policy가 runtime에서 task failure를 일으킬 때, 이를 failure data 없이 사전에 예측하는 방법론인 FIPER(Failure Prediction…

Continue Reading
Posted in X-Review

[CVPR 2026 Highlight] Batch Loss Score for Dynamic Data Pruning

안녕하세요, 이번주도 data pruning 논문을 가져왔습니다. 저번에 리뷰했던 SeTa의 저자가 RePB(ICLR 2026), 그리고 오늘 리뷰할 BLS까지 dynamic data pruning의 연구를 활발하게 이끌고 있는 것 같습니다….

Continue Reading
Posted in Paper X-Review

[NIPS 2023] Scaling Open-Vocabulary Object Detection

안녕하세요, 이번에 리뷰할 논문은 Google Deepmind에서 2023년에 발표한 NIPS spotlight 논문입니다. 현재 저희 팀 과제에 투입되기 위한 팔로우업 중에 읽게 된 논문으로, detection 데이터셋이 제한적인…

Continue Reading
Posted in Paper X-Review

[CVPR 2026] ApET: Approximation-Error Guided Token Compression for Efficient VLMs

안녕하세요 이번에 들고온 논문도 VLM 에서의 token pruning 논문입니다. 해당 논문은 25년도까지의 pruning 논문들이 ViT의 [CLS] 토큰이나 llm decoder 단에서의 visual-text attention 정보에 어느정도 의존하는…

Continue Reading
Posted in Paper X-Review

[AAAI 2026] SemanticVLA: Semantic-Aligned Sparsification and Enhancement for Efficient Robotic Manipulation

안녕하세요, 오늘은 좀 (저한테만?) 좀 신기한 논문을 가져왔습니다. VLA 관해서 “흠 뭐가 재밌을까”하다가 2026년 AAAI에 어쩌고 저쩌고 한 논문이라고 해서 쓱 훓어보니까 제가 알던 VLA의…

Continue Reading
Posted in Paper X-Review

[CVPR 2026] VidEoMT: Your ViT is Secretly Also a Video Segmentation Model

안녕하세요. 이번에 리뷰로 가져온 논문은 CVPR 2026애 올라온 VidEoMT: Your ViT is Secretly Also a Video Segmentation Model라는 논문입니다. 현재 내비게이션 플래닝 분야에서 action을 생성하는데…

Continue Reading
Posted in Paper X-Review

[CVPR 2024] Optimal Transport Aggregation for Visual Place Recognition

Introduction VPR에서는 이미지를 apperance pattern descriptor로 설명합니다. 결국 VPR를 잘 수행하기 위해서는 이미지마다 구분력 있는 descriptor를 추출하는 것이 중요합니다. 이를 위해서는 변화하는 조명, 이동, 시간에…

Continue Reading
Posted in X-Review

[CoRL 2025] FunGrasp: Functional Grasping for Diverse Dexterous Hands

안녕하세요 최인하입니다. 이번에 리뷰할 논문은 Functional Grasping에 대해서 다룬 논문을 리뷰해보겠습니다. 최근 매스컴에서 로봇을 이야기 할 때 로봇 손은 빠지지 않는 주제입니다. 하지만 아직까지 로봇…

Continue Reading
Posted in Paper X-Review

[CVPR 2026] VideoSeek: Long-Horizon Video Agent with Tool-Guided Seeking

안녕하세요 오늘은 CVPR 2026에 accept된 video understanding 연구를 리뷰해보겠습니다.요즘 저는 적은 프레임, 작은 모델을 사용하면서도 성능은 어느 정도 나오는 효율적인 프레임워크들을 관심있게 보고 있는데요! 이…

Continue Reading
Posted in X-Review

[arXiv 2026] Beyond Imitation: Reinforcement Learning-Based Sim-Real Co-Training for VLA Models

안녕하세요, 이번주는 RSS 2026에 submit된 Co-training 연구를 리뷰해보려고 합니다. 시뮬레이션 데이터는 현실 데이터와 함께 co-training되면서 low-cost로 VLA training을 풍부하게 해주는데, 대부분의 co-training 연구들은 SFT 방식으로…

Continue Reading