Category: X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[CoRL 2025] TypeTele: Releasing Dexterity in Teleoperation by Dexterous Manipulation Types
안녕하세요 최인하입니다. 이번에 리뷰할 논문은 Teleopration 논문입니다. 로봇 domain에서 learning based 방식의 발전과 large-scale의 robot datasets의 등장으로 현재 로봇은 다양한 task를 수행할 수 있게 되었는데요…
[CVPRW 2025]GoTrack: Generic 6DoF Object Pose Refinement and Tracking
안녕하세요 손우진입니다. 오늘 리뷰할 논문은 단일 RGB 기반의 6D 객체 포즈 refinement와Tracking에 관한 논문인 “GoTrack: Generic 6DoF Object Pose Refinement and Tracking” 입니다. 이전 리뷰들에서…
[ICLR 2023] CLIP-ViP: Adapting Pre-trained Image-Text Model to Video-Language Alignment
최근 ICML 피어 리뷰 중, 리뷰할 논문이 이 논문을 베이스로 삼았다는 것을 보았습니다. 그동안은 핵심 아이디어만 대략적으로 알고 있었는데, 이번 기회에 꼼꼼히 읽어봤고 해당 내용을…
[ICCV 2025]RAGNet: Large-scale Reasoning-based Affordance Segmentation Benchmark towards General Grasping
Abstract 로봇 파지 시스템은 사람의 지시에 따라 다양한 시나리오에서 정확한 물체를 파지할 수 있어야 합니다. 그러나 기존 연구들은 추론이 포함된 대규모 affordance 데이터셋의 부족으로 인해…
[arXiv 2024] Pooling And Attention: What Are Effective Designs For LLM-Based Embedding Models?
안녕하세요. 이번에 소개할 논문은 LLM 기반 텍스트 임베딩 모델의 설계에 대해 분석한 연구입니다. 최근 LLM 기반 임베딩 모델로 실험을 진행하던 중, 어떤 구조적 설계가 성능에…
[AAAI 2024] SA2VP: Spatially Aligned-and-Adapted Visual Prompt
안녕하세요 4번째 X-review입니다. 이번에는 새로운 결의 논문을 가져왔는데요. Visual Prompt Tuning입니다. Visual Prompt Tuning(이하 VPT)에 대해 조금 더 자세히 설명을 해보자면 LLM에서 prompt를 이용해 전체적인…
[arXiv 2026] Rethinking the Practicality of Vision-language-action Model: A Comprehensive Benchmark and An Improved Baseline
안녕하세요, 이번 주 x-review는 Open-Helix 팀에서 VLA 모델을 ‘성능이 어떠냐’ 보다 ‘현실에 올릴 수 있는가’의 관점에서 다룬 논문을 소개하려고 합니다. 저자들은 로봇을 현실에 배치하려면 general한…
[AAAI 2026] UniME-V2: MLLM-as-a-Judge for Universal Multimodal Embedding Learning
안녕하세요. 이번에 소개할 논문은 멀티모달 LLM을 범용 멀티모달 임베딩 모델로 확장하려는 연구입니다. 최근 MLLM을 단순 생성 모델이 아닌 임베딩 모델로도 활용하는 연구가 많이 늘고 있습니다….
[2026-동계][최인하] URP를 마치며
안녕하세요. 2026 winter URP에 참여한 최인하입니다. 약 2달간의 URP 기간 동안 느꼈던 점과 개인적인 생각을 적어보려고 합니다. 이 글을 읽으시는 분이라면 연구자의 길을 고민하고 계실…
[2026-동계][최명진] URP를 마치며
안녕하세요, 2026년도 동계 URP를 마무리한 최명진입니다. 2개월 동안의 제 여정을 회고하며 후기를 작성해보고자 합니다. 훗날 URP 참여를 고려하실 분들에게도 조금이나마 도움이 되었으면 좋겠습니다. 다른 학우들과 마찬가지로 진로에…
질문 감사합니다. 우선 action encoder로 사용한 RenderNet을 찾아보니, 일관성 있는 캐릭터와 고품질 이미지를 생성하고 제어할 수 있는 강력한 AI 이미지…