Robotics and Computer Vision Lab

이 재윤 on [CVPR 2026] SARMAE : Masked Autoencoder for SAR Representation Learning05/11/2026
안녕하세요 우진님, 좋은 질문 감사합니다. 이쪽 분야를 접한 이유는 저희 팀 기업 과제가 task가 SAR object detection이고, 과제 팔로우업을 겸해서…
이 재윤 on [CVPR 2026] SARMAE : Masked Autoencoder for SAR Representation Learning05/11/2026
안녕하세요 정우님, 좋은 질문 감사합니다. DINOv3는 frozen 상태로 optical branch에서 이미지 패치 feature를 추출하는 용도로만 사용되며, SAR branch에서는 일반적인 ViT…
이 재윤 on [CVPR 2026] SARMAE : Masked Autoencoder for SAR Representation Learning05/11/2026
안녕하세요 인택님, 좋은 질문 감사합니다. 말씀주신 대로 SAR-1M 데이터셋은 SAR 이미지 중 매칭된 광학 이미지 쌍이 존재하는 경우도 있고, 아닌…
이 재윤 on [AAAI 2025] Does VLM Classification Benefit from LLM Description Semantics?05/11/2026
안녕하세요 예은님, 좋은 리뷰 감사합니다. description selection 과정에서, 단순히 타겟 클래스의 이미지와 가장 유사도가 높은 텍스트를 고르는 것에 그치지 않고…
최 인하 on [RSS 2025] DEXOP: A Device for Robotic Transfer of Dexterous Human Manipulation05/11/2026
안녕하세요 승현님 좋은 질문 감사합니다 프로젝트 페이지에 따로 fingertip nail을 사용해서 task를 수행한 정성적인 영상 결과가 있습니다. 예를 들어서 바닥에…

[RSS 2023] Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware

[Arxiv 2025] VOST-SGG: VLM-Aided One-Stage Spatio-Temporal Scene Graph Generation

[arxiv 2025] GigaWorld-0: World Models as Data Engine to Empower Embodied AI – Part 1… GigaWorld-0-Video

[arXiv 2026] Sim2real Image Translation Enables Viewpoint Robust Policies from Fixed-Camera Datasets

[CoRL 2024]LeLaN: Learning A Language-Conditioned Navigation Policy from In-the-Wild Videos

[arxiv 2025] Solving Spatial Supersensing Without Spatial Supersensing

[2025 ICLR] Retrieval Head Mechanistically ExplainsLong Context Factuality

[ArXiv 2025] Active Video Perception: Iterative Evidence Seekingfor Agentic Long Video Understanding

[Arxiv 2026] BabyVision: Visual Reasoning Beyond Language

[arXiv 2025]A4-Agent: An Agentic Framework for Zero-Shot Affordance Reasoning

Conference Deadline

NEW POST

New Comment