Robotics and Computer Vision Lab

이 재윤 on [CVPR 2026] SARMAE : Masked Autoencoder for SAR Representation Learning05/11/2026
안녕하세요 우진님, 좋은 질문 감사합니다. 이쪽 분야를 접한 이유는 저희 팀 기업 과제가 task가 SAR object detection이고, 과제 팔로우업을 겸해서…
이 재윤 on [CVPR 2026] SARMAE : Masked Autoencoder for SAR Representation Learning05/11/2026
안녕하세요 정우님, 좋은 질문 감사합니다. DINOv3는 frozen 상태로 optical branch에서 이미지 패치 feature를 추출하는 용도로만 사용되며, SAR branch에서는 일반적인 ViT…
이 재윤 on [CVPR 2026] SARMAE : Masked Autoencoder for SAR Representation Learning05/11/2026
안녕하세요 인택님, 좋은 질문 감사합니다. 말씀주신 대로 SAR-1M 데이터셋은 SAR 이미지 중 매칭된 광학 이미지 쌍이 존재하는 경우도 있고, 아닌…
이 재윤 on [AAAI 2025] Does VLM Classification Benefit from LLM Description Semantics?05/11/2026
안녕하세요 예은님, 좋은 리뷰 감사합니다. description selection 과정에서, 단순히 타겟 클래스의 이미지와 가장 유사도가 높은 텍스트를 고르는 것에 그치지 않고…
최 인하 on [RSS 2025] DEXOP: A Device for Robotic Transfer of Dexterous Human Manipulation05/11/2026
안녕하세요 승현님 좋은 질문 감사합니다 프로젝트 페이지에 따로 fingertip nail을 사용해서 task를 수행한 정성적인 영상 결과가 있습니다. 예를 들어서 바닥에…

[CVPR 2025] Efficient Motion-Aware Video MLLM

[ICLR 2026] Emergent Dexterity via Diverse Resets and Large-Scale Reinforcement Learning

[RA-L 2026] Guiding Robotic Cloth Grasping in Darkness: Infrared Semantic Segmentation andGrasping Position Selection

[CVPR 2025] VideoComp: Advancing Fine-Grained Compositional and Temporal Alignment in Video-Text Models

[NeurIPS 2025] Towards Implicit Aggregation: Robust Image Representation for Place Recognition in the Transformer Era

[arxiv 2026] LeWorldModel: Stable End-to-End Joint-Embedding Predictive Architecture from Pixels

[NeurIPS 2025] RoboRefer: Towards Spatial Referring with Reasoning in Vision-Language Models for Robotics

[ICCV 2025] Beyond Text-Visual Attention: Exploiting Visual Cues for Effective Token Pruning in VLMs

[ICLR 2024] CLIPSELF: VISION TRANSFORMER DISTILLS ITSELF FOR OPEN-VOCABULARY DENSE PREDICTION

[arXiv]On the Entropy Dynamics in Reinforcement Fine-Tuning of Large Language Models

Conference Deadline

NEW POST

New Comment