Robotics and Computer Vision Lab

신 정민 on [CVPR 2024]SAM-6D: Segment Anything Model Meets Zero-Shot 6D Object Pose Estimation07/14/2025
하이요. 리뷰 읽고 질문할게 있어서 댓글 남깁니다. method를 초반부에 템플릿을 어떻게 추출하는지에서부터 이해하는데 어려움이 있어서요. 뭔가 중간의 설명이나 변수들의 정의가…
신 인택 on [CVPR 2024]SAM-6D: Segment Anything Model Meets Zero-Shot 6D Object Pose Estimation07/14/2025
안녕하세요 우진님 리뷰 감사합니다. 한가지 궁금한점이 object score를 만들기 위해 더한 3가지 방법중 geometric score 에 대해서 단순 투영을 사용하는…
신 정민 on [CVPR 2025] Language-Guided Image Tokenization for Generation07/14/2025
하이요 리뷰 보고 질문있어서 남깁니다. 우선 리뷰 초반에 vector quantized 형식과 continuous한 방식에 대해 설명을 해주셨는데 quantization 방식이 continuous한 방식과…
신 정민 on [CVPR2025] CustomKD: Customizing Large Vision Foundation for Edge Model Improvement via Knowledge Distillation07/11/2025
네 나머지 학습 데이터를 모두 unlabeled data로 보는게 맞습니다.
안 우현 on [arXiv 2024]ScaleDepth: Decomposing Metric Depth Estimation into Scale Prediction and Relative Depth Estimation07/10/2025
안녕하세요 우진님 좋은 질문 감사합니다. 말씀하신 것처럼 이 논문은 scale에 강인하면서도 절대적인 거리 값을 예측하는 metric depth estimation을 목표로 하고…

Recent Posts

[CVPR 2023]Finetune Like You Pretrain: Improved Finetuning of Zero-Shot Vision Models

[ICRA 2025] Real2Gen : Imitation Learning from a Single Human Demonstration with Generative Foundation Models

[AAAI 2025](Oral) DepthFM: Fast Generative Monocular Depth Estimation with Flow Matching

[ECCV 2022] TS2-Net: Token Shift and Selection Transformer for Text-Video Retrieval

[CVPR 2025] Language-Guided Image Tokenization for Generation

[CVPR2025] NavigationWorld Models

[CVPR 2025] Universal Scene Graph Generation

[CVPR2024] Towards Automated Movie Trailer Generation

[ECCV 2024] KDProR: A Knowledge-Decoupling Probabilistic Framework for Video-Text Retrieval

[CVPR2025] CustomKD: Customizing Large Vision Foundation for Edge Model Improvement via Knowledge Distillation

Conference Deadline

NEW POST

New Comment