Robotics and Computer Vision Lab

김 영규 on [CoRL 2025(Oral)] X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real09/16/2025
안녕하세요 인하님 리뷰 읽어주셔서 감사합니다. 첫번째 질문에 대한 답으로는 해당 기법은 물체의 trajectory를 dense reward로 정의해서 강화학습을 통해서 manipulator가 trajectory를…
김 영규 on [CoRL 2025(Oral)] X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real09/16/2025
안녕하세요 재찬님 댓글 감사합니다. reward를 다른 방식으로 변화를 주어 RL을 진행한 ablation이라는 표현이 객체 중심의 reward와 모션 중심의 reward를 말씀하시는건가요?…
허 재연 on [CVPR 2023] Feature Aggregated Queries for Transformer-based Video Object Detectors09/16/2025
basic query는 기본적으로 random init되므로 해당 frame의 시각적 정보를 담고 있지 않습니다. 이를 함께 사용하면 학습 과정에서 도움을 줄 수는…
신 인택 on [CVPR 2024] Open-Vocabulary Calibration for Fine-tuned CLIP09/15/2025
안녕하세요 예은님 답글 감사합니다. 1번 질문에 대해서는 올바르게 이해하셨씁니다. 파인튜닝을 진행하지 않았을때는 뭐 당연하게도 base novel 클래스에 대해 비슷한 분포를…
신 인택 on [CVPR 2024] Open-Vocabulary Calibration for Fine-tuned CLIP09/15/2025
안녕하세요 재윤님 답글 감사합니다. temperature는 softmax 함수에서 확률값이 되기 전 로짓에 T 라는 상수를 나눠줘 너무 극단적으로 확률값이 치우쳐지지 않게…

[CVPR2025] NVILA: Efficient Frontier Visual Language Models

[ICCV 2025]A0: An Affordance-Aware Hierarchical Model for General Robotic Manipulation

[IEEE CBMI 2024]Is CLIP the main roadblock for fine-grained open-world perception?

[Arxiv 2022]BinsFormer:Revisiting Adaptive Bins forMonocular Depth Estimation

[ICCV 2025] MultiADS: Defect-aware Supervision for Multi-type Anomaly Detection and Segmentation in Zero-Shot Learning

[CVPR Workshop 2025] Robotic Manipulation by Imitating Generated Videos Without Physical Demonstrations

[arXiv 2024] Char-SAM: Turning Segment Anything Model into Scene Text Segmentation Annotator with Character-level Visual Prompts

[ECCV 2024] Diffusion Models for Monocular Depth Estimation: Overcoming Challenging Conditions

[AAAI 2024] TD2-Net: Toward Denoising and Debiasing for Dynamic Scene Graph Generation

[ICCV 2023]Prompt Switch: Efficient CLIP Adaptation for Text-Video Retrieval

Conference Deadline

NEW POST

New Comment