Robotics and Computer Vision Lab

허 재연 on [AAAI 2024] Context Enhanced Transformer for Single Image Object Detection in Video Data11/10/2025
안우현 연구원님 안녕하세요, 하나씩 답변 드리도록 하겠습니다. 1. 논문에 백본 네트워크와 트랜스포머 인코더/디코더 모듈의 초기화 방법은 설명되어 있지만, CMM module의…
신 인택 on [ECCV 2024 Workshops]Meerkat: Audio-Visual Large Language Model for Grounding in Space and Time11/10/2025
안녕하세요 현우님 답글 감사합니다. 우선 GPT-Prompted 는 Instruction Generation 에 GPT 를 사용했는지 여부를 알려주는 부분이며 이에 대한 효과를 알려주기보단…
최 인하 on ORCA: An open-Source, Reliable, Cost-Effective, Anthropomorphic Robotic Hand for Uninterrupted Dexterous Task Learning11/10/2025
안녕하세요 재윤님 좋은 댓글 감사합니다. 우선 이해하신 부분이 맞습니다. 맞습니다 그래서 저자는 conclusion 부분에서 앞으로 그 부분을 발전시켜서 orca 2.0을…
최 인하 on ORCA: An open-Source, Reliable, Cost-Effective, Anthropomorphic Robotic Hand for Uninterrupted Dexterous Task Learning11/10/2025
안녕하세요 정우님 좋은 댓글 감사합니다!! 이 부분은 Orca 설계에 있어서 핵심적인 내용입니다! 우선 결론부터 말하면 moment arm을 일정하게 유지함으로써, 각…
최 인하 on AnyTeleop : A General Vision-Based Dexterous Robot Arm-Hand Teleoperation System11/10/2025
안녕하세요 기현님 좋은 댓글 감사합니다!! hand pose retargeting 단계는 Mediapipe로 측정한 사람 손가락의 keypoint의 위치와 로봇의 URDF 파일로 알고있는 Forward…

Recent Posts

[NeurIPS 2024]To Believe or Not to Believe Your LLM: Iterative Prompting for Estimating Epistemic Uncertainty

[ICRA 2021]ViNG: Learning Open-World Navigation with Visual Goals

[NIPS 2025] Two Causally Related Needles in a Video Haystack

[ECCV 2024 Workshops]Meerkat: Audio-Visual Large Language Model for Grounding in Space and Time

[CVPR 2025] VisionZip: Longer is Better but Not Necessary in Vision Language Models

[AAAI 2024] Context Enhanced Transformer for Single Image Object Detection in Video Data

AnyTeleop : A General Vision-Based Dexterous Robot Arm-Hand Teleoperation System

[CVPR 2023] Align and Attend Multimodal Summarization With Dual Contrastive Losses

[ICLR 2018]SEMI-PARAMETRIC TOPOLOGICAL MEMORY FOR NAVIGATION

[ICCV 2023] HiTeA: Hierarchical Temporal-Aware Video-Language Pre-training

Conference Deadline

NEW POST

New Comment