[카테고리:] Conference
Conference Reivew
[CoRL 2023 oral] VoxPoser: Composable 3D Value Maps for Robotic Manipulation with Language Models
이번 논문은 아주 재밌는 논문 입니다. LLM을 활용해 명시적인 명령어로부터 로봇 조작의 추론 및 명령어 생산하고 VLM(~OVD)을 활용해 로봇을 위한 3차원 공간에 대한 이해를 얻어…
[CVPR 2024]Open-vocabulary object 6D pose estimation
제가 이번에 리뷰할 6D Pose Estimation 논문도 보다 범용적으로 물체의 자세 정보를 추정하기 위한 연구로, 텍스트 프롬프트가 주어졌을 때 이에 대응되는 관심 객체의 자세정보를 추정하는…
[ECCV 2022] Simple Open-Vocabulary Object Detection with Vision Transformers (OWL-ViT)
안녕하세요. 저번 주에는 OWOD 태스크 중 Foundation model을 활용한 FOMO를 리뷰했었는데, 이번 주 리뷰는 FOMO의 베이스라인으로 활용됐던 OWL-ViT에 대해 리뷰를 해보려고 합니다. OWL-ViT는 Open-World Localization을…
[CVPR 2024]FoundationPose: Unified 6D Pose Estimation and Tracking of Novel Objects
제가 이번에 리뷰할 논문은 미학습 객체에 대응하기 위한 6D Pose Estimation 논문으로, 미학습 객체의 pose 정보를 추정하기 위한 서로 다른 세팅(3D CAD 모델을 사용하는 model-based방식과…
[NeurIPS 2023] Visual Instruction Tuning
CVPR 세미나에서 발표했던 것처럼, 이번주부터는 Multi-modal(Text, Image) model에 대해 리뷰해보려고 합니다. 가장 첫번째로 Meta의 LLM 모델인 LLaMA를 사용한 Vision-Language 모델인 LLaVA에 대해 다뤄보겠습니다. Conference: NeurIPS…
CVPR2024 참관기@황유진
#CVPR2024 참관기
세종대학교 RCV 연구실
박사과정 황유진
[CVPR 2024]Instance-Adaptive and Geometric-Aware Keypoint Learning for Category-Level 6D Object Pose Estimation
제가 이번에 리뷰할 논문은 Category-level의 6D Pose Estimation논문으로, Category-level의 방법론에서 Instance-Adaptive하게 keypoint를 예측하는 방식이라 하여 궁금해서 리뷰하게 되었습니다. Abstract Category-level의 6D Pose Estimation은 특정 카테고리…
[CVPR 2024 Spotlight] LangSplat: 3D Language Gaussian Splatting
이번 리뷰 논문은 LangSplat이라는 3D Language Fields (3DLF) 분야의 기법 중 3D Gaussian Splatting (3DGS)을 적용한 방식을 처음 제안한 논문입니다. 3DLF라는 분야도, 3DGS라는 분야도 많이…
[CVPR 2024]One-Shot Open Affordance Learning with Foundation Models
제가 이번에 리뷰할 논문은 제안서와 관련하여 논문을 서베이하면서 보게 된 논문입니다. Affordance segmentation이라고해서 물체에서 기능(Grasp/Cut/Scoop/Contain/Pound/Support/Wrap-Grasp 등 데이터에 따라 세부 분류가 조금씩 달라지는 것으로 보입니다)에 따라…
[CVPR 2022] Active Learning by Feature Mixing
황유진 연구원과 제출한 논문에서 받은 리뷰 중, 해당 논문에 대해서도 성능 비교 실험에 추가해달라는 코멘트가 있었습니다. 이에 제가 작성한 리뷰를 살펴보니, 해당 논문을 자세하게 리뷰한…
최신 댓글