X-Review – Page 38 – Robotics and Computer Vision Lab

[CoRL 2023 Oral] Robots That Ask For Help: Uncertainty Alignment for Large Language Model Planners

이번 리뷰 논문은 Robot의 행동 전략을 LLM으로 사용 했을 때, 발생 가능한 불확실성을 측정하기 위한 논문 입니다. 논문이 어려워 처음에는 oral로 인정 받은 이유를 파악하기…

[IROS 2024] CoPa: General Robotic Manipulation through Spatial Constraints of Parts with Foundational Model

안녕하세요. 이번 주 x-review도 태스크별 대규모 로봇-액션 데이터를 이용한 학습이나, 환경 모델에 기반한 강화학습없이, 파운데이션 비전-언어 모델인 VLM(GPT4V)을 활용하여 instruction이 들어왔을 때 prompt engineering과 python…

X-Review

[CoRL 2024] GraspSplats: Efficient Manipulation with 3D Feature Splatting

안녕하세요, 이번주엔 3D Gaussian Splatting을 활용해서 로봇이 새로운 환경에서 효율적으로 물체를 조작할 수 있는 접근방식을 제안한 논문을 리뷰해보도록 하겠습니다. 1분 이내에 고품질로 장면을 재구성하고 여러…

X-Review

[CVPR 2024]Grounding Image Matching in 3D with MASt3R

제가 이번에 리뷰할 논문은 MASt3R로, 네이버랩스 유럽에서 공개한 논문입니다. 실제로 데모를 실행해보았는데, 카메라에 대한 내부/외부 파라미터를 모르고 사용한 데이터 수가 굉장히 적은 상황에도 3D Reconstruction이…

Paper X-Review

[ CVPR 2022 ] X-Pool: Cross-Modal Language-Video Attention for Text-Video Retrieval

안녕하세요 정의철 연구원입니다. 이번에도 Text-Video Retrieval 논문을 리뷰하고자 합니다. 이번에 소개할 방법론은 2022년 논문이지만 여러 논문에서 baseline이 되는 방법론이기에 꼭 한 번 공부해볼 필요가 있다고…

Paper X-Review

[arXiv 2024] SteeredMarigold: Steering Diffusion Towards Depth Completion of Largely Incomplete Depth Maps

안녕하세요, 59번째 x-review 입니다. 이번 논문은 arXiv 2024에 올라온 SteeredMarigold라는 논문으로, Depth estimation 모델인 Marigold를 기반으로 Depth completion을 수행한 논문 입니다. 그럼 바로 리뷰 시작하겠습니다…

Paper X-Review

[CVPR 2020] PVN3D: A Deep Point-wise 3D Keypoints Voting Network for 6DoF Pose Estimation

안녕하세요 류지연입니다. 계속해서 6 DoF (Degree of Freedom) Pose Estimation 관련된 논문을 보고 있습니다. 오늘은 PVNet (PVNet리뷰) 에 이어서 두번째로 PVN3D 논문을 가져왔습니다. 그럼 바로…

Paper X-Review

[CVPR 2024] Text Is MASS: Modeling as Stochastic Embedding for Text-Video Retrieval

안녕하세요, 정의철 연구원입니다. 논문 작업으로 인해 한동안 X-review를 작성하지 못했지만, 다시 돌아와 연구 동향을 살펴보려고 합니다. 이번 리뷰에서는 Text-Video Retrieval 연구를 다루며, 향후에도 이 분야의…

Paper X-Review

[PMLR 2020]Being Bayesian, Even Just a Bit, Fixes Overconfidence in ReLU Networks

여러분은 논문의 제목을 보면서 어떤 내용일 것으로 추측되시나요? 네, 제목 그대로 bayesian 구조를 일반적인 딥러닝 네트워크에 도입함으로써, 딥러닝 네트워크에서 학습 데이터에 대한 overfitting 등으로 발생하는…

X-Review

[ACL 2023] PuMer: Pruning and Merging Tokens for Efficient Vision Language Models

안녕하세요. 지난 주 논문 제출을 마치고 약 2달 만의 리뷰입니다. 금일 리뷰 하는 논문은 ACL (Association for Computational Linguistics) 학회로 아마 연구원 분들은 익숙하진 않으실…

Category: X-Review

[CoRL 2023 Oral] Robots That Ask For Help: Uncertainty Alignment for Large Language Model Planners

[IROS 2024] CoPa: General Robotic Manipulation through Spatial Constraints of Parts with Foundational Model

[CoRL 2024] GraspSplats: Efficient Manipulation with 3D Feature Splatting

[CVPR 2024]Grounding Image Matching in 3D with MASt3R

[ CVPR 2022 ] X-Pool: Cross-Modal Language-Video Attention for Text-Video Retrieval

[arXiv 2024] SteeredMarigold: Steering Diffusion Towards Depth Completion of Largely Incomplete Depth Maps

[CVPR 2020] PVN3D: A Deep Point-wise 3D Keypoints Voting Network for 6DoF Pose Estimation

[CVPR 2024] Text Is MASS: Modeling as Stochastic Embedding for Text-Video Retrieval

[PMLR 2020]Being Bayesian, Even Just a Bit, Fixes Overconfidence in ReLU Networks

[ACL 2023] PuMer: Pruning and Merging Tokens for Efficient Vision Language Models

Conference Deadline

NEW POST

New Comment