2025년 03월 – 페이지 2 – Robotics and Computer Vision Lab

[CVPR 2020] PVN3D: A Deep Point-wise 3D Keypoints Voting Network for 6DoF Pose Estimation

안녕하세요 류지연입니다. 계속해서 6 DoF (Degree of Freedom) Pose Estimation 관련된 논문을 보고 있습니다. 오늘은 PVNet (PVNet리뷰) 에 이어서 두번째로 PVN3D 논문을 가져왔습니다. 그럼 바로…

Paper X-Review

[CVPR 2024] Text Is MASS: Modeling as Stochastic Embedding for Text-Video Retrieval

안녕하세요, 정의철 연구원입니다. 논문 작업으로 인해 한동안 X-review를 작성하지 못했지만, 다시 돌아와 연구 동향을 살펴보려고 합니다. 이번 리뷰에서는 Text-Video Retrieval 연구를 다루며, 향후에도 이 분야의…

Paper X-Review

[PMLR 2020]Being Bayesian, Even Just a Bit, Fixes Overconfidence in ReLU Networks

여러분은 논문의 제목을 보면서 어떤 내용일 것으로 추측되시나요? 네, 제목 그대로 bayesian 구조를 일반적인 딥러닝 네트워크에 도입함으로써, 딥러닝 네트워크에서 학습 데이터에 대한 overfitting 등으로 발생하는…

X-Review

[ACL 2023] PuMer: Pruning and Merging Tokens for Efficient Vision Language Models

안녕하세요. 지난 주 논문 제출을 마치고 약 2달 만의 리뷰입니다. 금일 리뷰 하는 논문은 ACL (Association for Computational Linguistics) 학회로 아마 연구원 분들은 익숙하진 않으실…

X-Review

[CVPR 2024] Text-to-3D using Gaussian Splatting

안녕하세요, 이번주는 텍스트를 통해 3D asset을 생성할 수 있는 기술인 Text-to-3D 변환 기술에 3D Gaussian Splatting을 활용한 논문을 리뷰 해보도록 하겠습니다. 아래 이미지는 이번에 리뷰하려는…

Paper X-Review

[CVPR 2019] PVNet: Pixel-wise Voting Network for 6DoF Pose Estimation

안녕하세요 류지연입니다. 현재 기초교육을 받고 있는데 교육 기간동안 6DoF Pose Estimation 관련 논문을 여러 편 읽게 되었습니다. 그 중 처음으로 읽게 된 논문이 PVNet: Pixel-wise…

X-Review

[CVPR2025] Enhancing Vision-Language Compositional Understanding with Multimodal Synthetic Data

안녕하세요. 박성준 연구원입니다. 오늘 리뷰할 논문은 CVRP2025에 게재된 Vision-Language 분야에서 Compositionality를 다룬 논문입니다. 논문의 제목에서 알 수 있듯이 저자는 Synthetic Data를 통해 Compositionality를 다뤘고 최근에…

Paper X-Review

[RA-L 2025] MonoTher-Depth: Enhancing Thermal Depth Estimation via Confidence-Aware Distillation

안녕하세요, 58번째 x-review 입니다. 이번 논문은 RA-L 2025년도에 게재된 Monocular Thermal Depth Estimation에 대한 논문 입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction 단안 RGB…

Paper X-Review

[ArXiv 2024] CLII: Visual-Text Inpainting via Cross-Modal Predictive Interaction

안녕하세요, 쉰 다섯번째 X-Review입니다. 이번 논문은 2024년도 ArXiv에 올라온 CLII: Visual-Text Inpainting via Cross-Modal Predictive Interaction논문입니다. 바로 시작하도록 하겠습니다. 🧖🏽 1. Introduction 도시 거리에는 광고판이나,…

Paper X-Review

[CVPR 2022] Learning to Prompt for Open-Vocabulary Object Detection with Vision-Language Model

안녕하세요, 허재연입니다. 요즘에는 VLM과 OD의 결합으로 발전되고 있는 OVOD의 연구 동향을 팔로업 하고 있습니다. 제가 NLP쪽은 잘 몰라서 VLM의 prompt는 어떻게 사용하는지 항상 의문을 가지고…

일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

[월:] 2025년 03월

[CVPR 2020] PVN3D: A Deep Point-wise 3D Keypoints Voting Network for 6DoF Pose Estimation

[CVPR 2024] Text Is MASS: Modeling as Stochastic Embedding for Text-Video Retrieval

[PMLR 2020]Being Bayesian, Even Just a Bit, Fixes Overconfidence in ReLU Networks

[ACL 2023] PuMer: Pruning and Merging Tokens for Efficient Vision Language Models

[CVPR 2024] Text-to-3D using Gaussian Splatting

[CVPR 2019] PVNet: Pixel-wise Voting Network for 6DoF Pose Estimation

[CVPR2025] Enhancing Vision-Language Compositional Understanding with Multimodal Synthetic Data

[RA-L 2025] MonoTher-Depth: Enhancing Thermal Depth Estimation via Confidence-Aware Distillation

[ArXiv 2024] CLII: Visual-Text Inpainting via Cross-Modal Predictive Interaction

[CVPR 2022] Learning to Prompt for Open-Vocabulary Object Detection with Vision-Language Model

학술대회 마감

최신 글

최신 댓글

학술대회 마감

태그

카테고리

최신 글

최신 댓글