[월:] 2025년 02월
[졸업생-한대찬] 학부/석사 과정 때 알았다면 좋았을 것들 (부제: 이렇게 했었으면 좋았을 것들 + 이런 것 들이 나에게는 좋았다)
안녕하십니까 RCV 학생 여러분 한대찬 연구원 입니다. 저는 2019년도에 연구실에 들어오 학부 2년 석사 2년 후 졸업한 후 취업하여 일하고 있는 연구원 입니다. 오랜만에 연구실…
[CVPR2023] Deep Deterministic Uncertainty: A New Simple Baseline
안녕하세요 본 리뷰는 일반적인 딥러닝 모델(Deterministic model)에서 불확실성을 추론하는 방법의 베이스라인을 제시하는 논문을 소개하려고 합니다. 앞서서 Bayesian learning의 장점은 불확실성을 이론적으로 정의하여 추정할 수 있는…
KRoC 2025 참관기
안녕하세요, 이번주는 2월 12일-13일 이틀간 다녀온 KRoC 참관기 입니다. 저는 발표하러 간 것은 아니지만 최근 가장 큰 관심분야중 하나인 로봇들에 관한 내용들을 연구자들을 통해 직접적으로…
[ICML 2021] ALIGN: Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision
안녕하세요, 허재연입니다. 오늘 리뷰할 논문은 google research에서 2021년 ICLR에 게재한 ALIGN: Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision 이라는 논문입니다. CLIP과…
[CVPR 2024]ODM: A Text-Image Further Alignment Pre-training Approach for Scene Text Detection and Spotting
안녕하세요, 쉰 두번째 X-Review입니다. 이번 논문은 2024년도 CVPR에 게재된 ODM: A Text-Image Further Alignment Pre-training Approach for Scene Text Detection and Spotting논문입니다. 바로 시작하도록 하겠습니다….
[CVPR2023]Exploring the Effect of Primitives for Compositional Generalization in Vision-and-Language
안녕하세요. 박성준 연구원입니다. 오늘 리뷰할 논문은 CVPR2023에 게재된 논문으로 Vision-Language task에서 Compositional Generalization 능력에 대한 논문입니다. Introduction Compositionality는 인간의 인지 능력에서 중요한 능력 중에 하나로…
[arXiv 2024]GAPartManip: A Large-scale Part-centric Dataset for Material-Agnostic Articulated Object Manipulation
Abstract articulated object(관절이 존재하여, 변형이 가능한 물체)를 조작하는 것은 embodide AI의 일반화 달성을 위해 중요한 연구로, 기존의 3D vision 연구는 주로 물체의 depth 정보를 인식하고…
[arXiv 2025] Marigold-DC: Zero-Shot Monocular Depth Completion with Guided Diffusion
안녕하세요, 55번째 x-review 입니다. 이번 논문은 arxiv 2025년도에 올라와있는 논문으로, 지난 주 리뷰한 Marigold 모델을 depth completion으로 확장한 방법론 입니다. 그럼 바로 리뷰 시작하겠습니다 !…
[NeurIPS 2024] RankRAG: Unifying Context Ranking with Retrieval-Augmented Generation in LLMs
1. Introduction Retrieval-augmented generation(RAG)는 LLM을 커스텀하여 long-tail knowledge를 처리하고, 최신 정보를 반영하며, 특정 도메인에 적용할 수 있는 기술을 의미합니다. 일반적으로 RAG의 동작원리는 이러합니다. 우선 dense…
[arXiv 202]GEAL: Generalizable 3D Affordance Learning with Cross-Modal Consistency
제가 이번에 리뷰할 논문은 3D Affordance논문으로, 3D 공간에 language 정보를 입히는 3D Gaussian splatting(3DGS, 이에 대한 자세한 설명은 태주님이 리뷰한 이전 X-review를 참고해주세요!)을 이용하였다고 하여…
최신 댓글