Author: 김 태주

Posted in X-Diary

2024년 상반기를 마무리하며

벌써… 상반기가 끝나고 하반기를 알리는 여름 방학이 시작되었네요…시간 정말 빠른 것 같습니다. 저한테는 24년도 상반기와 하반기는 만 29살이라고 윤 정부로부터 연장된 20대의 시기가 이제 곧…

Continue Reading
Posted in Paper X-Review

[SIGGRAPH 2023] 3D Gaussian Splatting for Real-Time Radiance Field Rendering

이번 리뷰는 NeRF를 이어 Novel View Synthesis 분야에 큰 획을 그은 3D Gaussian Splatting (3DGS)에 대해서 다루고자 합니다. Intro 3차원 공간을 표현하는 가장 대표적인 방법인…

Continue Reading
Posted in Conference News Paper X-Review

[CVPR 2024 Spotlight] LangSplat: 3D Language Gaussian Splatting

이번 리뷰 논문은 LangSplat이라는 3D Language Fields (3DLF) 분야의 기법 중 3D Gaussian Splatting (3DGS)을 적용한 방식을 처음 제안한 논문입니다. 3DLF라는 분야도, 3DGS라는 분야도 많이…

Continue Reading
Posted in News Paper X-Review

[arXiv 2024] Grounded SAM: Assembling Open-World Models for Diverse Visual Tasks

이번 리뷰는 Grounding-DINO와 SAM을 결합한 Grounded SAM이란 기법에 대한 기술 보고서에 대한 내용입니다. 해당 내용에서는 다양한 태스크들을 어떻게 수행했는지에 대한 내용들이 작성되어져 있습니다. 해당 리뷰를…

Continue Reading
Posted in Conference Paper X-Review

[ICCV 2023] AGG-Net: Attention Guided Gated-convolutional Network for Depth Image Completion

이번 리뷰도 저번에 이어서 Depth completion 논문에 해당합ㄴ디ㅏ. 이전 논문과 유사하게 gated convolution을 이용하고 raw depth를 보완하기 위한 방법을 제시합니다. INTRO 이전 리뷰에서 다룬 바와…

Continue Reading
Posted in Conference News Paper X-Review

[CVPR 2022] RGB-Depth Fusion GAN for Indoor Depth Completion

이번 리뷰 논문으로 Depth completion 논문을 들고 왔습니다. 이번 리뷰 논문은 일반적인 deptn completion 논문에서 다루는 방향과 다른 방향을 가지고 있습니다. 대체로 depth completion 태스크에서는…

Continue Reading
Posted in Conference Paper X-Review

[ICCV 2023 oral] Scalable Diffusion Models with Transformers

[ Projet, Paper, Code ] 이번 논문 리뷰로 오랜만에 diffusion model을 들고 왔습니다. 기존 diffusion model들이 관행처럼 사용해오던 U-Net 구조의 backbone을 transformer로 나이브하게 변경한 논문입니다….

Continue Reading
Posted in Conference News Paper X-Review

[ICCV 2023] Random Boxes Are Open-world Object Detectors

이번 논문은 저번 세미나에서 발표했던 Open World Object Detection(OWOD) 방법론 중 Trainable Proposal Sampler 대신에 Random Boxes 사용해 class-agonistic detector 능력을 향상 시킨 방법론에 해당합니다….

Continue Reading
Posted in Conference Paper X-Review

[CVPR 2021 oral] Toward Open World Object Detection

이번 리뷰 논문은 Open World Object Detection (OWOD or OWD) 태스크에 관한 논문입니다. 처음으로 OWOD 태스크를 정의하고 벤치마크와 해결안을 제시한 논문이기도 합니다. 해당 논문을 읽게…

Continue Reading
Posted in Conference Paper X-Review

[NeurIPS 2023] SAM-CLIP: Merging Vision Foundation Models towards Semantic and Spatial Understanding

이번 리뷰 논문은 세그멘테이션과 언어 모델에서 핫한 두 개의 파운데이션 모델 SAM과 CLIP을 하나의 모델로 병합하는 방법(model merging)을 제시하는 방법론에 해당합니다. 두 모델의 특징을 살리면서…

Continue Reading