Author: 김 태주

Posted in Conference X-Review

[ICCP 2024] ThermalNeRF: Thermal Radiance Fields

이번 리뷰 논문은 열화상과 컬러 영상에서의 Novel View Synthesis를 제안한 논문입니다. 해당 연구 결과는 열화상과 컬러 영상 간의 도메인 갭을 메꾸기 위한 기반이 될 연구라고…

Continue Reading
Posted in Conference Paper X-Review

[ICLR 2024] FeatUp: A Model-Agnostic Framework for Features at Any Resolution

이번 논문은 제목 그대로 모델 무관하게 특징맵의 해상도를 변경 가능하도록 하게 해주는 기법입니다. Intro 최근 인공지능 분야에서는 foundation model의 등장으로 해당 모델을 고정하여 추출된 특징맵을…

Continue Reading
Posted in Conference Paper X-Review

[ICLR 2024] VISION TRANSFORMERS NEED REGISTERS

이번 논문은 Vision Transformers 기반 large model의 특징 표현력을 향상시키기 위해 원인을 찾아 분석하고 이에 대한 해결책을 제시한 논문입니다. 해당 기법에 주목하게 된 계기는 Vision…

Continue Reading
Posted in Paper X-Review

[arXiv 2023] Code as Policies: Language Model Programs for Embodied Control

이번 논문은 로봇 작업을 위한 정책 코드를 생성하는 방법론으로 최근 로보틱스 분야가 LLM과 함께 왜 각광 받는지를 보여주는 연구 내용으로 이해하시면 좋을 것 같습니다. Intro…

Continue Reading
Posted in Conference News Paper X-Review

[CoRL 2023 oral] VoxPoser: Composable 3D Value Maps for Robotic Manipulation with Language Models

이번 논문은 아주 재밌는 논문 입니다. LLM을 활용해 명시적인 명령어로부터 로봇 조작의 추론 및 명령어 생산하고 VLM(~OVD)을 활용해 로봇을 위한 3차원 공간에 대한 이해를 얻어…

Continue Reading
Posted in X-Diary

2024년 상반기를 마무리하며

벌써… 상반기가 끝나고 하반기를 알리는 여름 방학이 시작되었네요…시간 정말 빠른 것 같습니다. 저한테는 24년도 상반기와 하반기는 만 29살이라고 윤 정부로부터 연장된 20대의 시기가 이제 곧…

Continue Reading
Posted in Paper X-Review

[SIGGRAPH 2023] 3D Gaussian Splatting for Real-Time Radiance Field Rendering

이번 리뷰는 NeRF를 이어 Novel View Synthesis 분야에 큰 획을 그은 3D Gaussian Splatting (3DGS)에 대해서 다루고자 합니다. Intro 3차원 공간을 표현하는 가장 대표적인 방법인…

Continue Reading
Posted in Conference News Paper X-Review

[CVPR 2024 Spotlight] LangSplat: 3D Language Gaussian Splatting

이번 리뷰 논문은 LangSplat이라는 3D Language Fields (3DLF) 분야의 기법 중 3D Gaussian Splatting (3DGS)을 적용한 방식을 처음 제안한 논문입니다. 3DLF라는 분야도, 3DGS라는 분야도 많이…

Continue Reading
Posted in News Paper X-Review

[arXiv 2024] Grounded SAM: Assembling Open-World Models for Diverse Visual Tasks

이번 리뷰는 Grounding-DINO와 SAM을 결합한 Grounded SAM이란 기법에 대한 기술 보고서에 대한 내용입니다. 해당 내용에서는 다양한 태스크들을 어떻게 수행했는지에 대한 내용들이 작성되어져 있습니다. 해당 리뷰를…

Continue Reading
Posted in Conference Paper X-Review

[ICCV 2023] AGG-Net: Attention Guided Gated-convolutional Network for Depth Image Completion

이번 리뷰도 저번에 이어서 Depth completion 논문에 해당합ㄴ디ㅏ. 이전 논문과 유사하게 gated convolution을 이용하고 raw depth를 보완하기 위한 방법을 제시합니다. INTRO 이전 리뷰에서 다룬 바와…

Continue Reading