Author: 김 태주

Posted in Conference News Paper X-Review

[CoRL 2023 Oral] Robots That Ask For Help: Uncertainty Alignment for Large Language Model Planners

이번 리뷰 논문은 Robot의 행동 전략을 LLM으로 사용 했을 때, 발생 가능한 불확실성을 측정하기 위한 논문 입니다. 논문이 어려워 처음에는 oral로 인정 받은 이유를 파악하기…

Continue Reading
Posted in Conference Paper X-Review

[arXiv 2024] Occam’s LGS: A Simple Approach for Language Gaussian Splatting

이번 리뷰 논문은 3D Language Feature Splatting 기법에 대해서 다루고자 합니다. 제목 중 Occam이라는 용어가 보일 겁니다. 저 용어는 Occam’s Razor (오컴의 면도날)라는 단순의 미학을…

Continue Reading
Posted in Conference News Paper X-Review

[ICLR 2025] Real2Code: Reconstruct Articulated Objects via Code Generation

이번 리뷰 논문은 관절형(articulated) 객체를 이해하고 3차원 재구성을 코드 레벨로 구축이 가능한 기법을 제안한 논문입니다. open review인 ICLR에서 accept을 받은 것으로 확인됩니다. 최근 실제 세계의…

Continue Reading
Posted in Conference Paper X-Review

[AAAI 2025] FastLGS: Speeding up Language Embedded Gaussians with Feature Grid Mapping

이번 리뷰 논문은 3D Language Field 중 출판된 가장 최신 기법으로 실시간성과 성능 모두 SOTA를 달성한 기법에 해당합니다. 기존 기법들은 첫 시도들을 제안한 기법이라면 해다…

Continue Reading
Posted in Conference Paper X-Review

[CVPR 2024] GARField: Group Anything with Radiance Fields

이번 리뷰 논문은 LERF 저자들의 후속 논문들로 특징으로만 구분하는 경우, 모호한 영역 구분으로 인해 쿼리에 해당하는 영역과 명확한 구분이 어렵다는 문제점이 있습니다. 저자는 이를 해결하기…

Continue Reading
Posted in News X-Diary

[김태주] 2024년을 마무리하며

격변과 적응의 시기올해는 저에게 격변과 적응의 시기였습니다.아실 분들은 아시겠지만, 올해 제 메인 연구 주제를 변경하였습니다. 이전까지는 무인화 플랫폼을 타겟으로 시각 강인성을 가진 인지 알고리즘 개발을…

Continue Reading
Posted in Conference X-Review

[NeurIPS 2024] Large Spatial Model: End-to-end Unposed Images to Semantic 3D

이번 리뷰 논문은 전에 소개해드린 3DLF의 느릴 수 밖에 없는 파이프라인과 추론 속도를 보강하기 위한 기법입니다. 해당 기법은 입력 영상으로부터 0.1 second 정도의 온보딩 과정만…

Continue Reading
Posted in Conference X-Review

[CVPR 2024] Feature 3DGS: Supercharging 3D Gaussian Splatting to Enable Distilled Feature Fields

이번 논문은 3D scene representations에 foundation model의 특징 정보를 학습시킴으로써, 장면에 대한 의미론적 이해가 가능하도록 하는 것을 목표로 합니다. 더 나아가, 언어, point, bbox 등…

Continue Reading
Posted in Conference Paper X-Review

[ECCV 2024 Oral] CAT-SAM: Conditional Tuning for Few-Shot Adaptation of Segment Anything Model

이번 리뷰 논문은 CAT-SAM이라는 SAM의 지식을 유지하면서 특정 도메인에 효율적으로 적응시키는 기법을 소개한 논문입니다. RGB 특화된 태스크 외에도 비 RGB에서도 적응적인 결과를 보여주고 있습니다. 추가로…

Continue Reading
Posted in Conference Paper X-Review

[CoRL 2023 Oral] Language Embedded Radiance Fields for Zero-Shot Task-Oriented Grasping

이번 논문은 LEFT-TOGO라는 논문으로 저희가 진행하고 있는 LLM 로봇 과제에서 지향하는 목표 중 하나를 구현한 논문에 해당합니다. 해당 논문은 VLM의 특징 정보를 가진 NeRF인 LERF를…

Continue Reading