[카테고리:] News

Posted in News Paper X-Review

[ECCV 2020] End-to-End Object Detection with Transformers

안녕하세요 류지연입니다. 오늘 리뷰할 논문은 이전에 작성했던 TESTR 모델의 근간이 되는 DETR입니다. TESTR을 읽을 때 DETR에 대해서 알고자 간단하게 블로그만을 참고했었는데요 깊게 알고자 논문을 읽고…

Continue Reading
Posted in News

LLaVA-Grounding: Grounded Visual Chat with Large Multimodal Model

Introduction GPT-4, LLaMA의 LMM (MLLM) 시대 이후 사용자의 지시문이나 입력 이미지에 대한 Visual Chat 능력이 중요시 되고 있습니다. 하지만 이들은 이미지 전반적인 이해력은 높지만 특정…

Continue Reading
Posted in News Paper X-Review

[2022 NIPS] On the Representation Collapse of Sparse Mixture of Experts

안녕하세요 이번에 소개해드릴 논문도 Mixture of Experts(MoE) 분야와 관련된 연구입니다. 최근 MoE의 내용을 정리하면서, 이 구성 요소 중 라우팅(router)가 핵심적인 역할을 한다는 점을 파악하게 되었습니다….

Continue Reading
Posted in News

[CVPR 2021] FFB6D: A Full Flow Bidirectional Fusion Network for 6D Pose Estimation

안녕하세요 PVNet, PVN3D에 이어서 FFB6D 논문으로 찾아왔습니다. 세 논문 모두 6자유도를 갖는 3차원 물체의 자세를 추정하기 위한 방법을 다룬 논문들입니다. 6자유도를 갖는 3차원 물체의 자세를…

Continue Reading
Posted in Conference News Paper X-Review

[CoRL 2023 Oral] Robots That Ask For Help: Uncertainty Alignment for Large Language Model Planners

이번 리뷰 논문은 Robot의 행동 전략을 LLM으로 사용 했을 때, 발생 가능한 불확실성을 측정하기 위한 논문 입니다. 논문이 어려워 처음에는 oral로 인정 받은 이유를 파악하기…

Continue Reading
Posted in Conference News X-Review

[ICRA 2024]Language-Conditioned Affordance-Pose Detection in 3D Point Clouds

Abstraction Affordance를 인식하고 pose를 추정하는 것은 로봇의 조작에 중요하며, 이 둘을 융합하므로써 작업과 연관된 affordance를 잡기 위한 pose를 생성해내므로써 로봇의 조작 능력이 개선될 수 있습니다….

Continue Reading
Posted in Conference News Paper X-Review

[ICLR 2025] Real2Code: Reconstruct Articulated Objects via Code Generation

이번 리뷰 논문은 관절형(articulated) 객체를 이해하고 3차원 재구성을 코드 레벨로 구축이 가능한 기법을 제안한 논문입니다. open review인 ICLR에서 accept을 받은 것으로 확인됩니다. 최근 실제 세계의…

Continue Reading
Posted in News Paper X-Review

[2024 CVPR] The Neglected Tails in Vision-Language Models

안녕하세요 이번에 소개할 논문은 Vision-Language Models(VLMs)에서 발생하는 long-tailed 문제를 다룬 논문입니다. long-tailed 문제란 학습 데이터에 특정 클래스나 concept(클래스와 유사한 개념)이 적게 포함되어 모델 성능이 불균형해지는…

Continue Reading
Posted in News Paper X-Review

[2024 EACL] Does CLIP Bind Concepts? Probing Compositionality in Large Image Models

안녕하세요. 이번에 소개할 논문은 CLIP과 같은 대규모 VLM에서 compositional 표현 능력을 분석하고 그 한계를 평가하는 논문입니다. 연구의 주요 목표는 CLIP이 시각적으로 다양한 객체와 속성 개념을…

Continue Reading
Posted in News X-Diary

[김태주] 2024년을 마무리하며

격변과 적응의 시기올해는 저에게 격변과 적응의 시기였습니다.아실 분들은 아시겠지만, 올해 제 메인 연구 주제를 변경하였습니다. 이전까지는 무인화 플랫폼을 타겟으로 시각 강인성을 가진 인지 알고리즘 개발을…

Continue Reading