News – Robotics and Computer Vision Lab

[CVPR 2020] On Recognizing Texts of Arbitrary Shapes with 2D Self-Attention

안녕하세요 류지연입니다. 이번에도 Scene text recognition을 다루는 논문을 리뷰해보겠습니다. 지난주에 DiG를 리뷰했었는데요 사전학습된 인코더에 이 논문의 디코더를 붙여 파인튜닝을 해 recognition을 수행하더군요. TESTR에서의 recognition 방법과…

News X-Review

[CVPR2023]SCANet: Self-Paced Semi-Curricular Attention Network for Non-Homogeneous Image Dehazing

안녕하세요 2번째 X-Review 작성자 손우진입니다. 이번에는 2023년 CVPR에 기재된 Non-Homogeneous Image에서 Dehazing 문제를 다룬 논문인 SCANet: Self-paced Semi-curricular Attention Network for Non-Homogeneous Image Dehazing 을…

Conference News Paper X-Review

[CVPR 2025] Fast3R: Towards 3D Reconstruction of 1000+ Images in One Forward Pass

이번 리뷰 논문은 DUST3R이라는 dense feature matching 기법으로 획을 그은 DUST3R라는 연구의 2장 이상의 영상들로 재구성을 수행했을 때의 시간 문제를 해소하기 위해서 제안된 기법입니다. 해당…

News Paper X-Review

[ECCV 2020] End-to-End Object Detection with Transformers

안녕하세요 류지연입니다. 오늘 리뷰할 논문은 이전에 작성했던 TESTR 모델의 근간이 되는 DETR입니다. TESTR을 읽을 때 DETR에 대해서 알고자 간단하게 블로그만을 참고했었는데요 깊게 알고자 논문을 읽고…

News

LLaVA-Grounding: Grounded Visual Chat with Large Multimodal Model

Introduction GPT-4, LLaMA의 LMM (MLLM) 시대 이후 사용자의 지시문이나 입력 이미지에 대한 Visual Chat 능력이 중요시 되고 있습니다. 하지만 이들은 이미지 전반적인 이해력은 높지만 특정…

News Paper X-Review

[2022 NIPS] On the Representation Collapse of Sparse Mixture of Experts

안녕하세요 이번에 소개해드릴 논문도 Mixture of Experts(MoE) 분야와 관련된 연구입니다. 최근 MoE의 내용을 정리하면서, 이 구성 요소 중 라우팅(router)가 핵심적인 역할을 한다는 점을 파악하게 되었습니다….

News

[CVPR 2021] FFB6D: A Full Flow Bidirectional Fusion Network for 6D Pose Estimation

안녕하세요 PVNet, PVN3D에 이어서 FFB6D 논문으로 찾아왔습니다. 세 논문 모두 6자유도를 갖는 3차원 물체의 자세를 추정하기 위한 방법을 다룬 논문들입니다. 6자유도를 갖는 3차원 물체의 자세를…

Conference News Paper X-Review

[CoRL 2023 Oral] Robots That Ask For Help: Uncertainty Alignment for Large Language Model Planners

이번 리뷰 논문은 Robot의 행동 전략을 LLM으로 사용 했을 때, 발생 가능한 불확실성을 측정하기 위한 논문 입니다. 논문이 어려워 처음에는 oral로 인정 받은 이유를 파악하기…

Conference News X-Review

[ICRA 2024]Language-Conditioned Affordance-Pose Detection in 3D Point Clouds

Abstraction Affordance를 인식하고 pose를 추정하는 것은 로봇의 조작에 중요하며, 이 둘을 융합하므로써 작업과 연관된 affordance를 잡기 위한 pose를 생성해내므로써 로봇의 조작 능력이 개선될 수 있습니다….

Conference News Paper X-Review

[ICLR 2025] Real2Code: Reconstruct Articulated Objects via Code Generation

이번 리뷰 논문은 관절형(articulated) 객체를 이해하고 3차원 재구성을 코드 레벨로 구축이 가능한 기법을 제안한 논문입니다. open review인 ICLR에서 accept을 받은 것으로 확인됩니다. 최근 실제 세계의…

Category: News

[CVPR 2020] On Recognizing Texts of Arbitrary Shapes with 2D Self-Attention

[CVPR2023]SCANet: Self-Paced Semi-Curricular Attention Network for Non-Homogeneous Image Dehazing

[CVPR 2025] Fast3R: Towards 3D Reconstruction of 1000+ Images in One Forward Pass

[ECCV 2020] End-to-End Object Detection with Transformers

LLaVA-Grounding: Grounded Visual Chat with Large Multimodal Model

[2022 NIPS] On the Representation Collapse of Sparse Mixture of Experts

[CVPR 2021] FFB6D: A Full Flow Bidirectional Fusion Network for 6D Pose Estimation

[CoRL 2023 Oral] Robots That Ask For Help: Uncertainty Alignment for Large Language Model Planners

[ICRA 2024]Language-Conditioned Affordance-Pose Detection in 3D Point Clouds

[ICLR 2025] Real2Code: Reconstruct Articulated Objects via Code Generation

Conference Deadline

NEW POST

New Comment