[월:] 2025년 04월

Posted in Paper X-Review

[arXiv 2025] Cooking Task Planning using LLM and Verified by Graph Network

이번 리뷰 논문의 유뷰트 보고 요리하는 로봇에 대해서 다루고자 합니다. 분야 관련 게시물들을 보다가 발견한 기사에서 해당 논문에 대해서 다루는 것을 보고 읽게 되었습니다. 기법은…

Continue Reading
Posted in Paper X-Review

[COLING 2025] Less is More: A Simple yet Effective Token Reduction Method for Efficient Multi-modal LLMs

안녕하세요. 제가 이번에 리뷰할 논문은 이전 리뷰인 두 PuMer, LLaVA-PruMerge을 읽고 이해하셨다면 저자의 새로운 기여는 하나 밖에 없습니다 (대부분은 이전 리뷰에서 차용해온 방식을 그대로 사용했습니다)….

Continue Reading
Posted in Paper X-Review

[ICCV 2023] CLIPTER: Looking at the Bigger Picture in Scene Text Recognition

안녕하세요, 쉰 다섯번째 X-Review입니다. 이번 논문은 2023년도 ICCV에 올라온 CLIPTER: Looking at the Bigger Picture in Scene Text Recognition논문입니다. 바로 시작하도록 하겠습니다. 🌹 1. Introduction…

Continue Reading
Posted in Paper X-Review

[ICRA 2025] TransDiff: Diffusion-Based Method for Manipulating Transparent Using a Single RGB-D Image

안녕하세요, 61번째 x-review 입니다. 이번 논문은 ICRA 2025에 게재된 TransDiff라는 논문으로, Diffusion을 활용하여 투명한 물체에 대한 Depth Completion을 수행한 논문 입니다. 그럼 바로 리뷰 시작하겠습니다…

Continue Reading
Posted in Conference X-Review

[CVPR 2024]Continual Segmentation with Disentangled Objectness Learning and Class Recognition

제가 이번에 리뷰할 논문은 CVPR 2024에 공개된 segmentation 분야의 continual learning 관련 논문입니다. 제가 주로 담당하고 있는 산자부 미학습 물체 파지 과제도 새로운 대상에 대하여…

Continue Reading
Posted in Paper X-Review

[2022 NIPS] Multimodal Contrastive Learning with LIMoE: the Language-Image Mixture of Experts

안녕하세요. 이번에는 Multimodal MoE(mixture of experts)에 관련된 논문을 리뷰하려고 합니다. 본 리뷰는 이전에 작성한 리뷰보다 먼저 작성했으나, 업로드 과정에서 문제가 있어 순서가 바뀌었네요. 본 글에서는…

Continue Reading
Posted in Paper X-Review

[ICLR 2022] DAB-DETR: Dynamic Anchor Boxes are Better Queries for DETR

안녕하세요, 허재연입니다. 오늘 리뷰할 논문은 ICLR 2022에 게재된 DAB-DETR입니다. OVOD 논문들을 읽다 등장하여 살펴본 논문이며, DETR의 object query에 주목하여 성능을 개선한 논문입니다. DETR 구조는 대부분…

Continue Reading
Posted in Paper X-Review

[arXiv 2025]Video-R1: Reinforcing Video Reasoning in MLLMs

안녕하세요, 오늘 소개드릴 논문은 Video-R1입니다. Github 에서는 본 논문을 [🔥the first paper to explore R1 for video] 라고 소개하고 있습니다. 즉, 저자들은 본 논문을 DeepSeek-R1에서…

Continue Reading
Posted in X-Review

[RA-L 2022] Q-attention: Enabling Efficient Learning for Vision-based Robotic Manipulation

안녕하세요. 이번 리뷰는 로보틱스 팀에 핏한 매니퓰레이터 강화학습에 관한 내용으로 들고 왔습니다. 로봇 매니퓰레이터 작업을 비전 기반의 강화학습인 Q-attention이란 개념을 도입해 풀어나간 논문입니다. RLBench 기반이라…

Continue Reading
Posted in X-Review

[NIPS2016] Unifying Count-Based Exploration and Intrinsic Motivation

안녕하세요 박성준 연구원입니다. 오늘은 강화학습 리뷰를 가져왔습니다. 해당 논문은 알파고로 유명한 구글 딥마인드 팀에서 작성한 논문으로 기존 강화학습에 딥러닝을 연계한 DQN 모델에 관한 내용입니다. 리뷰에…

Continue Reading