Author: 이 상인

Posted in X-Review

[arXiv 2025] [CLS] Attention is All You Need for Training-Free Visual Token Pruning: Make VLM Inference Faster

안녕하세요. 이번 리뷰도 Token Pruning에 관한 논문입니다. 아직 어느 학회/저널에 Accept된 것으로 보이진 않지만, 21회의 Citation 수를 보입니다. 논문 제목도 찾아보면 Revised 버전에 따라 다르게…

Continue Reading
Posted in Paper X-Review

[COLING 2025] Less is More: A Simple yet Effective Token Reduction Method for Efficient Multi-modal LLMs

안녕하세요. 이번 리뷰는 최근 연구 및 실험 중인 MLLM (LMM) Token Reduction에 관한 논문입니다. 요즘 “MLLM의 VG/Segmentation에서 Token Reduction 시 성능 및 효율성을 고려하는 방법”에…

Continue Reading
Posted in X-Diary

ICRA 2025 참관 후기

안녕하세요. 지난 일주일 (19-23) 간, 미국 애틀랜타의 ICRA 2025 학회를 참관하고 느낀 점을 연구원 분들과 공유드리고자 합니다. 우리가 흔히들 말하는 CVPR/ICCV 등 주요 학회의 논문은…

Continue Reading
Posted in Paper X-Review

[arXiv 2025.02] Token Pruning in Multimodal Large Language Models: Are We Solving the Right Problem?

안녕하세요. 이번에는 MLLM의 Token Pruning에 대한 분석을 담은 논문을 들고 왔습니다. 본 논문을 읽게 된 계기가 참 긴데, 현재 제가 진행 중인 실험과 연관되어 있습니다….

Continue Reading
Posted in News

LLaVA-Grounding: Grounded Visual Chat with Large Multimodal Model

Introduction GPT-4, LLaMA의 LMM (MLLM) 시대 이후 사용자의 지시문이나 입력 이미지에 대한 Visual Chat 능력이 중요시 되고 있습니다. 하지만 이들은 이미지 전반적인 이해력은 높지만 특정…

Continue Reading
Posted in Paper X-Review

[COLING 2025] Less is More: A Simple yet Effective Token Reduction Method for Efficient Multi-modal LLMs

안녕하세요. 제가 이번에 리뷰할 논문은 이전 리뷰인 두 PuMer, LLaVA-PruMerge을 읽고 이해하셨다면 저자의 새로운 기여는 하나 밖에 없습니다 (대부분은 이전 리뷰에서 차용해온 방식을 그대로 사용했습니다)….

Continue Reading
Posted in Paper X-Review

[arXiv 2024] LLaVA-PruMerge: Adaptive Token Reduction for Efficient Large Multimodal Models

안녕하세요. 이번 리뷰는 세미나에서 소개드린 LLaVA-PruMerge입니다. 세미나에서 방법론에 대해 자세히 다루지는 않았는데, 좋은 기회일 것 같습니다. 그럼 바로 시작해보겠습니다. Introduction 놀라울만한 LLM의 성능에 이은 LMM…

Continue Reading
Posted in X-Review

[ACL 2023] PuMer: Pruning and Merging Tokens for Efficient Vision Language Models

안녕하세요. 지난 주 논문 제출을 마치고 약 2달 만의 리뷰입니다. 금일 리뷰 하는 논문은 ACL (Association for Computational Linguistics) 학회로 아마 연구원 분들은 익숙하진 않으실…

Continue Reading
Posted in X-Review

[ECCV 2022] Open Vocabulary Object Detection with Pseudo Bounding-Box Labels

안녕하세요. 2025년 새해가 밝았습니다. 시작말로, 금년도부터는 논문을 읽는 시각이 조금 바뀌었습니다. 논문을 작성중이다보니 저자가 본인의 방법론을 어떠한 방식으로 표현하였는지, 그 방법을 실험으로 어떻게 설득시키고자 하였는지에…

Continue Reading
Posted in M.S. X-Diary

[이상인] 2024년을 보내며

안녕하세요. 매년을 마무리하며 또는 상반기를 마무리하는 회고를 작성하였는데, 이제는 석사 1년 차를 마치는 2024년이 되었네요. 이번 상-하반기부터 집중하는 논문이 있기에, 오히려 예전부터 늘 해오던 고민이…

Continue Reading