Author: 이 재윤

Posted in Paper X-Review

[AAAI 2026] SM3Det: A Unified Model for Multi-Modal Remote Sensing Object Detection

안녕하세요, 오늘 리뷰할 논문은 AAAI 2026 Oral 논문인 SM3Det 입니다. LVU 논문 작업 이후 다시 저희 팀 기업 과제 팔로우업과 창의학기제를 겸해서 SAR Object Detection…

Continue Reading
Posted in Paper X-Review

[ICCV 2025]Multi-Granular Spatio-Temporal Token Merging for Training-Free Acceleration of Video LLMs

Video Large Language Models(Video-LMMs)는 시공간 토큰(spatiotemporal tokens)을 활용해서 강력한 비디오 이해 능력을 가지게 되었지만 토큰 개수가 많아질수록 연산량이 2차적으로 증가한다는 문제점을 가지고 있었습니다. 이에 저자들은…

Continue Reading
Posted in Paper X-Review

[CVPR 2025] Apollo: An Exploration of Video Understanding in Large Multimodal Models

안녕하세요, 3번째 x-review는 Apollo라는 논문입니다. (논문 기준) 현재까지 video-LLM 연구의 문제점을 짚고, 저자 자신들의 모델을 제안하는 구성이기 때문에 LVU task에 익숙하지 않으신 분들도 꽤(?) 재밌게…

Continue Reading
Posted in Paper X-Review

[arXiv 2025] WorldMM:Dynamic MultiModal Memory Agent for Long Video Understanding

안녕하세요, 두 번 째 x-review로 WorldMM을 가지고 왔습니다. 저희 논문 작업에서 벤치마크를 만들면, 그걸 테스트할 여러 LVU methods 중 하나가 WorldMM인데, 처음에 아키텍처를 봤을 때…

Continue Reading
Posted in Paper X-Review

[arxiv 2025] Solving Spatial Supersensing Without Spatial Supersensing

안녕하세요! 어쩌다 보니 첫 x-review를 쓰게 된 이재윤입니다. 제 첫 x-review는 ResNet이나 Transformer가 될 줄 알았는데, 이번에 근택님 논문 작업에 참여하게 되어 Long video understanding…

Continue Reading
Posted in B.S. X-Diary

[이재윤] 2025년을 보내며

안녕하세요, 이번 회고록으로 첫 글을 쓰게 된 cv팀의 이재윤입니다. 저번 주부터 시험이 끝난 직후기도 했고, 연말 분위기도 스멀스멀 올라오다 보니 조금 나태해진 감이 있었는데 이번…

Continue Reading
Posted in X-Diary

[2025-하계][이재윤] URP를 마치며

안녕하세요, 2025년 하계 URP 프로그램에 참여했던 지능기전공학부 20학번 이재윤입니다. 두 달 전의 저처럼 URP 지원 또는 연구실 진학을 고민하시는 분들에게 조금이나마 도움이 되고자 후기를 작성하게…

Continue Reading