정 의철 – Robotics and Computer Vision Lab

이 예은 on [arXiv 2025] WorldMM:Dynamic MultiModal Memory Agent for Long Video Understanding01/28/2026
안녕하세요 재윤님, 좋은 리뷰 감사합니다. 텍스트와 시각 정보를 선택적으로 집중하고, 적절한 시간의 지식만을 효과적으로 사용하기 위한 방법론이라고 이해했습니다. episodic /…
이 재윤 on [CVPR 2023] Open-vocabulary Attribute Detection01/28/2026
안녕하세요 예은님, 첫 엑스리뷰 고생하셨습니다! 원래 알고 있던 OVOD에 attribute라는 개념 하나 추가된 거라 생각하고 읽으니 꽤 흥미롭게 읽었던 것…
이 재윤 on [arXiv 2025]Deep Video Discovery : Agentic Search with Tool Usefor Long-form Video Understanding01/28/2026
안녕하세요 유진님! 최근 LVU task를 팔로우업하다가 dvd라는 방법론이 있다는 걸 듣고 궁금해했었는데 x-review로 다뤄주셔서 재밌게 읽어보았습니다. 간단한 질문 두 가지만…
김 영규 on [NeurIPS 2025] Generalizable Domain Adaptation for Sim-and-Real Policy Co-Training01/27/2026
안녕하세요 인하님 댓글 감사합니다. 저도 항상 sim데이터를 풍부하게 만드는 것은 여기저기서 다루지만, 어떻게 사용하는게 효과적인지와 더불어 sim2real gap은 구체적으로 얼마나…
김 영규 on [NeurIPS 2025] Generalizable Domain Adaptation for Sim-and-Real Policy Co-Training01/27/2026
안녕하세요 기현님 댓글 감사합니다. Figure 2와 3 모두 sim과 real의 object 색상과 texture는 다릅니다. Figure 2에서 두 환경에서의 observation 차이…

Author: 정 의철

[2025 NIPS] KVzip: Query-Agnostic KV Cache Compression with Context Reconstruction

[2025 ICLR] Retrieval Head Mechanistically ExplainsLong Context Factuality

[2024 ECCV] VideoAgent: Long-form Video Understanding with Large Language Model as Agent

[정의철]2025년을 보내며

[ICCV 2025] How Can Objects Help Video-Language Understanding?

[CVPR 2024] Koala: Key frame-conditioned long video-LLM

[arXiv 2025] VideoRAG: Retrieval-Augmented Generation over Video Corpus

[arXiv 2024] SLOWFAST-LLAVA: A STRONG TRAINING-FREEBASELINE FOR VIDEO LARGE LANGUAGE MODELS

[arXiv 2022] Disentangled Representation Learning for Text-Video Retrieval

[2025 ICLR] BRIDGING INFORMATION ASYMMETRY IN TEXT-VIDEO RETRIEVAL: A DATA CENTRIC APPROACH

Conference Deadline

NEW POST

New Comment