Recent Posts
2025년을 마치며
안녕하세요. 2025년도 한 해를 마무리하면서 올 한 해를 되돌아보고 2026년을 어떻게 맞이하면 좋을지에 대해 글을 작성하고자 합니다. 어떻게 글을 작성하면 좋을까 고민을 해봤는데 딱히 좋은…
[김기현] 2025년을 보내며
안녕하세요, 연구실 막내 김기현입니다😁여름 URP 하고 나서 얼마 지나지 않은 것 같은데 벌써 한 학기가 지나고 새해를 앞두고 있습니다…우선 제 생활 근황은 마지막 부분에서 말씀…
[정의철]2025년을 보내며
안녕하세요. 한 해를 마무리하며, 올해는 어땠는지 정리해보고 내년에는 어떤 마음가짐으로 연구실 생활을 이어갈지 간단히 적어보려고 합니다. 저는 올해도 연구실에서 많은 시간을 보냈고, 그만큼 얻은 것도…
[최인하] 2025년을 보내며
안녕하세요 최인하입니다. 어느덧 2025년이 끝나고 2026년 시작이 얼마 남지 않았네요. 한 해를 보내면서 이렇게 회고를 적는게 처음이라 설레기도 하면서 기억이 가물가물해서 잘 적을 수 있을까…
[arXiv 2025]Deep Video Discovery : Agentic Search with Tool Usefor Long-form Video Understanding
그래서 AI가 그렇게 좋다는데, 지금 기술로 Video Understanding은 어디까지 가능하지?와 같은 질문에 해답이 될 수 있는 논문을 소개합니다. 본 논문은 Agentic Search를 통한 Longvideo benchmark에서의…
[신인택] 2025년을 보내며
안녕하세요 신인택 연구원입니다. 연구실에 들어와서 URP 후기나 상반기 회고록을 작성하였지만, 1년을 마무리하는 글을 벌써 작성하게 될줄은 몰랐네요. 분명 첫 후기에는 석사 입학까지 1년이 남은 시점이라는…
[CoRL 2025] Robot Learning from Any Images
안녕하세요 이번주는 real to sim to real 접근을 통한 나름(?) 참신한 방법을 통해 로봇 데이터 scaling의 가능성을 제안한 연구를 리뷰해보려고 합니다. 많은 연구들이 sim to…
[TCSVT 2024] Question-Aware Global-Local Video Understanding Network for Audio-Visual Question Answering
안녕하세요. 오늘 X-Review에서 소개해드릴 논문은 24년도 TCSVT 저널에 게재된 <Question-Aware Global-Local Video Understanding Network for Audio-Visual Question Answering>입니다. 저널의 review 기간을 감안한다면 절대적 성능은 그리…
[CVPR 2025] Video Summarization with Large Language Models
안녕하세요 LLM을 사용하여 비디오 요약을 해결한 논문을 살펴보려고 합니다!리뷰 시작하겠습니다. <Intro> 기존 기술은 visual features(시각적 단서)와 temporal dynamics(시간적 특징)에 의존하는데 이 비전 정보 중심의 방법들은…
[ICCV 2025] Toward Better Out-painting: Improving the Image Composition with Initialization Policy Model
이번 리뷰 논문은 Foreground Conditioned Out-painting (FCO)라는 기법에 대한 논문 입니다. FCO는 fig 3과 같이 전경 (fig 3 – Cond.Image)과 text prompt가 주어졌을 때, 전경은…
안녕하세요 찬미님 좋은 리뷰 감사합니다. 읽다가 궁금한점이 몇가지 생겨서 질문드립니다 먼저 llama와 같은 llm에 대한 제 지식이 많지 않아서 드는…