Author: 김 정우
[IJCV 2025] Masked Channel Modeling for Bootstrapping Visual Pre-training
Introduction Foundation model(e.g. CLIP)의 등장 이후의 model은 엄청난 성능과 일반화 능력을 가지게 되었습니다. 하지만 개인 수준에서 foundation model처럼 대용량의 데이터셋으로 학습시키는건 불가능에 가깝습니다. 그렇기에 결국…
[NeurIPS 2025] ThermalGen: Style-Disentangled Flow-Based Generative Models for RGB-to-Thermal Image Translation
안녕하세요. 이번 논문은 RGB 데이터셋은 Thermal 이미지로 변환(생성)하는 방법론입니다.SiT와 adaLN-zero와 같은 개념에 대해 알아보고자 골랐습니다.시작하겠습니다. Introduction 먼저 두가지 측면에 대해서 얘기합니다. Q. RGB-T 데이터셋은 왜…
[AAAI 2024] SA2VP: Spatially Aligned-and-Adapted Visual Prompt
안녕하세요 4번째 X-review입니다. 이번에는 새로운 결의 논문을 가져왔는데요. Visual Prompt Tuning입니다. Visual Prompt Tuning(이하 VPT)에 대해 조금 더 자세히 설명을 해보자면 LLM에서 prompt를 이용해 전체적인…
[WACV 2023] MixVPR: Feature Mixing for Visual Place Recognition
안녕하세요 3번째 X-review네요. 아마 당분간은 쭉 VPR(visual place recognition)쪽 논문 리뷰를 들고오지 않을까 싶습니다. 오늘 소개드릴 논문은 MixVPR입니다. 간략하게 소개를 드리자면 무거운 transformer 연산 없이도,…
[CVPR2025] Self-Supervised Spatial Correspondence Across Modalities
안녕하세요, 2025 CVPR에 붙은 현재 인용 수 1인 따끈따끈한 논문을 소개해볼까합니다. 해당 논문이 풀고하는 문제는 GT가 없는 상황에서의 matching입니다.위 그림을 보시면 알겠지만, multi-spectral뿐만 아니라, photo-Sketch처럼…
[CVPR 2023] R2Former: Unified Retrieval and Reranking Transformer for Place Recognition
안녕하세요. 첫번째 X-review네요.바로 시작하겠습니다. 1. Introduction VPR에서는 주로 two stage로 retrival을 진행하는데, 먼저 global retrival과 reranking을 진행합니다. 지금까지의 논문들은 먼저 global retrival로 top N개의 이미지를…
2025년을 보내며
서문 안녕하세요. 올해를 돌아보면서 천천히 글로 써볼 생각입니다. 너무 빠르게 지나간 한해 같습니다. 올해 7월부터는 눈을 감았다 뜨면 한달 씩 지나가 있던 것 같습니다. 바쁘게…
2025 자율주행 인공지능 챌린지 후기
이번에 참여하게 된 2025 자율주행 인공지능 챌린지 후기를 적어보고자 합니다.저와 정민님이 한달 동안 한것을 시간순서로 쭉 적어보고자 합니다. 자율주행 챌린지 설명 자율주행 챌린지에는 3가지 카테고리가…
[2025-하계][김정우] URP를 마치며
안녕하세요. 2025 하계 URP에 참여한 김정우입니다. 저 역시 앞선 분들의 후기를 통해 많은 도움을 받았기에 이 글을 보시는 분들도 제 글을 통해 생각을 정리하실 수…
질문 감사합니다. 우선 action encoder로 사용한 RenderNet을 찾아보니, 일관성 있는 캐릭터와 고품질 이미지를 생성하고 제어할 수 있는 강력한 AI 이미지…