Author: 홍 주영

Posted in Conference X-Review

[ICML 2021] (CLIP) Learning Transferable Visual Models From Natural Language Supervision

Vision Language Model(VLM)의 근본인 CLIP 논문에 대해 리뷰해보겠습니다. 아이디어와 코드는 아주아주 간단한데, 현재시간 기준 19,543회의 인용률을 달성할 정도로 어마어마한 파급력을 가져온 논문이라는 것은 누구나 다…

Continue Reading
Posted in Conference X-Review

[NerulPS 2022] Flamingo: a Visual Language Model for Few-Shot Learning

당분간 LMM 및 여러 VLM를 리뷰해보려고 하는데요, 이번에 리뷰할 논문은 구글 딥마인드에서 발표한 Visual Language Model(VLM)인 Flamingo 라는 논문입니다. 제목에서와 같이 Few-shot으로도 다양한 task를 수행할…

Continue Reading
Posted in Conference X-Review

[NeurIPS 2023] Visual Instruction Tuning

CVPR 세미나에서 발표했던 것처럼, 이번주부터는 Multi-modal(Text, Image) model에 대해 리뷰해보려고 합니다. 가장 첫번째로 Meta의 LLM 모델인 LLaMA를 사용한 Vision-Language 모델인 LLaVA에 대해 다뤄보겠습니다. Conference: NeurIPS…

Continue Reading
Posted in Ph.D. X-Diary

2024년 상반기 회고@홍주영

벌써 저의 박사과정 1학기가 순식간에 끝이 났습니다. 상반기를 돌아보면, 제안서 작성과 CVPR 학회 참여라는 두 가지 큰 경험이 있던 것 같습니다. 이 두 가지 경험을…

Continue Reading
Posted in X-Review

[CVPR 2024] Active Prompt Learning in Vision Language Models

Active Learning 과 Vision Language Model을 결합한 연구가 있어 리뷰해보도록 하겠습니다. 결국 Active Learning에도 CLIP을 결합한 연구가 등장하였네요. 사실 올 초 신진연구 제안서 작업을 할…

Continue Reading
Posted in Conference X-Review

[CVPR 2022] Active Learning by Feature Mixing

황유진 연구원과 제출한 논문에서 받은 리뷰 중, 해당 논문에 대해서도 성능 비교 실험에 추가해달라는 코멘트가 있었습니다. 이에 제가 작성한 리뷰를 살펴보니, 해당 논문을 자세하게 리뷰한…

Continue Reading
Posted in X-Review

[ICML 2023] SAAL: Sharpness-Aware Active Learning

제가 이번에 리뷰하려는 논문은, 새로운 optimizer 기법으로 성능 향상을 도모한 AL 연구입니다. 2021년도 짧게나마 ImageNet 에서 SOTA의 자리에 올랐던, SAM (Sharpness-Aware Minimization) 이라는 방법론이 존재한데요,…

Continue Reading
Posted in X-Review

[NIPS 2017] Neural Discrete Representation Learning

오늘은 평소 리뷰했던 논문과는 다소 다른 분야의 논문을 리뷰하려고 합니다. 최근 GPT를 사용하며 그림을 그려달라는 요청을 할 때, 잘 워킹하는 것을 보고 이게 어떤 원리지?…

Continue Reading
Posted in X-Review

[CVPR 2021] Multiple Instance Active Learning for Object Detection

지난번 리뷰에서 Active Learning + Object Detection 에 대해 알아보겠다고 했는데요, 이번에는 두번째 시간입니다. 지난 리뷰는 Object Detection에 Active Learning 을 적용한 것 자체에 큰…

Continue Reading
Posted in X-Review

[CVPR 2024] ImageNet-D: Benchmarking Neural Network Robustness on Diffusion Synthetic Object

오늘은 CVPR 2024에 게재된 데이터셋 논문 리뷰를 해보려고 합니다. 데이터셋 이름은 ImageNet-D로, 여기서 D는 Diffusion를 의미합니다. 본 논문을 한 줄로 요약하면, “보다 다양하고 사실적인 합성…

Continue Reading