Category: News
[2024 CVPR] The Neglected Tails in Vision-Language Models
안녕하세요 이번에 소개할 논문은 Vision-Language Models(VLMs)에서 발생하는 long-tailed 문제를 다룬 논문입니다. long-tailed 문제란 학습 데이터에 특정 클래스나 concept(클래스와 유사한 개념)이 적게 포함되어 모델 성능이 불균형해지는…
[2024 EACL] Does CLIP Bind Concepts? Probing Compositionality in Large Image Models
안녕하세요. 이번에 소개할 논문은 CLIP과 같은 대규모 VLM에서 compositional 표현 능력을 분석하고 그 한계를 평가하는 논문입니다. 연구의 주요 목표는 CLIP이 시각적으로 다양한 객체와 속성 개념을…
[김태주] 2024년을 마무리하며
격변과 적응의 시기올해는 저에게 격변과 적응의 시기였습니다.아실 분들은 아시겠지만, 올해 제 메인 연구 주제를 변경하였습니다. 이전까지는 무인화 플랫폼을 타겟으로 시각 강인성을 가진 인지 알고리즘 개발을…
[2023 CVPR] Prototype-based Embedding Network for Scene Graph Generation
안녕하세요 이번에 소개할 논문은 sgg task의 논문으로 unbiased 관계 예측을 해결하기 위해 제안된 모델입니다. SGG에서는 종종 특정 관계나 객체 쌍에 대한 데이터의 불균형이 발생하여, 모델이…
[ECCV 2022] Towards Open-Vocabulary Scene Graph Generation with Prompt-based Finetuning
안녕하세요 이번에 소개할 논문은 기존의 Scene Graph Generation이 사전 정의된 객체 클래스들 사이의 관계만을 예측하는 한계를 해결하기 위한 새로운 접근 방식을 제안한 연구입니다. 이 논문은…
[CVPR 2023]SeiT: Storage-Efficient Vision Training with Tokens Using 1% of Pixel Storage
안녕하세요 이번에 소개할 논문은 2023년 네이버 AI에서 발표한 논문으로 지난 KCCV 학회에 참관했을때 포스터 섹션에서 본 논문입니다. 이 논문에서는 이미지넷과 같이 저장 공간이 많이 필요한…
[NIPS 2023] Understanding the latent space of diffusion models through the lens of riemannian geometry
안녕하세요, 정의철 연구원입니다. 이번에 소개할 논문은 지난번 KCCV 학회에 참관했을 때 포스터 세션에서 접하게 된 논문인데, 제목은 ‘Latent Space Geometry in Diffusion Models’입니다. 이 논문은…
KCCV 2024 참관기
안녕하세요, 정의철 연구원입니다. 2024년 8월에 부산 BEXCO에서 열린 KCCV 2024에 다녀올 수 있는 기회를 얻게 되어, 이렇게 참관 후기를 작성하게 되었습니다. 이번 KCCV 2024에서는 여러…
[CVPR2022] Grounded Language-Image Pre-training(GLIP)
안녕하세요. 오늘 소개 시켜드릴 논문은 Grounded Language-Image Pre-training이란 논문으로 VLM분야의 foundation모델로 GLIP이란 모델과 학습법을 제안한 논문이 되겠습니다. 해당 논문을 읽게 된 이유는 센서과제에서 학습 때…
[CVPR 2024] D3T: Distinctive Dual-Domain Teacher Zigzagging Across RGB-Thermal Gap for Domain-Adaptive Object Detection
안녕하세요 정의철 연구원입니다. 이번에 제가 소개할 논문은 KCCV 2024 poster 논문들 중 하나로 RGB에서 열화상 도메인으로의 객체 감지에 대한 도메인 적응 문제에 대해 연구한 논문입니다….
안녕하세요 정민님 깔끔한 리뷰 감사합니다. 말씀하신 것처럼 약간 지도학습기반으로 다시 회귀하는 점이 장점이자 단점이라고 생각할 수 있을 것 같습니다. 제가…