Author: 정 의철

Posted in Paper X-Review

[EMNLP 2023] ROME: Evaluating Pre-trained Vision-Language Models on Reasoning beyond Visual Common Sense

안녕하세요 이번에 소개할 논문은 사전 학습된 비전-언어 모델(VLMs)이 단순한 시각적 상식을 넘어선 복잡한 추론 능력을 평가하기 위해 새로운 데이터셋인 ROME과 평가 프레임워크를 제안한 논문입니다. 연구의…

Continue Reading
Posted in Paper X-Review

[2023 CVPR] Cap4Video: What Can Auxiliary Captions Do for Text-Video Retrieval?

안녕하세요. 이번에 리뷰할 논문은 기존의 텍스트-비디오 검색 방식에서 한 단계 발전하여, 비디오에 포함된 관련 텍스트 정보(예: 제목, 태그, 자막)를 활용하여 텍스트 쿼리를 더 효과적으로 매칭하는…

Continue Reading
Posted in News Paper X-Review

[2023 CVPR] Prototype-based Embedding Network for Scene Graph Generation

안녕하세요 이번에 소개할 논문은 sgg task의 논문으로 unbiased 관계 예측을 해결하기 위해 제안된 모델입니다. SGG에서는 종종 특정 관계나 객체 쌍에 대한 데이터의 불균형이 발생하여, 모델이…

Continue Reading
Posted in Paper X-Review

[2021 CVPR] Probabilistic Modeling of Semantic Ambiguity for Scene Graph Generation

안녕하세요 이번에 소개할 논문은 SGG 논문으로 Long-tail 문제를 완화하기 위해 제안된 논문입니다. 구체적으로 기존의 SGG 모델은 의미적 모호성을 충분히 처리하지 못하고, 단일한 결정론적 관계만을 예측하려고…

Continue Reading
Posted in News Paper X-Review

[ECCV 2022] Towards Open-Vocabulary Scene Graph Generation with Prompt-based Finetuning

안녕하세요 이번에 소개할 논문은 기존의 Scene Graph Generation이 사전 정의된 객체 클래스들 사이의 관계만을 예측하는 한계를 해결하기 위한 새로운 접근 방식을 제안한 연구입니다. 이 논문은…

Continue Reading
Posted in Paper X-Review

[2024 CVPR] From Pixels to Graphs: Open-Vocabulary Scene Graph Generation with Vision-Language Models

안녕하세요 이번 리뷰에서는 Scene Graph Generation (SGG) 분야의 논문을 다뤄보고자 합니다. 이전의 SGG 연구들은 주로 closed set 상황에서 발생하는 문제, long-tailed data bias 및 라벨링…

Continue Reading
Posted in News Paper X-Review

[CVPR 2023]SeiT: Storage-Efficient Vision Training with Tokens Using 1% of Pixel Storage

안녕하세요 이번에 소개할 논문은 2023년 네이버 AI에서 발표한 논문으로 지난 KCCV 학회에 참관했을때 포스터 섹션에서 본 논문입니다. 이 논문에서는 이미지넷과 같이 저장 공간이 많이 필요한…

Continue Reading
Posted in News Paper X-Review

[NIPS 2023] Understanding the latent space of diffusion models through the lens of riemannian geometry

안녕하세요, 정의철 연구원입니다. 이번에 소개할 논문은 지난번 KCCV 학회에 참관했을 때 포스터 세션에서 접하게 된 논문인데, 제목은 ‘Latent Space Geometry in Diffusion Models’입니다. 이 논문은…

Continue Reading
Posted in News X-Diary

KCCV 2024 참관기

안녕하세요, 정의철 연구원입니다. 2024년 8월에 부산 BEXCO에서 열린 KCCV 2024에 다녀올 수 있는 기회를 얻게 되어, 이렇게 참관 후기를 작성하게 되었습니다. 이번 KCCV 2024에서는 여러…

Continue Reading
Posted in News Paper

[CVPR 2024] D3T: Distinctive Dual-Domain Teacher Zigzagging Across RGB-Thermal Gap for Domain-Adaptive Object Detection

안녕하세요 정의철 연구원입니다. 이번에 제가 소개할 논문은 KCCV 2024 poster 논문들 중 하나로 RGB에서 열화상 도메인으로의 객체 감지에 대한 도메인 적응 문제에 대해 연구한 논문입니다….

Continue Reading