[카테고리:] Paper

Paper Review

Posted in Paper X-Review

[2024 CVPR] From Pixels to Graphs: Open-Vocabulary Scene Graph Generation with Vision-Language Models

안녕하세요 이번 리뷰에서는 Scene Graph Generation (SGG) 분야의 논문을 다뤄보고자 합니다. 이전의 SGG 연구들은 주로 closed set 상황에서 발생하는 문제, long-tailed data bias 및 라벨링…

Continue Reading
Posted in Paper X-Review

[NeurIPS 2024] Emotion and Intent Joint Understanding in Multimodal Conversation: A Benchmarking Dataset

pdf Code&Dataset 안녕하세요. 이번에는 새로운 Benchmarking Dataset을 제안하는 MC-EIU 논문을 가져와봤습니다. 최근에 EMER이라는 task를 알게 되면서 해당 task를 제안한 교수님의 사이트를 계속해서 팔로업하고 있는데 교수님께서…

Continue Reading
Posted in News Paper X-Review

[CVPR 2023]SeiT: Storage-Efficient Vision Training with Tokens Using 1% of Pixel Storage

안녕하세요 이번에 소개할 논문은 2023년 네이버 AI에서 발표한 논문으로 지난 KCCV 학회에 참관했을때 포스터 섹션에서 본 논문입니다. 이 논문에서는 이미지넷과 같이 저장 공간이 많이 필요한…

Continue Reading
Posted in Paper X-Review

[NeurIPS 2021] Learning Debiased Representation via Disentangled Feature Augmentation

안녕하세요. de-biasing 방법에 대한 세 번째 논문입니다. 소개했던 앞선 연구에서는 bias 특징을 갖지 않는 bias-conflicting 데이터에 대한 학습 가중치를 높여 de-biasing을 진행했습니다. 그러나 bias-conflicting 데이터는…

Continue Reading
Posted in Paper X-Review

[CVPR 2023] DPText-DETR: Towards Better Scene Text Detection with Dynamic Points in Transformer

안녕하세요, 마흔세 번째 X-Review입니다. 이번 논문은 2023년도 CVPR에 게재된 DPText-DETR: Towards Better Scene Text Detection with Dynamic Points in Transformer 논문입니다. 바로 시작하도록 하겠습니다. 🦩…

Continue Reading
Posted in Conference Paper X-Review

[ICLR 2024] FeatUp: A Model-Agnostic Framework for Features at Any Resolution

이번 논문은 제목 그대로 모델 무관하게 특징맵의 해상도를 변경 가능하도록 하게 해주는 기법입니다. Intro 최근 인공지능 분야에서는 foundation model의 등장으로 해당 모델을 고정하여 추출된 특징맵을…

Continue Reading
Posted in Paper X-Review

[arXiv 2024] QD-VMR: Query Debiasing with Contextual Understanding Enhancement for Video Moment Retrieval

안녕하세요 이번 주 X-Review는 arXiv에 업로드되어있는 QD-VMR이라는 방법론입니다. 비디오 분야의 Moment Retrieval task를 수행하며, 포맷상 25년도 AAAI에 제출된 것으로 보입니다. 해결하고자 하는 문제가 제가 지금…

Continue Reading
Posted in Paper X-Review

[ECCV 2024] Unlocking Textual and Visual Wisdom: Open-Vocabulary 3D Object Detection Enhanced by Comprehensive Guidance from Text and Image

안녕하세요, 마흔 네번째 x-review 입니다. 이번 논문은 2024년도 ECCV에 게재된 Unlocking Textual and Visual Wisdom: Open-Vocabulary 3D Object Detection Enhanced by Comprehensive Guidance from Text…

Continue Reading
Posted in Paper X-Review

[ICCV 2023] Open-Vocabulary Video Question Answering: A New Benchmark for Evaluating the Generalizability of Video Question Answering Models

안녕하세요, 마흔두 번째 X-Review입니다. 이번 논문은 2023년도 ICCV에 게재된 Open-Vocabulary Video Question Answering: A New Benchmark for Evaluating the Generalizability of Video Question Answering Model로…

Continue Reading
Posted in News Paper X-Review

[NIPS 2023] Understanding the latent space of diffusion models through the lens of riemannian geometry

안녕하세요, 정의철 연구원입니다. 이번에 소개할 논문은 지난번 KCCV 학회에 참관했을 때 포스터 세션에서 접하게 된 논문인데, 제목은 ‘Latent Space Geometry in Diffusion Models’입니다. 이 논문은…

Continue Reading