[카테고리:] Paper

Paper Review

Posted in Paper X-Review

[MM 2024] Let Me Finish My Sentence: Video Temporal Grounding with Holistic Text Understanding

안녕하세요, 오늘의 X-Review에서는 24년도 ACM MM 학회에 게재된 논문 <Let Me Finish My Sentence: Video Temporal Grounding with Holistic Text Understanding>을 소개해드리고자 합니다. 카이스트의 정준선…

Continue Reading
Posted in Paper X-Review

[ICLR 2024] CLIPSelf: Vision Transformer Distills Itself for Open-Vocabulary Dense Prediction

안녕하세요. 이번 주 X-Review에서는, 24년도 ICLR에 Spotlight으로 게재된 <CLIPSelf: Vision Transformer Distills Itself for Open-Vocabulary Dense Prediction>이라는 논문을 소개해드리겠습니다. ICLR Spotlight으로 지정된 논문인데, 통찰력 있는…

Continue Reading
Posted in News Paper X-Review

[ECCV 2022] Towards Open-Vocabulary Scene Graph Generation with Prompt-based Finetuning

안녕하세요 이번에 소개할 논문은 기존의 Scene Graph Generation이 사전 정의된 객체 클래스들 사이의 관계만을 예측하는 한계를 해결하기 위한 새로운 접근 방식을 제안한 연구입니다. 이 논문은…

Continue Reading
Posted in Paper X-Review

[CVPR 2021] UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

안녕하세요, 허재연입니다. 오늘 리뷰할 논문은 CVPR 2021 및 TPAMI 2022에 게재된 UP-DETR이라는 논문으로, DETR에 대한 unsupervised learning을 다룬 논문입니다. 리뷰 시작하겠습니다. Introduction Self-Supervised Learning, Unsupervised…

Continue Reading
Posted in Paper X-Review

[CVPR 2022] DETReg: Unsupervised Pretraining with Region Priors for Object Detection

안녕하세요, 허재연입니다. 오늘 리뷰할 논문은 DETReg라는 Self-Supervised Learning 방법론을 제안한 논문입니다. SSL 중에서도 특히 Object Detection을 염두한 논문으로, Detector로 DETR을 사용합니다. 리뷰 시작하도록 하겠습니다. Introduction…

Continue Reading
Posted in Paper X-Review

[2024 CVPR] From Pixels to Graphs: Open-Vocabulary Scene Graph Generation with Vision-Language Models

안녕하세요 이번 리뷰에서는 Scene Graph Generation (SGG) 분야의 논문을 다뤄보고자 합니다. 이전의 SGG 연구들은 주로 closed set 상황에서 발생하는 문제, long-tailed data bias 및 라벨링…

Continue Reading
Posted in Paper X-Review

[NeurIPS 2024] Emotion and Intent Joint Understanding in Multimodal Conversation: A Benchmarking Dataset

pdf Code&Dataset 안녕하세요. 이번에는 새로운 Benchmarking Dataset을 제안하는 MC-EIU 논문을 가져와봤습니다. 최근에 EMER이라는 task를 알게 되면서 해당 task를 제안한 교수님의 사이트를 계속해서 팔로업하고 있는데 교수님께서…

Continue Reading
Posted in News Paper X-Review

[CVPR 2023]SeiT: Storage-Efficient Vision Training with Tokens Using 1% of Pixel Storage

안녕하세요 이번에 소개할 논문은 2023년 네이버 AI에서 발표한 논문으로 지난 KCCV 학회에 참관했을때 포스터 섹션에서 본 논문입니다. 이 논문에서는 이미지넷과 같이 저장 공간이 많이 필요한…

Continue Reading
Posted in Paper X-Review

[NeurIPS 2021] Learning Debiased Representation via Disentangled Feature Augmentation

안녕하세요. de-biasing 방법에 대한 세 번째 논문입니다. 소개했던 앞선 연구에서는 bias 특징을 갖지 않는 bias-conflicting 데이터에 대한 학습 가중치를 높여 de-biasing을 진행했습니다. 그러나 bias-conflicting 데이터는…

Continue Reading
Posted in Paper X-Review

[CVPR 2023] DPText-DETR: Towards Better Scene Text Detection with Dynamic Points in Transformer

안녕하세요, 마흔세 번째 X-Review입니다. 이번 논문은 2023년도 CVPR에 게재된 DPText-DETR: Towards Better Scene Text Detection with Dynamic Points in Transformer 논문입니다. 바로 시작하도록 하겠습니다. 🦩…

Continue Reading