[카테고리:] Paper

Paper Review

Posted in Paper X-Review

[CVPR 2023] OpenScene: 3D Scene Understanding with Open Vocabularies

안녕하세요, 마흔 두번째 x-review 입니다. 이번 논문은 2023년도 CVPR에 게재된 OpenScene: 3D Scene Understanding with Open Vocabularies 입니다. 그럼 바로 리뷰 시작하겠습니다 ! 1. Introduction…

Continue Reading
Posted in Paper X-Review

[NeurIPS 2020] Learning from Failure: Training Debiased Classifier from Biased Classifier

안녕하세요. 오늘 논문에서는 딥러닝 모델을 학습할때 발생할 수 있는 편향문제에 대해 다룬 논문을 소개하려 합니다. 소개할 논문에서 다루는 편향 문제란, 수집한 학습 데이터의 분포에 의도하지…

Continue Reading
Posted in Conference Paper X-Review

[ICCV 2023] RankMixup: Ranking-Based Mixup Training for Network Calibration

안녕하세요, 허재연입니다. 얼마 후 KCCV에 참석할 예정인데, oral 및 poster 논문들을 몇개 미리 파악하고 참석하고자 합니다. 오늘 다룰 논문은 이런 취지로 미리 논문들을 살펴보다 읽어본…

Continue Reading
Posted in Paper X-Review

[CVPR2021] Open-Vocabulary Object Detection Using Captions

안녕하세요. 오늘 소개드릴 논문은 CVPR2021년도에 게재된 Open-Vocabulary Object Detection Using Captions라는 논문입니다. 본 논문은 open vocabulary object detection(OVD)라는 방법론을 처음 제안한 시초논문에 해당합니다. 본 논문을…

Continue Reading
Posted in Paper X-Review

[arXiv 2023] Code as Policies: Language Model Programs for Embodied Control

이번 논문은 로봇 작업을 위한 정책 코드를 생성하는 방법론으로 최근 로보틱스 분야가 LLM과 함께 왜 각광 받는지를 보여주는 연구 내용으로 이해하시면 좋을 것 같습니다. Intro…

Continue Reading
Posted in News Paper X-Review

[2022 CVPR] UniVIP: A Unified Framework for Self-Supervised Visual Pre-training

안녕하세요 정의철 연구원입니다. 이번에 소개할 논문은 기존의 SSL 방법들이 ImageNet과 같은 단일 중심 객체 이미지에서 성공을 거두었지만 scene과 instance 간의 상관 관계 및 scene 내의…

Continue Reading
Posted in Paper X-Review

[arXiv 2024] AffectGPT: Dataset and Framework for Explainable Multimodal Emotion Recognition

pdf Code&Dataset 안녕하세요! 따근따근한🔥🔥 7월 10일에 arXiv에 등록된 EMER 저자의 후속 논문을 가지고 와봤습니다. EMER 논문이 새로운 감정 인식의 포문을 연 논문이라 생각이 들지만 조금…

Continue Reading
Posted in Paper X-Review

[NeurIPS 2023] CoDA: Collaborative Novel Box Discovery and Cross-modal Alignment for Open-vocabulary 3D Object Detection

안녕하세요, 마흔 한번째 x-review 입니다. 이번 논문은 2023년도 NeurIPS에 게재된 CoDA: Collaborative Novel Box Discovery and Cross-modal Alignment for Open-vocabulary 3D Object Detection입니다. 그럼 바로…

Continue Reading
Posted in Paper X-Review

[arXiv 2024] MLLM as Video Narrator: Mitigating Modality Imbalance in Video Moment Retrieval

안녕하세요, 이번 주도 Video Moment Retrieval task와 관련하여 리뷰를 작성해보겠습니다. 오늘 소개해드릴 논문은 올해 6월 arXiv에 게재된 <MLLM as Video Narrator: Mitigating Modality Imbalance in…

Continue Reading
Posted in Paper X-Review

[CVPR 2023] Self-supervised Implicit Glyph Attention for Text Recognition

안녕하세요, 마흔한 번째 X-Review입니다. 이번 논문은 2023년도 CVPR에 게재된 Self-supervised Implicit Glyph Attention for Text Recognition입니다. 바로 시작하도록 하겠습니다. 🧙🏽‍♂️ 1. Introduction Scene text recognition…

Continue Reading