[카테고리:] X-Review

Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.

Posted in X-Review

[ECCV 2022] FCAF3D: Fully Convolutional Anchor-Free 3D Object Detection

안녕하세요. 이번 리뷰는 저희 로보틱스 팀 기초교육의 일환으로 공부 중인 3D detection task 관련 논문입니다. 사실 TR3D 논문을 읽고 그에 대한 코드 원복과 성능 개선을…

Continue Reading
Posted in Paper X-Review

[2024 CVPR] From Pixels to Graphs: Open-Vocabulary Scene Graph Generation with Vision-Language Models

안녕하세요 이번 리뷰에서는 Scene Graph Generation (SGG) 분야의 논문을 다뤄보고자 합니다. 이전의 SGG 연구들은 주로 closed set 상황에서 발생하는 문제, long-tailed data bias 및 라벨링…

Continue Reading
Posted in Conference X-Review

[ICCP 2024] ThermalNeRF: Thermal Radiance Fields

이번 리뷰 논문은 열화상과 컬러 영상에서의 Novel View Synthesis를 제안한 논문입니다. 해당 연구 결과는 열화상과 컬러 영상 간의 도메인 갭을 메꾸기 위한 기반이 될 연구라고…

Continue Reading
Posted in Paper X-Review

[NeurIPS 2024] Emotion and Intent Joint Understanding in Multimodal Conversation: A Benchmarking Dataset

pdf Code&Dataset 안녕하세요. 이번에는 새로운 Benchmarking Dataset을 제안하는 MC-EIU 논문을 가져와봤습니다. 최근에 EMER이라는 task를 알게 되면서 해당 task를 제안한 교수님의 사이트를 계속해서 팔로업하고 있는데 교수님께서…

Continue Reading
Posted in News Paper X-Review

[CVPR 2023]SeiT: Storage-Efficient Vision Training with Tokens Using 1% of Pixel Storage

안녕하세요 이번에 소개할 논문은 2023년 네이버 AI에서 발표한 논문으로 지난 KCCV 학회에 참관했을때 포스터 섹션에서 본 논문입니다. 이 논문에서는 이미지넷과 같이 저장 공간이 많이 필요한…

Continue Reading
Posted in Paper X-Review

[NeurIPS 2021] Learning Debiased Representation via Disentangled Feature Augmentation

안녕하세요. de-biasing 방법에 대한 세 번째 논문입니다. 소개했던 앞선 연구에서는 bias 특징을 갖지 않는 bias-conflicting 데이터에 대한 학습 가중치를 높여 de-biasing을 진행했습니다. 그러나 bias-conflicting 데이터는…

Continue Reading
Posted in X-Review

[ICLR2024] Multi-granularity Correspondence Learning from Long-term Noisy Videos – Part 1

안녕하세요. 박성준 연구원입니다. 오늘 리뷰할 논문은 ICLR2024에 게재된 논문으로 video-paragraph retrieval, cilp-caption retrieval, text-to-video retrieval 등 text와 video의 align을 맞추는 tasks들을 전반적으로 다룬 논문으로 텍스트와…

Continue Reading
Posted in X-Review

[IROS 2024]OVGNet: An Unified Visual-Linguistic Framework for Open-Vocabulary Robotic Grasping

제가 이번에 리뷰할 논문은 시각-언어 정보를 기반으로 대상 객체를 인식하며, 이때 미학습 객체도 인식하고 동일 객체가 존재할 경우 이를 구분하여 인식하는 방법론이라는 것에 흥미가 생겨…

Continue Reading
Posted in Paper X-Review

[CVPR 2023] DPText-DETR: Towards Better Scene Text Detection with Dynamic Points in Transformer

안녕하세요, 마흔세 번째 X-Review입니다. 이번 논문은 2023년도 CVPR에 게재된 DPText-DETR: Towards Better Scene Text Detection with Dynamic Points in Transformer 논문입니다. 바로 시작하도록 하겠습니다. 🦩…

Continue Reading
Posted in X-Review

[ECCV 2024] Grounding DINO: Marrying DINO with Grounded Pre-Training for Open-Set Object Detection

저는 다시 Vision Language Model (VLM) 에 대한 리뷰를 진행해보도록 하겠습니다. VLM의 근본, 조상 격인 CLIP에 대한 리뷰는 아래 링크에서 확인하실 수 있으니, 아직 CLIP에…

Continue Reading