[카테고리:] X-Review

Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.

Posted in Paper X-Review

[arXiv 2023] Open World Object Detection in the Era of Foundation Models (FOMO)

안녕하세요. 이번 주 논문은 Open World Object Detection(OWOD) 분야의 논문 중 Foundation model을 활용한 FOMO입니다. 저는 이번 24년 상반기 랩실 기초교육 이후, 최종적으로 로보틱스 팀에…

Continue Reading
Posted in Paper X-Review

[CVPR2024]Plug and Play Active Learning for Object Detection

추천 독자 Active Learning 연구에 관심이 있으며, 이를 Object Detection 연구로 확장하고 싶은 사람. Contribution Generalized Method제목에도 나타났듯이 Plug and Play 가능한 방법론으로, 다양한 object…

Continue Reading
Posted in X-Review

[CVPR2024]Retrieval-Augmented Open-Vocabulary Object Detection

안녕하세요. 오늘 리뷰할 논문은 OVOD task를 다룬 Retrieval-Augmented Open-Vocabulary Object Detection입니다. CVPR 논문들을 뒤져보다가 마침 궁금했던 OVOD task를 고려대학교, 삼섬 리서치에서 작성한 논문이 있길래 OVOD…

Continue Reading
Posted in X-Review

[ICCV 2019] Rethinking ImageNet Pre-Training

안녕하세요. 허재연입니다. 요즘 KAIST PD dataset만을 가지고 어떻게 하면 detection의 가중치 초기화를 잘 할 수 있을지 고민하고 있습니다. 아무래도 KAIST 데이터셋의 크기가 ImageNet과 비교하면 상당히…

Continue Reading
Posted in Conference X-Review

[NeurIPS 2023] Visual Instruction Tuning

CVPR 세미나에서 발표했던 것처럼, 이번주부터는 Multi-modal(Text, Image) model에 대해 리뷰해보려고 합니다. 가장 첫번째로 Meta의 LLM 모델인 LLaMA를 사용한 Vision-Language 모델인 LLaVA에 대해 다뤄보겠습니다. Conference: NeurIPS…

Continue Reading
Posted in News Paper X-Review

[CVPR 2022] Crafting Better Contrastive Views for Siamese Representation Learning

안녕하세요 정의철 연구원입니다. 이번에 제가 소개할 논문은 2022년 CVPR에 게재된 ‘Crafting Better Contrastive Views for Siamese Representation Learning’이란 논문입니다. 이번 논문은 contrastive learning에서 두 view를…

Continue Reading
Posted in X-Review

[ICCV 2023] SurroundOcc: Multi-camera 3D Occupancy Prediction for Autonomous Driving

안녕하세요. 오늘 review할 논문은 ICCV 2023에 게재된 SurroundOcc: Multi-camera 3D Occupancy Prediction for Autonomous Driving입니다. 리뷰를 시작하기 전에 본 논문이 하고자 하는 것을 간단히 소개드리자면,…

Continue Reading
Posted in X-Review

[NeurIPS 2020]Object-Centric Learning with Slot Attention

제가 이번에 리뷰할 논문은 object-centric learning이라는 분야에서 중요한 논문으로 여겨지는 논문입니다. 먼저 object-centric learning이란, 실제 환경에서 영상에 해당하는 장면은 여러 객체들의 composition이라는 컨셉을 가져와서 물체들에…

Continue Reading
Posted in Paper X-Review

[arXiv 2024] Introducing HOT3D: An Egocentric Dataset for 3D Hand and Object Tracking

안녕하세요, 이번에는 새로운 BOP challenge 벤치마크 데이터셋이 나와 리뷰를 해보았습니다. 지금은 comming soon으로 표기가 되어있습니다. Meta에서 만든 데이터셋이고, 2024년부터 tracking 테스크에 대해서도 평가가 가능하도록 만들어진…

Continue Reading
Posted in Paper X-Review

[AAAI 2024] FM-OV3D: Foundation Model-based Cross-modal Knowledge Blending for Open-Vocabulary 3D Detection

안녕하세요, 서른 여덟번째 x-review 입니다. 이번 논문은 2024년도 AAAI에 게재된 FM-OV3D: Foundation Model-based Cross-modal Knowledge Blending for Open-Vocabulary 3D Detection 입니다. 그럼 바로 리뷰 시작하겠습니다…

Continue Reading