Posted in Paper X-Review

[CVPR2024]Plug and Play Active Learning for Object Detection

추천 독자 Active Learning 연구에 관심이 있으며, 이를 Object Detection 연구로 확장하고 싶은 사람. Contribution Generalized Method제목에도 나타났듯이 Plug and Play 가능한 방법론으로, 다양한 object…

Continue Reading
Posted in X-Review

[CVPR2024]Retrieval-Augmented Open-Vocabulary Object Detection

안녕하세요. 오늘 리뷰할 논문은 OVOD task를 다룬 Retrieval-Augmented Open-Vocabulary Object Detection입니다. CVPR 논문들을 뒤져보다가 마침 궁금했던 OVOD task를 고려대학교, 삼섬 리서치에서 작성한 논문이 있길래 OVOD…

Continue Reading
Posted in X-Review

[ICCV 2019] Rethinking ImageNet Pre-Training

안녕하세요. 허재연입니다. 요즘 KAIST PD dataset만을 가지고 어떻게 하면 detection의 가중치 초기화를 잘 할 수 있을지 고민하고 있습니다. 아무래도 KAIST 데이터셋의 크기가 ImageNet과 비교하면 상당히…

Continue Reading
Posted in Conference X-Review

[NeurIPS 2023] Visual Instruction Tuning

CVPR 세미나에서 발표했던 것처럼, 이번주부터는 Multi-modal(Text, Image) model에 대해 리뷰해보려고 합니다. 가장 첫번째로 Meta의 LLM 모델인 LLaMA를 사용한 Vision-Language 모델인 LLaVA에 대해 다뤄보겠습니다. Conference: NeurIPS…

Continue Reading
Posted in News Paper X-Review

[CVPR 2022] Crafting Better Contrastive Views for Siamese Representation Learning

안녕하세요 정의철 연구원입니다. 이번에 제가 소개할 논문은 2022년 CVPR에 게재된 ‘Crafting Better Contrastive Views for Siamese Representation Learning’이란 논문입니다. 이번 논문은 contrastive learning에서 두 view를…

Continue Reading
Posted in News

[arXiv 2024] YOLOv10: Real-Time End-to-End Object Detection

안녕하세요. 이번 5월달에 Yolo의 10번째 버전이 발표되었다는 소식을 듣고, 이를 기념삼아 Yolov10의 리뷰를 작성하게 되었습니다. 제가 연구실에 처음 들어왔을 때 즈음, Yolov8이 나왔었는데 발전이 굉장히…

Continue Reading
Posted in X-Review

[ICCV 2023] SurroundOcc: Multi-camera 3D Occupancy Prediction for Autonomous Driving

안녕하세요. 오늘 review할 논문은 ICCV 2023에 게재된 SurroundOcc: Multi-camera 3D Occupancy Prediction for Autonomous Driving입니다. 리뷰를 시작하기 전에 본 논문이 하고자 하는 것을 간단히 소개드리자면,…

Continue Reading
Posted in X-Review

[NeurIPS 2020]Object-Centric Learning with Slot Attention

제가 이번에 리뷰할 논문은 object-centric learning이라는 분야에서 중요한 논문으로 여겨지는 논문입니다. 먼저 object-centric learning이란, 실제 환경에서 영상에 해당하는 장면은 여러 객체들의 composition이라는 컨셉을 가져와서 물체들에…

Continue Reading
Posted in News

[CVPR 2024] Bridging the Gap Between End-to-End and Two-Step Text Spotting

안녕하세요, 서른아홉 번째 X-Review입니다. 이번 논문은 2024년도 CVPR에 게재된 Bridging the Gap Between End-to-End and Two-Step Text Spotting입니다. 바로 시작하도록 하겠습니다. Text spotting이란 영상 내에…

Continue Reading
Posted in Paper X-Review

[arXiv 2024] Introducing HOT3D: An Egocentric Dataset for 3D Hand and Object Tracking

안녕하세요, 이번에는 새로운 BOP challenge 벤치마크 데이터셋이 나와 리뷰를 해보았습니다. 지금은 comming soon으로 표기가 되어있습니다. Meta에서 만든 데이터셋이고, 2024년부터 tracking 테스크에 대해서도 평가가 가능하도록 만들어진…

Continue Reading