[카테고리:] X-Review

Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.

Posted in X-Review

[CVPR2024]Retrieval-Augmented Open-Vocabulary Object Detection

안녕하세요. 오늘 리뷰할 논문은 OVOD task를 다룬 Retrieval-Augmented Open-Vocabulary Object Detection입니다. CVPR 논문들을 뒤져보다가 마침 궁금했던 OVOD task를 고려대학교, 삼섬 리서치에서 작성한 논문이 있길래 OVOD…

Continue Reading
Posted in X-Review

[ICCV 2019] Rethinking ImageNet Pre-Training

안녕하세요. 허재연입니다. 요즘 KAIST PD dataset만을 가지고 어떻게 하면 detection의 가중치 초기화를 잘 할 수 있을지 고민하고 있습니다. 아무래도 KAIST 데이터셋의 크기가 ImageNet과 비교하면 상당히…

Continue Reading
Posted in Conference X-Review

[NeurIPS 2023] Visual Instruction Tuning

CVPR 세미나에서 발표했던 것처럼, 이번주부터는 Multi-modal(Text, Image) model에 대해 리뷰해보려고 합니다. 가장 첫번째로 Meta의 LLM 모델인 LLaMA를 사용한 Vision-Language 모델인 LLaVA에 대해 다뤄보겠습니다. Conference: NeurIPS…

Continue Reading
Posted in News Paper X-Review

[CVPR 2022] Crafting Better Contrastive Views for Siamese Representation Learning

안녕하세요 정의철 연구원입니다. 이번에 제가 소개할 논문은 2022년 CVPR에 게재된 ‘Crafting Better Contrastive Views for Siamese Representation Learning’이란 논문입니다. 이번 논문은 contrastive learning에서 두 view를…

Continue Reading
Posted in X-Review

[ICCV 2023] SurroundOcc: Multi-camera 3D Occupancy Prediction for Autonomous Driving

안녕하세요. 오늘 review할 논문은 ICCV 2023에 게재된 SurroundOcc: Multi-camera 3D Occupancy Prediction for Autonomous Driving입니다. 리뷰를 시작하기 전에 본 논문이 하고자 하는 것을 간단히 소개드리자면,…

Continue Reading
Posted in X-Review

[NeurIPS 2020]Object-Centric Learning with Slot Attention

제가 이번에 리뷰할 논문은 object-centric learning이라는 분야에서 중요한 논문으로 여겨지는 논문입니다. 먼저 object-centric learning이란, 실제 환경에서 영상에 해당하는 장면은 여러 객체들의 composition이라는 컨셉을 가져와서 물체들에…

Continue Reading
Posted in Paper X-Review

[arXiv 2024] Introducing HOT3D: An Egocentric Dataset for 3D Hand and Object Tracking

안녕하세요, 이번에는 새로운 BOP challenge 벤치마크 데이터셋이 나와 리뷰를 해보았습니다. 지금은 comming soon으로 표기가 되어있습니다. Meta에서 만든 데이터셋이고, 2024년부터 tracking 테스크에 대해서도 평가가 가능하도록 만들어진…

Continue Reading
Posted in Paper X-Review

[AAAI 2024] FM-OV3D: Foundation Model-based Cross-modal Knowledge Blending for Open-Vocabulary 3D Detection

안녕하세요, 서른 여덟번째 x-review 입니다. 이번 논문은 2024년도 AAAI에 게재된 FM-OV3D: Foundation Model-based Cross-modal Knowledge Blending for Open-Vocabulary 3D Detection 입니다. 그럼 바로 리뷰 시작하겠습니다…

Continue Reading
Posted in Paper X-Review

[arXiv 2023] Explainable Multimodal Emotion Recognition

안녕하세요! 이번에는 arXiv 논문을 가져와봤습니다. 2023년 논문이지만 6번의 수정있었고 최종적으로 2024년도ver6으로 읽었기 때문에 2024년도 논문이라 봐도 무방할 것 같습니다. 논문 페이지 하단에 under review라고 적혀있는거…

Continue Reading
Posted in Paper X-Review

[ICML 2024] BECoTTA: Input-dependent Online Blending of Experts for Continual Test-time Adaptation

오늘도 마찬가지로 Online Continual TTA 분야의 논문으로 찾아왔습니다.ICML 2024에 게재된 논문이고, 코드 정리가 되게 잘 되어 있어서 코드도 돌려볼 겸 선정하게 되었습니다.(+ 저자가 한국인이네요.) 1….

Continue Reading