[카테고리:] Paper
Paper Review
[arXiv 2023] Open World Object Detection in the Era of Foundation Models (FOMO)
안녕하세요. 이번 주 논문은 Open World Object Detection(OWOD) 분야의 논문 중 Foundation model을 활용한 FOMO입니다. 저는 이번 24년 상반기 랩실 기초교육 이후, 최종적으로 로보틱스 팀에…
[CVPR2024]Plug and Play Active Learning for Object Detection
추천 독자 Active Learning 연구에 관심이 있으며, 이를 Object Detection 연구로 확장하고 싶은 사람. Contribution Generalized Method제목에도 나타났듯이 Plug and Play 가능한 방법론으로, 다양한 object…
[CVPR 2022] Crafting Better Contrastive Views for Siamese Representation Learning
안녕하세요 정의철 연구원입니다. 이번에 제가 소개할 논문은 2022년 CVPR에 게재된 ‘Crafting Better Contrastive Views for Siamese Representation Learning’이란 논문입니다. 이번 논문은 contrastive learning에서 두 view를…
[arXiv 2024] Introducing HOT3D: An Egocentric Dataset for 3D Hand and Object Tracking
안녕하세요, 이번에는 새로운 BOP challenge 벤치마크 데이터셋이 나와 리뷰를 해보았습니다. 지금은 comming soon으로 표기가 되어있습니다. Meta에서 만든 데이터셋이고, 2024년부터 tracking 테스크에 대해서도 평가가 가능하도록 만들어진…
[AAAI 2024] FM-OV3D: Foundation Model-based Cross-modal Knowledge Blending for Open-Vocabulary 3D Detection
안녕하세요, 서른 여덟번째 x-review 입니다. 이번 논문은 2024년도 AAAI에 게재된 FM-OV3D: Foundation Model-based Cross-modal Knowledge Blending for Open-Vocabulary 3D Detection 입니다. 그럼 바로 리뷰 시작하겠습니다…
[arXiv 2023] Explainable Multimodal Emotion Recognition
안녕하세요! 이번에는 arXiv 논문을 가져와봤습니다. 2023년 논문이지만 6번의 수정있었고 최종적으로 2024년도ver6으로 읽었기 때문에 2024년도 논문이라 봐도 무방할 것 같습니다. 논문 페이지 하단에 under review라고 적혀있는거…
[ICML 2024] BECoTTA: Input-dependent Online Blending of Experts for Continual Test-time Adaptation
오늘도 마찬가지로 Online Continual TTA 분야의 논문으로 찾아왔습니다.ICML 2024에 게재된 논문이고, 코드 정리가 되게 잘 되어 있어서 코드도 돌려볼 겸 선정하게 되었습니다.(+ 저자가 한국인이네요.) 1….
[AAAI 2024] Towards Balanced Alignment: Modal-Enhanced Semantic Modeling for Video Moment Retrieval
안녕하세요. 이번 주 X-Review에서 소개해드릴 논문은 24년도 AAAI에 게재된 <Towards Balanced Alignment: Modal-Enhanced Semantic Modeling for Video Moment Retrieval> 입니다. 본 논문은 제가 요즘 관심갖고…
[CVPR 2020]Self-Supervised Learning of Pretext-Invariant Representations
안녕하세요 정의철 연구원입니다. 이번에 제가 소개할 논문은 ‘Self-Supervised Learning of Pretext-Invariant Representations’이란 논문입니다. 그럼 바로 리뷰 시작하겠습니다. 1. Introduction 현대 이미지 인식 시스템은 대규모 이미지…
[TCSVT 2024] Pro-Tuning: Unified Prompt Tuning for Vision Tasks
안녕하세요, 서른여덟 번째 X-Review입니다. 이번 논문은 2024년도 TCSVT에 게재된 Pro-Tuning: Unified Prompt Tuning for Vision입니다. 바로 시작하도록 하겠습니다. 🐌 1. Introduction large-scale dataset으로 사전학습한 모델을…
최신 댓글