01/06/2023 – Robotics and Computer Vision Lab

[CVPR-2021] Patch-NetVLAD: Multi-Scale Fusion of Locally-Global Descriptors for Place Recognition

뜬금없이 Visual place recognition(VPR)을 읽어봤습니다. 읽을 필요는 없다고 하는데… 제가 지금 하려는 일이 물체 검색을 좀 원활하게 해보기 위해 프레임 레벨에서 패치(가칭)단위로 백그라운드를 suppression 할…

[ECCV2022]MultiMAE: Multi-modal Multi-task Masked Autoencoders

이번에 소개드릴 논문은 요새 self-supervised learning에서 핫한 Masked Autoencoder입니다. 근데 이제 Multi-modal과 Multi-task를 곁들인. 혹시 Masked Autoencoder(MAE)에 대해서 아직 잘 모르시는 분들은 저희 연구실의 미래…

Paper X-Review

[ICML 2021] An Image is Worth 16×16 Words : Transformer for image recognition at scale

Before Review Vision Transformer(ViT) 논문입니다. 요즘 비디오 분야에서도 Transformer 기반의 백본이 활발하게 연구가 되는 추세입니다. 저도 관련해서 계속 follow-up을 하고 있는데 제가 ViT에 대한 detail을…

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

[일:] 2023년 01월 06일

[CVPR-2021] Patch-NetVLAD: Multi-Scale Fusion of Locally-Global Descriptors for Place Recognition

[ECCV2022]MultiMAE: Multi-modal Multi-task Masked Autoencoders

[ICML 2021] An Image is Worth 16×16 Words : Transformer for image recognition at scale

학술대회 마감

최신 글

최신 댓글

[CVPR-2021] Patch-NetVLAD: Multi-Scale Fusion of Locally-Global Descriptors for Place Recognition

[ECCV2022]MultiMAE: Multi-modal Multi-task Masked Autoencoders

[ICML 2021] An Image is Worth 16×16 Words : Transformer for image recognition at scale

학술대회 마감

태그

카테고리

최신 글

최신 댓글