[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[TCSVT 2021] Infrared and Visible Cross-Modal Image Retrieval Through Shared Features
이번에 들고온 논문은 열화상 영상과 컬러 영상 간의 cross-modal image retrieval에 해당합니다. MDII와 동일하게 Visble 2 Intrared 혹은 그 반대의 영상 검색을 목적으로 합니다. Intro…
[ICCV 2021]Learning by Aligning: Visible-Infrared Person Re-identification using Cross-Modal Correspondences
제가 이번에 리뷰할 논문은 cross-modality간의 Re-ID를 수행하는 논문입니다. 해당 논문에서 localization 태스크에 가져올 수 있는 것을 고민하고 있으며, 실험을 하고있는 논문입니다. VI-reID(V:visible, I: Infrared)에서의 문제점은…
[ECCV 2020] Consistency-based Semi-supervised Active Learning: Towards Minimizing Labeling Cost
오늘은 저희가 작년 다크데이터 2차년도에서 수행한 연구 결과와 아주 비슷한 결의 논문을 리뷰하려고 합니다. 최근 제가 리뷰한 논문이 2021-2022년도인 것을 감안하면 이들과 비교했을 때, Semi-Learning…
Self-Supervised Learning에 대해
아주 오랜만에 X-review를 작성하는 거 같습니다.신년이 시작했기 때문에 새 마음 새 뜻으로 열심히 작성 해야겠습니다. 오늘은 Self-Supervised Learning 에 대해 제가 공부 한 내용들을 리뷰하겠습니다.방학동안…
[CVPR 2021] Patch-NetVLAD : Multi-Scale Fusion of Locally-Global Descriptors for Place Recognition
Patch-NetVALD는 local descriptor와 global descriptor의 장점을 모두 결합한 방법으로 기존 netVLAD에서 변형하여 patch level feature를 사용하였다. 또한 multi-scale fusion한 patch features를 사용하여 structure, illumination과 같은…
[CVPR-2021] Patch-NetVLAD: Multi-Scale Fusion of Locally-Global Descriptors for Place Recognition
뜬금없이 Visual place recognition(VPR)을 읽어봤습니다. 읽을 필요는 없다고 하는데… 제가 지금 하려는 일이 물체 검색을 좀 원활하게 해보기 위해 프레임 레벨에서 패치(가칭)단위로 백그라운드를 suppression 할…
[ECCV2022]MultiMAE: Multi-modal Multi-task Masked Autoencoders
이번에 소개드릴 논문은 요새 self-supervised learning에서 핫한 Masked Autoencoder입니다. 근데 이제 Multi-modal과 Multi-task를 곁들인. 혹시 Masked Autoencoder(MAE)에 대해서 아직 잘 모르시는 분들은 저희 연구실의 미래…
[ICML 2021] An Image is Worth 16×16 Words : Transformer for image recognition at scale
Before Review Vision Transformer(ViT) 논문입니다. 요즘 비디오 분야에서도 Transformer 기반의 백본이 활발하게 연구가 되는 추세입니다. 저도 관련해서 계속 follow-up을 하고 있는데 제가 ViT에 대한 detail을…
[NIPS 2022] VideoMAE : Masked Autoencoders are Data-Efficient Learners for Self-Supervised Video Pre-Training
Before Review 사실 제가 지난 리뷰에서 이미지 도메인에서의 MAE를 다뤘는데 그 이유는 바로 VideoMAE를 읽기 위함이었습니다. 그리고 또한 VideoMAE를 읽는 이유는 이번에 비디오 분야에서 개쩌는(?)…
[CVPR 2022] Masked Autoencoders Are Scalable Vision Learners
Before Review 진짜 오랜만에 X-Review 인 것 같습니다. 이번에는 비디오 논문이 아닌 이미지 논문을 읽게 되었습니다. 요즘 Masking Model 들이 많은 연구가 이루어지고 있어서 저도…
최신 댓글