[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[CVPR 2017] PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation
안녕하세요. 네 번째 X-Review입니다. 해당 논문은 point cloud를 딥러닝 모델의 입력으로 하는 과정을 담은 첫 논문으로, 오픈 세미나에서 말씀드렸던 것과 같이 관심 주제인 object detection…
[NeurIPS 2021] Do Vision Transformers See Like Convolutional Neural Networks?
안녕하세요. 오늘은 CNN과 ViT에 관한 논문을 가져왔습니다. Introduction Intro 없이 본론으로 넘어가기 위해 서론을 좀 쓰겠습니다. 트랜스포머를 이야기할 때, 흔히들 global한 정보를 잘 본다(long-range dependency가…
[ICLR 2022] Uniformer : Unified Transformer For Efficient Spatiotemporal Representation Learning
Before Review 이번에도 BackBone 연구 입니다. 이전에 조원 연구원이 리뷰한 TimeSformer와 비슷하게 비디오 데이터를 Vision Transformer를 바탕으로 이해하는 연구 입니다. 흥미로웠던 것은 3D CNN의 장점과…
[TCSVT 2021] Infrared and Visible Cross-Modal Image Retrieval Through Shared Features
이번에 들고온 논문은 열화상 영상과 컬러 영상 간의 cross-modal image retrieval에 해당합니다. MDII와 동일하게 Visble 2 Intrared 혹은 그 반대의 영상 검색을 목적으로 합니다. Intro…
[ICCV 2021]Learning by Aligning: Visible-Infrared Person Re-identification using Cross-Modal Correspondences
제가 이번에 리뷰할 논문은 cross-modality간의 Re-ID를 수행하는 논문입니다. 해당 논문에서 localization 태스크에 가져올 수 있는 것을 고민하고 있으며, 실험을 하고있는 논문입니다. VI-reID(V:visible, I: Infrared)에서의 문제점은…
[ECCV 2020] Consistency-based Semi-supervised Active Learning: Towards Minimizing Labeling Cost
오늘은 저희가 작년 다크데이터 2차년도에서 수행한 연구 결과와 아주 비슷한 결의 논문을 리뷰하려고 합니다. 최근 제가 리뷰한 논문이 2021-2022년도인 것을 감안하면 이들과 비교했을 때, Semi-Learning…
Self-Supervised Learning에 대해
아주 오랜만에 X-review를 작성하는 거 같습니다.신년이 시작했기 때문에 새 마음 새 뜻으로 열심히 작성 해야겠습니다. 오늘은 Self-Supervised Learning 에 대해 제가 공부 한 내용들을 리뷰하겠습니다.방학동안…
[CVPR 2021] Patch-NetVLAD : Multi-Scale Fusion of Locally-Global Descriptors for Place Recognition
Patch-NetVALD는 local descriptor와 global descriptor의 장점을 모두 결합한 방법으로 기존 netVLAD에서 변형하여 patch level feature를 사용하였다. 또한 multi-scale fusion한 patch features를 사용하여 structure, illumination과 같은…
[CVPR-2021] Patch-NetVLAD: Multi-Scale Fusion of Locally-Global Descriptors for Place Recognition
뜬금없이 Visual place recognition(VPR)을 읽어봤습니다. 읽을 필요는 없다고 하는데… 제가 지금 하려는 일이 물체 검색을 좀 원활하게 해보기 위해 프레임 레벨에서 패치(가칭)단위로 백그라운드를 suppression 할…
[ECCV2022]MultiMAE: Multi-modal Multi-task Masked Autoencoders
이번에 소개드릴 논문은 요새 self-supervised learning에서 핫한 Masked Autoencoder입니다. 근데 이제 Multi-modal과 Multi-task를 곁들인. 혹시 Masked Autoencoder(MAE)에 대해서 아직 잘 모르시는 분들은 저희 연구실의 미래…
최신 댓글