Category: Conference
Conference Reivew
[ECCV 2022]Multimodal Object Detection via Probabilistic Ensembling
오랜만에 멀티스펙트럴 보행자 검출기 논문을 들고 왔습니다. 해당 논문은 KAIST와 FLIR에서 실험을 진행했으며, 새로운 패러다임을 제시한 점을 높이 평가되어 ECCV Oral로 선정된 방법론 입니다. 역시……
[AAAI2023](Oral) Compact Transformer Tracker with Correlative Masked Modeling
이번에 작성하게 될 논문은 AAAI2023 oral paper로 선정된 논문으로 task는 object tracking 관련 논문입니다. object tracking에 관심이 생겨서 읽게 된 논문은 아니고, 성능 향상을 위해…
Self-Supervised Learning Framework
Before Review 요즘 Self-Supervised 기반의 Video Representation Learning 논문을 계속 읽고 있는데 조금 부족한 부분을 느꼈 습니다. 제가 정작 기본적인 SSL framework에 대해서는 이해가 떨어지는…
[CVPR2022] Masked Feature Prediction for Self-Supervised Visual Pre-Training
이번에 소개드릴 논문은 Facebook AI Research 팀에서 쓴 Masked Feature Prediction(MaskFeat)이라는 논문입니다. 해당 논문도 Masked Autoencoder(MAE)에 대한 방법론으로, 이 논문에서 다루고자하는 것은 Reconstruction하는 대상을 무엇으로…
[CVPR 2022] Alignment-Uniformity aware Representation Learning for Zero-shot Video Classification
안녕하세요. 지난번에 읽은 논문에서 Alignment와 Uniformity 관점에서의 Loss를 설계한 논문을 바탕으로 하는 연구가 있었는데, 새로운 느낌이 들었습니다. 찾아보니 해당 연구를 바탕으로 하는 다른 논문들이 많아서…
[NeurIPS2022] Croco: Self-supervised Pre-training for 3D Vision tasks by Cross-view Completion
이번에 소개드릴 논문은 네이버 랩스 유럽팀에서 연구한 CroCo라는 논문입니다. 분야는 핫하디 핫한 Masked AutoEncoder(MAE)를 기반으로 한 Self-supervised learning 연구이며, 네이버 랩스다 보니 3D Geometry 분야에…
[CVPR 2018] Non-local Neural Networks
Introduction convolution은 연산 방식이 일정 크기의 커널을 이미지에 windowing하면서 연산을 진행하기 때문에, local한 관계에 집중합니다. 그러다 보니 [ 그림1 ]과 같이 멀리 떨어진 픽셀은 좀…
[ICCV 2021]Learning by Aligning: Visible-Infrared Person Re-identification using Cross-Modal Correspondences
제가 이번에 리뷰할 논문은 cross-modality간의 Re-ID를 수행하는 논문입니다. 해당 논문에서 localization 태스크에 가져올 수 있는 것을 고민하고 있으며, 실험을 하고있는 논문입니다. VI-reID(V:visible, I: Infrared)에서의 문제점은…
[ECCV 2020] Consistency-based Semi-supervised Active Learning: Towards Minimizing Labeling Cost
오늘은 저희가 작년 다크데이터 2차년도에서 수행한 연구 결과와 아주 비슷한 결의 논문을 리뷰하려고 합니다. 최근 제가 리뷰한 논문이 2021-2022년도인 것을 감안하면 이들과 비교했을 때, Semi-Learning…
[ECCV2022]MultiMAE: Multi-modal Multi-task Masked Autoencoders
이번에 소개드릴 논문은 요새 self-supervised learning에서 핫한 Masked Autoencoder입니다. 근데 이제 Multi-modal과 Multi-task를 곁들인. 혹시 Masked Autoencoder(MAE)에 대해서 아직 잘 모르시는 분들은 저희 연구실의 미래…
![[ECCV 2020] Consistency-based Semi-supervised Active Learning: Towards Minimizing Labeling Cost](http://server.rcv.sejong.ac.kr:8080/wp-content/uploads/2023/01/image-37-480x360.png)
![[ECCV2022]MultiMAE: Multi-modal Multi-task Masked Autoencoders](http://server.rcv.sejong.ac.kr:8080/wp-content/uploads/2023/01/image-10-480x360.png)
안녕하세요 재윤님 답글 감사합니다. 우선 질문에 대해서 생각하신게 맞고 CNN 을 타고나온 output 들이 이미 embedding vector 의 형태이므로 feature…