[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[IEEE 2020] ImVoteNet: Boosting 3D Object Detection in Point Clouds with Image Votes
Facebook AI에서 19년도에 나온 VoteNet에 이어 ImVoteNet을 내놓았다. VoteNet은 3d geometry input만을 사용하여 indoor상황에서 다른 rgb-d input을 사용하는 모델보다 좋은 성능을 보였었다. 이때 ImVoteNet은 RGB…
[ICLR 2021] An Image is Worth 16×16 Words: Transformers for Image Recognition at Scale
Abstract nlp에서 transformer가 등장하고 해당 분야의 standard한 모델이 되었다. 이에 computer vision 에서도 이를 응용한 연구가 진행되었다. vision task에 attention을 사용한 것이 그 예이며, convolution…
[CVPR 2022] M2FNet: Multi-modal Fusion Network for Emotion Recognition in Conversation
이번에 감정 인식 관련하여 서베이를 하던 중에 emotion recognition in conversations이라는 분야를 발견하게 되었습니다. 결국에는 emotion recognition인거 아니냐 하시겠지만 디테일하게 살펴보니 emotion recognition과 emotion recognition…
[CVPR 2022] Alignment-Uniformity aware Representation Learning for Zero-shot Video Classification
안녕하세요. 지난번에 읽은 논문에서 Alignment와 Uniformity 관점에서의 Loss를 설계한 논문을 바탕으로 하는 연구가 있었는데, 새로운 느낌이 들었습니다. 찾아보니 해당 연구를 바탕으로 하는 다른 논문들이 많아서…
[TMM 2023] A Novel Action Saliency and Context-Aware Network for Weakly-Supervised Temporal Action Localization
안녕하세요, 오늘 제가 X-Review에서 소개해드릴 논문은 IEEE Transactions on Multimedia 저널에 게재된 ‘A Novel Action Saliency and Context-Aware Network for Weakly-Supervised Temporal Action Localization’입니다. 올해…
[WACV 2023] TransVLAD: Multi-Scale Attention-Based Global Descriptors for Visual Geo-Localization
제가 이번에 리뷰할 논문은 WACV 2023에 발표된 TransVLAD라는 논문으로 Transformer와 VLAD가 합쳐진 논문입니다. 도로 환경에 대한 retrieval논문을 찾아보다 읽게 된 논문입니다. Introduction Visual geo-localization에서 기존의…
[CVPR 2015] Fully Convolutional Networks for Semantic Segmentation
Introduction intro에서는 이 당시 등장했던 cnn classification모델인 alexnet, vgg, googlenet을 설명하며 이들의 구조에 관해 이야기합니다. 기존 cnn모델은 [그림 1]과 같이 convolution을 이용해 특징을 추출하고, 이를…
[CVPR2022]Probing Representation Forgetting in Supervised and Unsupervised Continual Learning
What is the point it talking about? 이번 논문 또한 incremental/continual learning(이하 CL)과 관련된 내용입니다. 앞선 세미나 등에서 태스크를 소개하며 말씀드린 것처럼 CL이란 여러가지 과제를…
[Arxiv2022] Masked Autoencoders are Robust Data Augmentors
이번에 소개드릴 논문은 Self-supervised Learning으로 학습한 MAE를 data augmentation으로 활용해서 high-level recongnition task를 더 잘 수행하도록 학습시켜보자? 라는 방법론입니다. 컨셉 자체가 상당히 간단하여서 간단히 리뷰…
[ICML 2022] Time Is MattEr : Temporal Self-supervision for Video transformers
Before Review 요즘 제가 Transformer 관련 논문을 많이 읽고 있습니다. 이유는 요즘 비디오 분야에서 Self-Supervised Learning + Video Transformer의 연구가 활발하게 이루어지고 있기 때문입니다. 이번년도…
최신 댓글