[카테고리:] Paper

Paper Review

Posted in Paper X-Review

[IEEE Transactions 2022] FV2ES: A Fully End2End Multimodal System for Fast Yet Effective Video Emotion Recognition Inference

이번에도 감정인식 논문입니다. 무슨 논문을 읽을까 서베이하다 발견한 베이스라인 후속 논문이라 읽게 되었습니다. 이 논문은 비디오는 크고 무거워지는데 기존의 멀티모달 감정인식 연구들은 application에는 뒷전이고 성능에만…

Continue Reading
Posted in Paper X-Review

[arXiv 2021] Robust Mutual Learning for Semi-supervised Semantic Segmentation

안녕하세요. 꽤나 오랜만에 X-review를 작성하는 거 같습니다. 오늘 작성 할 논문은 Robust Mutual Learning for Semi-supervised Semantic Segmentation 라는 논문입니다.현재 IPIU의 연장선으로 추가적인 실험을 Mutual…

Continue Reading
Posted in News Paper X-Review

[ECCV 2020] DETR: End-to-End Object Detection with Transformers

안녕하세요. 일곱 번째 X-review 입니다. 이번 주 내 DETR과 Deformable DETR에 대해 다룰 예정으로, 해당 논문을 읽게된 계기는 한전 과제와 연관되며, Small object detection 성능을…

Continue Reading
Posted in Paper X-Review

[arXiv 2022] Weakly-Supervised Temporal Action Localization by Progressive Complementary Learning

오늘의 X-Review도 마찬가지로 Weakly-Supervised Temporal Action Localization(WTAL) 논문입니다. 본 논문은 22년 말 arXiv에 등록되었고 포맷이나 날짜를 보니 CVPR 2023에 투고된 것으로 추정됩니다. 22년 또는 그…

Continue Reading
Posted in Paper X-Review

[Interspeech 2022] Context-aware Multimodal Fusion for Emotion Recognition

이번 리뷰도 감정 인식 관련한 리뷰 입니다. 제가 최근 emotion recognition in conversation에 흥미가 많이 가서 그 분야 쪽을 많이 읽었는데 이제 슬슬 제 코드의…

Continue Reading
Posted in Paper X-Review

[2022 arXiv] Soft-Landing Strategy for Alleviating the Task Discrepency Problem in Temporal Action Localization Tasks

Before Review arXiv에 올라온 preprint 이지만 CVPR format 이며, 연세대와 포스텍의 합작 논문이라 읽어보게 되었습니다. 제가 이전에 자주 리뷰하던 Temporal Action Localization에 대한 논문입니다. 전년도에…

Continue Reading
Posted in Paper X-Review

[WACV 2023] Temporal Feature Enhancement Dilated Convolution Network for Weakly-supervised Temporal Action Localization

이번 주 X-Review에서 제가 소개해드릴 논문은 올 해 WACV에 게재되었고 제목은 ‘Temporal Feature Enhancement Dilated Convolution Network for Weakly-supervised Temporal Action Localization’입니다. 마찬가지로 비디오에서 Weakly-supervised…

Continue Reading
Posted in Paper X-Review

[CVPR 2022] Probabilistic Representations for Video Contrastive Learning (Part.2)

Before Review 제가 이 논문 리뷰 part.1을 두 달전 쯤에 작성했는데 갑자기 생각이 나서 이제 마무리를 지으려고 합니다.. 아쉬운 건 코드를 공개하겠다고 했는데 공개를 안…

Continue Reading
Posted in Paper X-Review

[ICLR 2022] TADA! Temporally Adaptive Convolutions for Video Understanding

Before Review 이번 논문은 Video Understanding을 위해 제안되는 temporally adaptive convolution을 다룬 논문입니다. 모든 프레임에 대해서 고정된 weight를 사용하는 기존 Convolution 대비, 입력 값에 따라 weight가…

Continue Reading
Posted in Paper X-Review

[CVPR 2022] Transmix: Attend to mix for vision transformers

안녕하세요. 다섯 번째 X-review입니다. 해당 논문은 ViT(Self-attention)를 Augmentation 에 적용한 방법론을 담은 논문으로, 단순히 ViT 관련 논문 서베이 중 제목이 끌려 읽게 되었습니다. 그럼 시작하겠습니다….

Continue Reading