[카테고리:] X-Review
Paper, Conference, Seminar, API, Code, Dataset 등의 리뷰를 담을 예정입니다.
[CVPR2022]Exploring the Equivalence of Siamese Self-Supervised Learning via A Unified Gradient Framework
Here’s 학습을 위해서 가공이 되지 않은, 비가공 데이터로부터 학습을 가능하게하는 self-supervised learning은 다양한 연구가 진행되어왔다. 또한 현시점에서 일반적으로 다음의 3가지 관점으로 나뉜다: 1) contrastive learning(MoCo),…
[2022 CVPR] Scene Consistency Representation Learning for Video Scene Segmentation
Before Review 이번 리뷰는 Self-Supervised 기반의 Video Representation Learning 논문을 읽었습니다. Video Scene Segmentation을 위한 논문이지만, 결국 Long-Term 비디오를 이해한다는 관점에서 저의 연구 방향에 도움이…
[IEEE EAIS 2022]Emotions Understanding Model from Spoken Language using Deep Neural Networks and Mel-Frequency Cepstral Coefficients
안녕하세요. 제가 요즘 논문 막바지 실험 값을 뽑는 중에 감정인식 중간발표가 갑자기 생겨서 따로 논문을 볼 시간이 없더라고요. 그래서 리뷰로 가져온 논문은 감정인식 실험에서 사용했던…
[2021 MM] Cross-modal Consensus Network for Weakly Supervised Temporal Action Localization
오늘도 비디오의 Weakly-supervised Temporal Action Localization (WTAL) task에 관한 논문입니다. 2021년도 ACM MM에 게재된 ‘Cross-modal Consensus Network for Weakly Supervised Temporal Action Localization’ (CO2-Net) 에…
[CVPR2022]Leverage Your Local and Global Representations: A New Self-Supervised Learning Strategy
Here! (용어가 익숙하지 않으신 분은 overview 먼저 읽으시는 것을 추천드립니다.) 본 논문은 multi-view 기반의 self-supervised learning 연구에서 많은 세종 rcv의 연구원들이 의문을 가졌던, “consistency regularization기반의 학습에서…
[ICASSP 2021]ATVIO: Attention Guided Visual-Inertial Odometry
시각 정보와 inertial 정보를 결합하여 ego-motion을 추적하여 이동 궤적을 알아내는 VIO task에는 카메라와 IMU 센서를 서로 상호보완하여 두 정보를 최대한 활용하는 것이 여전히 문제로 남아있습니다….
[2021 NIPS] Relational Self-Attention What’s Missing in Attention for Video Understanding
Before Review 이번 논문은 비디오를 이해하는 데 있어 중요하게 작용하는 요소들을 고려하여 새롭게 제안된 attention 메카니즘을 다룬 논문입니다. Neurips 페이퍼는 Core-ML쪽만 다루는 줄 알았는데 Computer…
[2022 TCSVT] Slow Motion Matters: A Slow Motion Enhanced Network for Weakly Supervised Temporal Action Localization
이번 X-Review도 비디오 분야의 Weakly-supervised Temporal Action Localization task에 관련된 논문을 소개해드리겠습니다. 올해 저널에 게재된 논문으로 해당 task 서베이 중 굉장히 높은 성능을 보여 읽게…
[CVPR 2020] Unsupervised Multi-Modal Image Registration via Geometry Preserving Image-to-Image Translation
안녕하세요. 뭔가 되게 오랜만에 x-review를 작성하는 거 같네요. 오늘 리뷰하게 될 논문은 multi-modal 에서의 Image Registration한 논문입니다.신정민 연구원과 마무리중인 논문이 Image Registration 분야이기 때문에 본…
[CVPR2022](ORAL) Splicing ViT Features for Semantic Appearance Trasnfer
오랜만에 x-review를 작성하네요. 이번에 소개드릴 논문은 CVPR2022 Oral paper로 선정된 Splicing ViT~~입니다. 해당 논문의 task는 Image Translation이라고 이해하시면 좋을 것 같습니다. Intro 일단 논문에서 하고자…
최신 댓글