[NeurIPS 2020] Self-supervised Co-training for Video Representation Learning
안녕하세요. 오늘은 비디오 근본…? 아무튼 학습에 대한 내용을 가지고 왔습니다. 길고 길었던 논문 작업이 끝이 보이고 ㅎㅎ… 다음 실험을 진행을 해야하는데 학습에 대한 내용을 제가…
[X-Diary 10월 2주차 한대찬]
졸업을 앞둔 지금 조용하지만 발 바쁘게 무언가를 하고 있는… 현재 입니다. 현재 저는 “졸업” 과 “취준” 을 목표로 연구실에서 일을 진행하고 있습니다. 그리고 이렇게 일정이…
[X-diary 10월 2주차] 김형준
X-review를 작성할 시간적 여유가 나지 않아서 짤막한 다이어리 형식으로 x-review를 대체합니다. 양해부탁드립니다. 졸업논문 마치고서 다시 논문 리뷰를 하겠습니다. 어떠한 내용을 다이어리에 적어볼까 고민을 해보았는데, 후배들에게…
[2019 IEEE TASLP] Speech Emotion Classification Using Attention-Based LSTM
Introduction Speech Emotion Recognition 분야에서는 음성 신호로부터 감정을 분류하기 위해 많은 연구가 진행되었고 최근에는 딥러닝이 발전하면서 SER에 CNN 같은 기법을 사용하기 시작했습니다. 위의 알고리즘이 감정인식…
[TITS 2021] Unsupervised Monocular Visual Odometry Based on Confidence Evaluation
제가 이번에 리뷰할 논문은 VIO(visual-inertial-odometry)논문이 아닌 VO(visual odoemtry) 논문입니다. 센서의 동기화가 맞지 않을 경우를 어떻게 알고 판단할 지를 고민하던 중 읽게 된 논문으로, 제가 생각하는…
[CVPR2022]Exploring the Equivalence of Siamese Self-Supervised Learning via A Unified Gradient Framework
Here’s 학습을 위해서 가공이 되지 않은, 비가공 데이터로부터 학습을 가능하게하는 self-supervised learning은 다양한 연구가 진행되어왔다. 또한 현시점에서 일반적으로 다음의 3가지 관점으로 나뉜다: 1) contrastive learning(MoCo),…
[Neurlps 2021] Conflict-Averse Gradient Descent for Multi-task Learning
오랜만에 본업으로 돌아와서 관련 논문을 리뷰할 수 있게 되었네요. 이제 10월이 되었으니 부지런히 저의 연구를 위해 달려봐야 겠습니다. 제가 이번에 리뷰할 논문은 몇개월 전에 리뷰한…
[2022 CVPR] Scene Consistency Representation Learning for Video Scene Segmentation
Before Review 이번 리뷰는 Self-Supervised 기반의 Video Representation Learning 논문을 읽었습니다. Video Scene Segmentation을 위한 논문이지만, 결국 Long-Term 비디오를 이해한다는 관점에서 저의 연구 방향에 도움이…
[IEEE EAIS 2022]Emotions Understanding Model from Spoken Language using Deep Neural Networks and Mel-Frequency Cepstral Coefficients
안녕하세요. 제가 요즘 논문 막바지 실험 값을 뽑는 중에 감정인식 중간발표가 갑자기 생겨서 따로 논문을 볼 시간이 없더라고요. 그래서 리뷰로 가져온 논문은 감정인식 실험에서 사용했던…
[2021 MM] Cross-modal Consensus Network for Weakly Supervised Temporal Action Localization
오늘도 비디오의 Weakly-supervised Temporal Action Localization (WTAL) task에 관한 논문입니다. 2021년도 ACM MM에 게재된 ‘Cross-modal Consensus Network for Weakly Supervised Temporal Action Localization’ (CO2-Net) 에…
1. CTC 기반의 텍스트 인식 모델의 학습 과정에 대해 설명을 드리면 대답이 될 것 같네요! 입력된 텍스트 이미지[H x W…