Day: January 16, 2023
[ICML 2022] data2vec: A General Framework for Self-supervised Learning in Speech, Vision and Language
김 주연 01/16/2023 6 Comments on [ICML 2022] data2vec: A General Framework for Self-supervised Learning in Speech, Vision and Language
안녕하세요. 이번 x-reivew는 임근택 연구원이 추천해준 논문 “data2vec: A General Framework for Self-supervised learning in Speech, Vision, and Language” 입니다. 요즘에 올라오는 리뷰마다 self-supervised 키워드가…
[arXiv 2022] InternVideo : General Video Foundation Models via Generative and Discriminative Learning
임 근택 01/16/2023 Leave a Comment on [arXiv 2022] InternVideo : General Video Foundation Models via Generative and Discriminative Learning
Before Review Video 진영에도 GPT, BERT라고 할만한 Foundation Model이 등장한 것 같습니다. 결과만 놓고 보면 39가지의 데이터 셋을 가지고 평가하여 모든 SOTA를 갈아치웠습니다. 개인적으로는 아쉬운…
안녕하세요 재윤님 답글 감사합니다. 우선 "is playing" 이라는 질문이 있는지는 모르겠으나 전체 질문 문장을 모델에 입력으로 줬을때, video, audio 에…