Posted in RCVWS.2020, Videos, X-Course [RCVWS.2020][7일차] Making an efficient model 최 유경 03/10/2020 Leave a Comment on [RCVWS.2020][7일차] Making an efficient model #AMP # Author: 최 유경Computer Vision, Machine Learning
안녕하세요 인택님 질문 감사합니다~!! 1. Masked Self-Attention은 현재 토큰이 현재와 이전 토큰만 보도록 미래위치를 마스킹하는것을 말하는데 −∞는 softmax 전에 미래…