data:image/s3,"s3://crabby-images/34f3f/34f3f350c991c809fe011c10766d181436034e9a" alt=""
본 논문은 Active Learning에 관한 논문이다.
learning-based 알고리즘의 가장 큰 bottlenecks 중 하나는 labeled data의 부족이다. 이를 해결하기 위해 unlabeled, semi-supervised learning 기법들이 소개되었으나, 몇몇 방식은 실제 task 에 적용하기 어렵다. 이렇게 적은 labeled을 이용하는 방식 또한 연구되어야 하지만 실제 labeled dataset을 늘리는 방법에 대해서는 비교적 관심을 받지 못했다. 본 연구는 이러한 관점에서 annotation process를 효율적으로 진행할 수 있는 active learning 을 다룬다. (물론 active learning은 이 논문 이전부터 이미 존재하는 주제이다)
논문은 제안하는 방법론을 CALD (Consistency-based Active Learning method for object Detection ) 라 명명하는데 제목 그대로 object detection에 active learning을 적용할 수 있다. 기존의 active learning method는 image classification task에 적용이 많았다. 이러한 classification 기반의 active learning 연구를 object detection task에 직접 적용을 할 수 없었던 이유는 다음의 3가지와 같다.
- classification 문제와 object detection 문제의 관점 차이
classification은 class 예측에만 관심을 갖으면 되지만, object detection은 bounding box prediction에도 같은 중요도를 갖고 작동해야한다. - object detection 문제의 경우 informative object (정보량이 많은, 관심을 가져야하는, 선택되어야하는 물체)와 uninformative object가 같은 이미지에 존재할 수 있다.
- classification 문제에서 한 이미지에는 하나의 class가 존재하지만 object detection의 경우 하나의 이미지에 여러 object가 있어 multi class를 갖는다.
data:image/s3,"s3://crabby-images/e698b/e698bc08f13a23d4bce733fef104ccac6bf3bfd8" alt=""
CALD의 진행과정은 2stage로 나뉜다. first stage는 individual information을 계산하여 initial selected pool을 생성하고 second stage는 mutual information(class 분포 정보)을 통하여 initial selected pool을 필터링하여 final selected pool을 생성한다.
1. Consistency-based Individual Information
stage 1에서 individual information을 계산하는 방법은 다음과 같다.
하나의 unlabeled image의 k 번째 prediction box와 그 점수를 bk,sk 그 이미지를 augmentation 후 k번째로 predict한 box를 bk’, 점수를 sk’라 하자.
이때 해당 k번째 예측의 consistency는 bk,sk와 bk’,sk’의 비교를 통해 구하며, 다음의 수식과 같다.
data:image/s3,"s3://crabby-images/22767/2276793571c0222d90d015f1720fbac84d30b861" alt=""
2. Mutual information
data:image/s3,"s3://crabby-images/903d0/903d071970720652e9b036d186409018ce8e646b" alt=""
위를 통해 second stage를 통한 class 분포의 균형도 보정 효과를 확인할 수 있다.
data:image/s3,"s3://crabby-images/5bf03/5bf0365e46260c32707472e3440046106eda1031" alt=""
선택 방식은 다음과 같다.
요약
본 논문은 classification based active learning을 object detection에 적용하였으며, 두 task의 차이점을 정의하였다.
적용을 위해 stage 2에서 class unbalance 문제를 해결하였으며, stage 1에서 IOU를 도입해 task를 확장하였다