논문 [Link] | 랩 세미나 [Link] | PPT [Link]
⁌ 요약 ⁌
해당 논문은 Dataset 구축 비용을 효율적으로 사용하기 위한 연구인 SSL(=semi-supervised learning)과 AL(=active learning)을 결합한 것으로 두 방법론 간의 상호작용을 활발하다는 장점이 있다. SSL과 AL을 결합한 SSL-AL 방법론으로 최초는 아니지만 기존 방법론(=지도학습 task)과 달리 SSL task를 기반으로 하여 데이터를 더 효율적으로 사용하고, GAN 기반이 아닌 그래프기반으로 학습의 안정성이 높다는 장점이 있다.
⁌ 용어설명 ⁌
- SSL(Semi-supervised Learning)
SSL은 학습의 효율성을 높이기 위해 supervised 방법론과 unsupervised 방법론을 합한것이다. - AL(Active Learning)
Active Learning이란 데이터셋 구축 시 라벨링 비용을 최소화하기 위해 모델이 학습할 데이터를 직접 선정하여 라벨링 대상을 줄이는 방법론이다.
⁌ 기존 방법론⁌
해당 프레임워크는 SSL Task를 기반으로한 SSL-AL 로 gRaphbasEd VIrtual adVersarial Active Learning (REVIVAL)로 명명되었다. 프레임워크는 label propagator, virtual adversairal generator, Boundary Limitator로 구성되었으며, 전반적인 흐름은 다음과 같다.
- label propagation을 통해 unlabeled data x에 대한 가상 라벨 y를 생성.
- 위에서 생성한 x,y쌍 중, Virtual Adversarial Generator를 통해 분류의 가장자리에 있는, 즉 uncertainty가 크다고 할 수 있는 데이터를 top M개 선정.
- 이후 선정된 데이터의 Energy를 측정하여 top-K개의 데이터를 쿼리로 해 labeling을 요청.
label propagator
x데이터를 입력으로 하며, 이에 대한 y데이터를 생성하는 모듈
virtual adversairal generator
unlabeled데이터 중 라벨링을 요청할 데이터를 선정하기 위해 설계된 모듈
Boundary Limitator
virtual adversairal generator를 통해 1차적으로 선정된 데이터의 entropy를 계산하여 최종적으로 top-k개의 쿼리데이터를 선정하기 위한 모듈
⁌ 실험 ⁌
실험은 Image classification과 Segmentation에 대해 진행 되었으며 각 실험에 대한 사용 데이터셋은 다음(1)과 같다. 제안하는 방법론은 (2)와 (3)의 방법론과 비교되었으며 실험에서 SOTA 성능을 보였다.
Datasets(1)
- Image classification with CIFAR-10, CIFAR-100
- Segmentation with Cityscapes dataset.
Baseline(2)
- ICAL (high inconsistency of predictions)
- Core-set (distribution-based)
- Entropy (uncertainty-based)
- Random
Supervised Active Learning(3)
- SRAAL (State-Relabeling Adversarial Active Learning)
- VAAL
- LLAL (learning loss for active learning)
- CDAL
실험 결과(Image Classification)
실험 결과(Segmentation)
비록 세미나에서 잘 설명해주셨겠지만 x-review에서도 조금 자세히 논문 내용을 다뤄주었으면 좋을텐데 그러지 못한 것 같아서 아쉽습니다.