Semi-supervised Active Learning for Semi-supervised Models: Exploit Adversarial Examples with Graph-based Virtual Labels

논문 [Link] | 랩 세미나 [Link] | PPT [Link]

⁌ 요약 ⁌

해당 논문은 Dataset 구축 비용을 효율적으로 사용하기 위한 연구인 SSL(=semi-supervised learning)과 AL(=active learning)을 결합한 것으로 두 방법론 간의 상호작용을 활발하다는 장점이 있다. SSL과 AL을 결합한 SSL-AL 방법론으로 최초는 아니지만 기존 방법론(=지도학습 task)과 달리 SSL task를 기반으로 하여 데이터를 더 효율적으로 사용하고, GAN 기반이 아닌 그래프기반으로 학습의 안정성이 높다는 장점이 있다.

⁌ 용어설명 ⁌

  • SSL(Semi-supervised Learning)
    SSL은 학습의 효율성을 높이기 위해 supervised 방법론과 unsupervised 방법론을 합한것이다.
  • AL(Active Learning)
    Active Learning이란 데이터셋 구축 시 라벨링 비용을 최소화하기 위해 모델이 학습할 데이터를 직접 선정하여 라벨링 대상을 줄이는 방법론이다.

⁌ 기존 방법론⁌

해당 프레임워크는 SSL Task를 기반으로한 SSL-AL 로 gRaphbasEd VIrtual adVersarial Active Learning (REVIVAL)로 명명되었다. 프레임워크는 label propagator, virtual adversairal generator, Boundary Limitator로 구성되었으며, 전반적인 흐름은 다음과 같다.

  1. label propagation을 통해 unlabeled data x에 대한 가상 라벨 y를 생성.
  2. 위에서 생성한 x,y쌍 중, Virtual Adversarial Generator를 통해 분류의 가장자리에 있는, 즉 uncertainty가 크다고 할 수 있는 데이터를 top M개 선정.
  3. 이후 선정된 데이터의 Energy를 측정하여 top-K개의 데이터를 쿼리로 해 labeling을 요청.

label propagator

x데이터를 입력으로 하며, 이에 대한 y데이터를 생성하는 모듈

virtual adversairal generator

unlabeled데이터 중 라벨링을 요청할 데이터를 선정하기 위해 설계된 모듈

Boundary Limitator

virtual adversairal generator를 통해 1차적으로 선정된 데이터의 entropy를 계산하여 최종적으로 top-k개의 쿼리데이터를 선정하기 위한 모듈

⁌ 실험 ⁌

실험은 Image classification과 Segmentation에 대해 진행 되었으며 각 실험에 대한 사용 데이터셋은 다음(1)과 같다. 제안하는 방법론은 (2)와 (3)의 방법론과 비교되었으며 실험에서 SOTA 성능을 보였다.

Datasets(1)

  1. Image classification with CIFAR-10, CIFAR-100
  2. Segmentation with Cityscapes dataset.

Baseline(2)

  1. ICAL (high inconsistency of predictions)
  2. Core-set (distribution-based)
  3. Entropy (uncertainty-based)
  4. Random

Supervised Active Learning(3)

  1. SRAAL (State-Relabeling Adversarial Active Learning)
  2. VAAL 
  3. LLAL (learning loss for active learning)
  4. CDAL

실험 결과(Image Classification)

(좌) superivsed(3) 방법론과의 비교, (우) baseline(2) 방법론과의 비교
(좌) superivsed(3) 방법론과의 비교, (우) baseline(2) 방법론과의 비교. 하단 점선은 training set을 fully supervised로 학습하였을 때 성능이다.

실험 결과(Segmentation)

Author: 황 유진

1 thought on “Semi-supervised Active Learning for Semi-supervised Models: Exploit Adversarial Examples with Graph-based Virtual Labels

  1. 비록 세미나에서 잘 설명해주셨겠지만 x-review에서도 조금 자세히 논문 내용을 다뤄주었으면 좋을텐데 그러지 못한 것 같아서 아쉽습니다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 항목은 *(으)로 표시합니다