[ICCV 2022]Beyond Semantic to Instance Segmentation: Weakly-Supervised Instance Segmentation via Semantic Knowledge Transfer and Self-Refinement

Intro

[그림1]

Image segmenatation은 각 object 영역을 구별하면서 이미지에서 object가 차지하는 영역을 예측하는 instance segmentation과 이미지의 각 픽셀을 (일반적으로 사전정의된) 카테고리로 분류하는 semantic segmentation으로 나뉜다. 한편 segmentation은 학습 할 ground truth 마스크를 생성하기 위한 annotation 과정의 비용이 높아 weakly-supervised 기반의 연구도 많이 진행되고 있는데, 일반적으로 weakly-supervised instance segmentation(WSIS)가 weakly-supervised semantic segmentation(WSSS)보다 어려운 태스크라고 받아들여진다. 그 이유는 WSIS문제에는 object의 위치를 찾는 localization task가 내재되어있는데, weakly-supervised는 image level label이 주어지기 때문에 해당 정보(object location)를 갖을 수 없기 때문이다. 기존 방법론은 이러한 문제를 해결하기 위해 off-the-shelf proposal techniques 즉, 사전학습 된 개별 모델을 통해 object를 구분합니다. 그러나 이는 완전 학습 모델이라고 하기에는(사전학습된 모델을 사용하기 때문에) 무리가 있습니다. 이것이 [그림1]에 소개된 기존 방법론의 첫 번째 문제점입니다. 두 번째 문제점은 semantic drift problem 인데, 이는 background라고 잘못 분류된 pseudo label이 학습에 사용되는 경우 입니다.
해당 논문은 기존 연구에서 찾은 이 두 가지 문제점을 해결하고자 합니다.

Method

[그림2]

논문에서 앞선 문제점(off-the-shelf proposal techniques, semantic drift problem)을 해결하기 위한 해결책은 다음과 같습니다. 먼저 off-the-shelf proposal techniques 문제를 해결하기 위해 논문은 Semantic knowledge transfer 를 설계했습니다. cost 가 많이 들어가는 instance detection 모델을 사용하던 기존 WSIS 방법론과 다르게 Peak Attention Module(PAM)을 이용하여 weakly supervised semantic segmentation 모델의 출력을 instance level로 가공하면서 pseudo label을 생성했습니다. 여기서 PAM이란 [그림4]에서 확인할 수 있듯이 CAM 연구의 일종이며, 쉽게 생각하면, CAM을 필터링하여 피크지점을 찾는 모듈로 이해하시면 됩니다.

다음으로 semantic drift problem 해결을 위해 pseudo label refinement 파트를 통해 drift를 제거하였습니다. FixMatch 연구에서 pseudo label의 신뢰도를 thresholding 한 것과 같이, 이미지에서 생성된 pseudo instance semgnetation mask 중에서 신뢰도가 높은 object에 대해 offset 을 예측하는 모델을 이용하여 refinement를 합니다. 이때, 모델 기준으로 pseudo label에 대한 확신도가 낮은 object 영역의 경우 학습에 포함하지 않아 pseudo label의 잘못된 예측으로 인한 성능 하락도 막았습니다. [그림 3]을 보면 모델의 pseudo label 생성 능력이 높아질 수록, 데이터로 이용할 수 있는 pseudo label mask도 증가하는 것을 확인할 수 있습니다.

[그림3]
[그림4] PAM 설명

Experiments

제안하는 방법론을 Pascal VOC 2012과 COCO 데이터셋을 이용하여 유효성 검증을 진행하였습니다. 먼저 [표1]을 통해 기존 state-of-the-art(SOTA) 방법론과 비교하였으며 제안하는 방법론이 성능 측면에서 우월성을 보였습니다. 또한 [그림5]의 정성적 결과를 통해, 성능적 우월성이 실제 작동 측면에서도 확인할 수 있음을 보였습니다. 또한 높은 성능을 보이는 만큼 [그림6]과 같은 다양한 Ablation Study와 분석실험을 통해, 제안하는 방법론의 각 모듈이 실제로 효과가 있음을 밝혔습니다.

[표1] SOTA 와의 비교
[그림5]
[그림6]

Author: 황 유진

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 항목은 *(으)로 표시합니다