【技术实现步骤摘要】
基于熵最小化的半监督图像语义分割方法
[0001]本专利技术属于计算机视觉
,用于半监督图像语义分割,对于仅有少量标注数据和大量无标注数据场景下的图像分割起着至关重要的作用,具体涉及一种基于熵最小化的半监督图像语义分割方法。
技术介绍
[0002]近年来,随着深度监督学习的发展,各种计算机视觉任务取得了显著进展。然而,训练一个深度神经网络需要大量的标记数据,这些数据的获取通常是耗时且昂贵的。特别在语义分割任务中,需要大量的像素级标签,标注代价分别是区域级和图像级标签的15倍和60倍。由于需要专业医生的标注,医学图像分割成本的增加更加明显。因此,人们越来越关注弱监督分割方法和半监督分割方法。
[0003]半监督图像语义分割假设在同一分布中有大量的未标记数据和有限的标记数据。目前,主流的半监督分割方法可以分为基于生成对抗网络(GAN)的方法和基于一致性训练的方法。基于GAN的方法将通用的GAN框架扩展到像素级的预测,试图用假的未标记数据欺骗鉴别器。一致性训练方法期望网络的输出在不同的扰动下是平滑的。这些方法在半监督 ...
【技术保护点】
【技术特征摘要】
1.一种基于熵最小化的半监督图像语义分割方法,其特征在于,首先提出一种特征梯度映射正则化策略FGMR,其使用编码器中低层特征图的梯度映射来增强编码器对深层特征图的编码能力;然后,提出一种自适应锐化策略,将未标记数据的决策边界保持在一个低密度区域;并且为了进一步降低噪声的影响,提出一种低置信度一致性策略保证分类和分割的一致性。2.根据权利要求1所述的基于熵最小化的半监督图像语义分割方法,其特征在于,所述方法对半监督图像语义分割网络结构的改动为:假设输入图像大小为H
×
W,类别数为C,则将网络输出改为分割结果的均值μ
s
∈R
H
×
W
×
C
和方差同样在编码器的最后一层输出分类结果的均值μ
c
∈R
C
和方差对于网络的损失函数的改进,首先,网络的损失函数包含监督损失项和非监督损失项:L=L
s
+λL
u
其中,L
s
是监督损失项,L
u
是非监督损失项,λ是调整监督损失项和非监督损失项之间平衡的超参数;对于有标签的数据x
l
∈R
H
×
W
×3,对应的分割标签为y
s
∈R
H
×
W
×
C
,类别标签为y
c
∈R
C
;将x
l
送进网络获得相应均值和方差,并利用重参数技巧采样得到分割预测z
s
和分类预测z
c
,之后采用交叉熵损失来分别监督y
s
和分割结果z
s
,以及y
c
和分类结果z
c
;对于有标签的数据,损失项定义为:其中,H(
·
,
·
)是交叉熵损失函数,α(
·
)是最后一层的激活函数;对于未标记的数据,先利用特征梯度图正则化策略FGMR来增...
【专利技术属性】
技术研发人员:李佐勇,吴嘉炜,樊好义,张晓青,赖桃桃,
申请(专利权)人:闽江学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。