基于一致性正则化与半监督领域自适应图像语义分割算法制造技术

技术编号:36864204 阅读:8 留言:0更新日期:2023-03-15 18:53
基于一致性正则化与半监督领域自适应图像语义分割算法,所述算法将伪标签学习和一致性正则化结合,建模源领域的有监督损失和目标领域的损失,减小源领域数据和目标领域数据之间的领域差异,实现高性能的领域自适应图像语义分割;使用语义分割网络最后一个全连接层对应的特征构建原型网络;使用JS散度构建一致性正则化损失,使语义分割网络和原型网络的预测值一致;最后构建自训练的第二阶段在源领域和目标领域上总的损失函数,训练出高性能的语义分割网络。本发明专利技术设计的图像语义分割算法基于半监督领域自适应,只需要给目标领域中的少量图像标记语义标签,减少了图像人工标注的工作量。量。量。

【技术实现步骤摘要】
基于一致性正则化与半监督领域自适应图像语义分割算法


[0001]本专利技术涉及一种基于一致性正则化与半监督领域自适应图像语义分割算法,属图像语义分割


技术介绍

[0002]为了实现高精度跨数据集的图像语义分割,近年来有不少图像语义分割算法采用领域自适应减小领域之间的差异。基于领域自适应的图像分割算法的目标是将在大规模标注源数据集的语义分割模型迁移到一个数据集分布不同的,少量标记或者未标记的目标数据集。根据在训练时是否有可利用的目标领域标签,领域自适应算法可以划分为无监督领域自适应算法和半监督领域自适应算法。其中,无监督领域自适应算法在训练时目标领域数据没有标注信息。半监督领域自适应算法在训练模型时可以使用部分标注或者少量标注的目标领域数据。
[0003]在算法性能上,当前基于无监督领域自适应的图像语义分割算法明显落后有监督的图像语义分割算法,主要是因为源领域数据和目标领域数据之间的领域差异。在某些场景中,标注少量目标领域的标签是可行的。因此,相比无监督领域自适应,半监督领域自适应算法的具有更切合实际的前提,具有更好的潜力解决算法在不同数据集上的跨领域泛化问题。
[0004]图像语义分割的任务是预测图像中的每个像元的类别。近年来,基于深度卷积网络的图像语义分割取得了长足的进步。训练一个高性能的语义分割网络,往往需要大量标注数据。由于耗时费力且需要一定的专业知识,人工标注采集大量的像素级别的语义分割标注数据集是相当困难的。因此,准确预测图像中所有像元的类别依然是具有挑战的问题,特别当模型在一个数据集(源领域)上训练,在另一个数据集(目标领域)上预测时。源领域和目标领域存在的差异会使在源领域上训练得到的模型在目标领域上精度有一定下降。

技术实现思路

[0005]本专利技术要解决的技术问题,为了减少数据的标注工作量,解决高精度跨数据集的图像语义分割问题,提出一种基于一致性正则化与半监督领域自适应图像语义分割算法。
[0006]实现本专利技术的技术方案如下,基于一致性正则化与半监督领域自适应图像语义分割算法,所述算法将伪标签学习和一致性正则化结合,建模源领域的有监督损失和目标领域的损失,减小源领域数据和目标领域数据之间的领域差异,实现高性能的领域自适应图像语义分割;使用语义分割网络最后一个全连接层对应的特征构建原型网络;利用样本和原型之间的余弦相似度预测无标签的目标领域样本的类别;使用JS散度(Jensen

Shannon divergence)构建一致性正则化损失,使语义分割网络和原型网络关于无标签的目标领域样本的预测值一致;最后构建自训练的第二阶段在源领域和目标领域上的总的损失函数,训练出高性能的语义分割网络。
[0007]所述算法的训练过程由两个阶段的自训练构成,第一阶段为训练语义分割网络和
生成伪标签,第二阶段为再次训练语义分割网络;(1)训练语义分割网络,使用带有标签的源领域数据集合上的有监督损失训练语义分割网络,直到满足一定次数或模型收敛。
[0008](2)为无标签的目标领域数据集合生成伪标签。
[0009](3)再次训练语义分割网络,充分利用数据集合、和,基于源领域和目标领域上的总损失函数训练出高性能的语义分割网络。
[0010]为带有标记信息的源领域数据集合;为带有标记信息的目标领域数据集合;为无标记信息的目标领域数据集合;其中,、和分别表示对应数据集合中样本的数量;、和分别表示对应像元的特征;和表示对应像元的语义标签;源领域数据集合和目标领域数据集合上预先定义了个类别的标签。
[0011]源领域的有监督损失计算如下:对于数据集合上的任意样本,将语义分割网络在参数下关于样本的预测值表示为维的向量;相应地,语义分割模型关于样本的交叉熵损失表示为:,其中,是向量的第个分量,表示语义分割网络在参数下对样本关于类别的预测概率;是标签的第个分量;从而,参数为的语义分割网络关于的平均交叉熵损失表示为:,其中,为源领域中的样本数量;为上述的交叉熵损失函数。
[0012]目标领域数据的有监督损失计算如下:在参数下,语义分割网络关于的平均交叉熵损失表示为:
[0013]其中,是样本的语义标签;原型网络构建如下:所述原型网络本质上是一个基于余弦相似度的分类器,利用样本和原型之间的余弦相似度预测样本的类别;
对于任意样本,使用参数为的语义分割网络的最后一个全连接层可以提取到的特征为,在带有标签信息的目标领域数据集合上,类别的原型可以如下计算:
[0014]对于无标记信息的目标领域数据集合上的任意样本,样本和原型之间的余弦相似度可以表示为:
[0015]其中,表示特征向量和原型的内积;和表示对应的向量的模。
[0016]使用softmax归一化,原型网络对样本的关于类别的预测概率用公式如下表示:
[0017]其中,exp表示以自然常数e为底的指数函数;,是一个超参数,起平滑作用,其值通过交叉验证设置。
[0018]生成伪标签如下:使用训练好的语义分割网络预测无标记信息的目标领域数据集合的类别标签,即对于任意样本,使用语义分割网络可以得到该样本的伪标签;带有伪标签的目标领域数据集合表示为。
[0019]在参数下,语义分割网络关于带有伪标签的目标领域数据集合的平均交叉熵损失表示为:,其中,是语义分割网络关于样本的预测标签,为无标签的目标领域数据集合中的样本数量。
[0020]所述使用JS散度(Jensen

Shannon divergence)使语义分割网络和原型网络的预测值一致。
[0021]对于任意样本,语义分割网络在参数下关于的预测可表示为维
的向量;原型网络关于的预测可表示为维的向量;将原型网络对样本关于类别的预测概率表示为;为简洁表示,令;使用JS散度,在无标签的目标领域数据集合上的一致性正则化损失如下表示:
[0022]其中,表示KL散度;为无标签的目标领域数据集合中的样本数量。
[0023]自训练的第二阶段在源领域和目标领域上总的损失函数为:
[0024]其中,、和是对应损失项的权重,权重值一般通过交叉验证手工设置;为带有标记信息的源领域数据集合;为带有标记信息的目标领域数据集合;为无标记信息的目标领域数据集合;为参数为的语义分割网络关于的平均交叉熵损失;为无标签的目标领域数据集合上的一致性正则化损失。
[0025]本专利技术的有益效果是,本专利技术设计的图像语义分割算法基于半监督领域自适应,只需要给目标领域中的少数图像标记语义标签,减少了图像人工标注的工作量;本专利技术将自训练和一致性正则化结合,可以缩小下源领域和目标领域之间的差距,有利于提高模型在不同数据集间的泛化性;本专利技术设计的算法可以充分利用的有标签数据和无标签数据。
附图说明
[0026]图1为本专利技术原型网络的构建示意图;图2为本专利技术一致化正则化示意图;图中:1:目标领域中的标记样本,类别A;2:有标记目标领域数据集合中,类别A的原型;3:本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于一致性正则化与半监督领域自适应图像语义分割算法,其特征在于,所述算法将伪标签学习和一致性正则化结合,建模源领域的有监督损失和目标领域的损失,减小源领域数据和目标领域数据之间的领域差异,实现高性能的领域自适应图像语义分割;使用语义分割网络最后一个全连接层对应的特征构建原型网络;利用样本和原型之间的余弦相似度预测无标签的目标领域样本的类别;使用JS散度构建一致性正则化损失,使语义分割网络和原型网络关于无标签的目标领域样本的预测值一致;最后构建自训练的第二阶段在源领域和目标领域上总的损失函数,训练出高性能的语义分割网络;所述算法的训练过程由两个阶段的自训练构成,第一阶段为训练语义分割网络和生成伪标签,第二阶段为再次训练语义分割网络;(1)训练语义分割网络,使用带有标签的源领域数据集合 上的有监督损失训练语义分割网络,直到满足一定次数或模型收敛;(2)为无标签的目标领域数据集合生成伪标签;(3)再次训练语义分割网络,充分利用数据集合、和,基于源领域和目标领域上的总损失函数训练出高性能的语义分割网络;为带有标记信息的源领域数据集合,;为带有标记信息的目标领域数据集合,;为无标记信息的目标领域数据集合;其中,、和分别表示对应数据集合中样本的数量;、和分别表示对应像元的特征;和表示对应像元的语义标签;源领域数据集合和目标领域数据集合上预先定义了种共享的类别标签。2.根据权利要求1所述的基于一致性正则化与半监督领域自适应图像语义分割算法,其特征在于,所述源领域的有监督损失计算如下:对于数据集合上的任意样本,将语义分割网络在参数下关于样本的预测值表示为维的向量;相应地,语义分割模型关于样本的交叉熵损失表示为:,其中,是向量的第个分量,表示语义分割网络在参数下对样本关于类别的预测概率;是标签的第个分量;从而,参数为的语义分割网络关于的平均交叉熵损失表示为:,其中,为源领域中的样本数量;为上述的交叉熵损失函数;
目标领域的有监督损失计算如下:在参数下,语义分割网络关于的平均交叉熵损失表示为:,其中,是样本的语义标签。3.根据权利要求1所述的基于一致性正则化与半监督领域自适应图像语义分割算法,其特征...

【专利技术属性】
技术研发人员:刘伟刘家伟张苗辉余晓霞
申请(专利权)人:华东交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1