当前位置: 首页 > 专利查询>浙江大学专利>正文

基于高斯混合模型和标签矫正模型的噪声标签分割方法技术

技术编号:32013678 阅读:21 留言:0更新日期:2022-01-22 18:31
本发明专利技术公开了一种基于高斯混合模型和标签矫正模型的噪声标签分割方法。该方法包括以下模块:(1)预训练分割模型,可以是任意现有的分割模型;(2)噪声标签鉴定模块,该模块通过分割网络的预测结果与混有噪声标签的原标签比较,区分得到无噪标签和含噪标签,并挑选含噪标签进行标注;(3)标签矫正模块,该模块利用特征相似度选择置信度较高的像素以计算影像的伪标签;(4)置信反向传播模块,考虑到生成的伪标签可能带来新的噪声,该模块仅利用置信度高的伪标签和原始标签对网络进行参数训练。本发明专利技术提供的噪声标签分割方法,有效防止模型对噪声标签过分拟合,能够更准确地实现噪声标签背景下的医学图像感兴趣区域的分割。景下的医学图像感兴趣区域的分割。景下的医学图像感兴趣区域的分割。

【技术实现步骤摘要】
基于高斯混合模型和标签矫正模型的噪声标签分割方法


[0001]本专利技术属于医学图像噪声标签领域,用于处理医学图像中由于各种原因引起的噪声标签问题,具体提出了一种基于高斯混合模型和标签矫正模型的噪声标签分割方法。

技术介绍

[0002]图像分割是医学图像处理分析中的一个重要步骤,是图像处理、计算机视觉领域中的经典问题。医学图像的噪声标签分割一直是医学图像分析领域的一个新兴热点。噪声标签分割具体指训练数据集的标签存在各种噪声,会对模型的训练产生影响,直接导致模型的精度下降。而在实际生活中,因为专家疲惫或者本身较难区分等原因也确实存在部分漏标、错标等现象,噪声标签分割是真实存在的。因此,如何在没有进一步注释的情况下消除噪声标签对分割任务的干扰是一个值得研究的问题与挑战。
[0003]目前,医学图像噪声标签的处理方法主要可分为两大类:基于梯度的以及基于模型结构的。前者基于噪声标签在模型训练过程中往往更加难以拟合这一观点,Ren等人就通过这一想法寻找噪声标签并为这些标签样本分配了较低的权重。而后者则主要对模型结构进行改进,如Goldberger等人设计了一个适应层来模拟潜在真实标签被破坏成嘈杂标签的过程,Jiang等人引入MentorNet来发现“正确的”样本并更多地关注它们,Xue等人设计了一种在线不确定性样本挖掘方法和一种重新加权策略以消除噪声标签的干扰。当然,目前绝大多数研究都集中在分类任务上,因为它是自然图像处理领域中最基本的问题。而分割问题相较于分类问题可以将噪声标签的处理分为两大类:图像级别的以及像素级别的。前者主要为区分带噪声的图片与不带噪声的图片,以Zhu等人的标签质量评估策略为代表;而后者则面向像素点直接纠正,如Zhang等人的置信学习方法通过混淆矩阵的方法寻找可能标记错误的像素点并进行纠正。
[0004]而本专利技术从图像、像素两个级别出发,具体提出了基于高斯混合模型和标签矫正模型的噪声标签分割方法,运用高斯混合模型寻找噪声标签、运用标签矫正模型矫正标签,从而有效较少了噪声标签所带来的精度下降。

技术实现思路

[0005]本专利技术的目的在于针对现有技术的不足,基于高斯混合模型和标签矫正模型的噪声标签分割方法,从而解决了噪声标签背景下的医学图像感兴趣区域的分割问题。本专利技术通过分割模块、高斯混合模型、标签矫正模块、置信反传模块四个模块相结合,实现了噪声标签下的医学图像感兴趣区域的分割。
[0006]本专利技术的基于高斯混合模型和标签矫正模型的噪声标签分割方法,包括以下步骤:
[0007](1)将输入图像和对应的混有噪声标签的原标签分为两个子数据集,对每个子数据集分别进行下述步骤(2)

(6);
[0008](2)根据输入图像和混有噪声标签的原标签进行简单模型预训练,并使用预训练
模型预测输入图像,得到预测分割结果;
[0009](3)计算损失函数,并利用自信预测熵对其进行修正,对修正后的损失函数采用期望最大化(EM)算法拟合高斯混合模型,从而对混有噪声标签的原标签进行聚类,区分得到无噪标签和含噪标签;
[0010](4)对含噪标签使用标签矫正模块:计算输入图像中每个像素的显著度,以及属于目标区域的概率,根据计算结果判断像素点是否属于目标区域,得到输入图像的伪标签;
[0011](5)在训练过程中,采用互补学习策略,将上述两个子数据集训练得到的两个网络互相校对,以剔除确认偏差;
[0012](6)在梯度反向传播阶段,运用置信反向传播模块,仅使用低噪声伪标签和无噪的原标签对网络进行反向传播;
[0013](7)训练结束后,由来自两个网络的模型共同预测测试样本的标签。
[0014]上述技术方案中,优选的,所述的步骤2)为:对输入图像和混有噪声标签的原标签的数据集X={x
(t)
,y
(t)
}
k
运用分割网络训练10

50回合作为预训练模型,并使用预训练模型对输入图像x
(t)
进行预测,得到预测分割结果记做:
[0015][0016]其中,x
(t)
∈R
n
×
m
表示数据集中第t个输入图像,y
(t)
∈N
n
×
m
表示数据集中第t个原标签,m、n为图片长宽像素点个数,k表示数据集样本数量,F表示特征提取器,C为分类器,C(F(
·
))即为预训练模型。其中,所述分割网络可以任意选取,例如UNet、Deeplab等。
[0017]所述的数据集样本数量k约为200

1000个样本,原标签中噪声标签的含量为25%

75%不等。
[0018]上述技术方案中,优选的,所述的步骤3)为:
[0019]采用交叉熵损失对输入图像x
(i)
与标签y
(i)
计算损失函数,根据预测分割结果计算自信预测熵H,利用自信预测熵H修正损失函数,得到最后,运用高斯混合模型对损失函数的集合进行聚类,并根据概率将其分为无噪标签和含噪标签。
[0020]更优选的,所述的步骤3)具体为:
[0021]1)计算损失函数
[0022]损失函数具体采用交叉熵损失,对于输入图像x
(t)
与原标签y
(t)
,其损失函数为:
[0023][0024]式中,为预测分割结果中第i行第j列像素点,为原标签中第i行第j列像素点。
[0025]2)计算网络的自信预测熵:
[0026][0027][0028]式中,c表示类别,为第c个类别的概率,x为输入图片,θ为模型参数;
[0029]最后,计算修正后的损失函数:
[0030][0031]3)区分无噪标签和含噪标签
[0032]对所有损失函数所构成的集合进行归一化,得到归一化后的集合l
pred_noise
,对l
pred_noise
使用期望最大化(EM)算法拟合一个双分量的高斯混合模型。至此,第t个样本标签属于无噪标签和含噪标签的概率为后验概率和
[0033][0034][0035]式中,表示归一化后的集合l
pred_noise
中第t个样本标签所对应的值;
[0036]上述高斯混合模型拟合后得到两个高斯分量,其中,g
small
为均值较小的一个高斯分量,g
large
为均值较大的一个高斯分量。对于每个样本标签,当时,我们判定它为无噪标签;反之,我们认为它是含噪标签,并需要对其重新进行标注。
[0037]优选的,步骤3)中所述的高斯混合模型,具体为:
[0038][0039]优选的,步骤3)中所述EM算法,
[0040]具体为:
[0041]1)计算似然函数
[0042][0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于高斯混合模型和标签矫正模型的噪声标签分割方法,其特征在于,包括如下步骤:(1)将数据集分为两个子数据集,对每个子数据集分别进行下述步骤(2)

(6),所述数据集包括输入图像以及混有噪声标签的原标签;(2)根据数据集进行简单模型预训练,并使用所得的预训练模型预测输入图像,得到预测分割结果;(3)利用损失函数对混有噪声标签的原标签进行聚类,计算出原标签属于无噪标签和含噪标签的概率,进而区分得到无噪标签和含噪标签;(4)对含噪标签使用标签矫正模块:计算输入图像中每个像素的显著度,以及属于目标区域的概率,根据计算结果对图像进行分割,得到输入图像的伪标签;(5)采用互补学习策略,将两个子数据集训练得到的两个网络互相校对,以剔除确认偏差,得到协同细化后的伪标签;(6)梯度反向传播阶段:运用置信反向传播模块,仅使用低噪声伪标签和无噪的原标签对网络进行反向传播;(7)训练结束后,由来自两个网络的训练模型共同预测待分割样本的标签。2.根据权利要求1所述的基于高斯混合模型和标签矫正模型的噪声标签分割方法,其特征在于,所述步骤(1)中两个子数据集不相交。3.根据权利要求1所述的基于高斯混合模型和标签矫正模型的噪声标签分割方法,其特征在于,所述步骤(2)为:对输入图像和混有噪声标签的原标签的数据集X={x
(t)
,y
(t)
}
k
运用现有的分割网络训练10

50回合作为预训练模型,并使用预训练模型对输入图像x
(t)
进行预测,得到预测分割结果其中,x
(t)
表示数据集中第t个输入图像,y
(t)
表示数据集中第t个原标签,k表示数据集样本数量。4.根据权利要求1所述的基于高斯混合模型和标签矫正模型的噪声标签分割方法,其特征在于,所述步骤(3)具体为:(3.1)计算损失函数:对于输入图像x
(t)
与原标签y
(t)
,其损失函数为:式中,为预测分割结果中第i行第j列像素点,为原标签y
(t)
中第i行第j列像素点,m、n为图像长宽像素点个数;(3.2)计算自信预测熵:(3.2)计算自信预测熵:
式中,c表示类别,为第c个类别的概率,x为输入图片,θ为模型参数,为第i行第j列像素点的自信预测熵,H
(t)
为第t个标签的自信预测熵;最后,计算修正后的损失函数:(3.3)区分无噪标签和含噪标签:对所有修正后的损失函数所构成的集合进行归一化,得到归一化后的集合l
pred_noise
,对l
pred_noise
使用期望最大化(EM)算法拟合一个双分量的高斯混合模型,其中均值较小的高斯分量记为g
small
,均值较大的高斯分量记为g
large
;第t个样本标签属于无噪标签和含噪标签的概率为后验概率和和和式中,表示归一化后的集合l
pred_noise
中第t个样本标签所对应的值;对于每个样本标签,当时,判定它为无噪标签;反之,则为含噪标签。5.根据权利要求1所述的基于高斯混合模型和标签矫正模型的噪声标签分割方法,其特征在于,所述步骤(4)的标签矫正模块具体为:...

【专利技术属性】
技术研发人员:童若锋董家骅张月
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1