System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种利用像素权重提高伪标签置信度的半监督医学图像分割方法技术_技高网

一种利用像素权重提高伪标签置信度的半监督医学图像分割方法技术

技术编号:41276990 阅读:3 留言:0更新日期:2024-05-11 09:29
本发明专利技术提出了一种利用像素权重提高伪标签置信度的半监督医学图像分割方法,包括下述步骤:采集2D磁共振成像医学图像;对图像进行裁剪,缩放,过滤处理,并添加随机扰动;为每个样本添加一个像素权重矩阵,将带有不同扰动的图片分别放入教师模型和学生模型中,让两个模型进行协同训练,直至收敛。本算法在mean‑teacher模型的基础上,使用伪标记图像结合标记图像来更新分割模型,并将教师和学生模型输出的置信度矩阵进行融合对比从而生成更高质量的伪标签。另为每一个图像添加一个像素权重矩阵,训练时更加关注分割有争议的部分,像素权重矩阵通过两个模型输出的概率分布和置信度矩阵来进行更新。本方法使用少量标注数据训练出分割模型。

【技术实现步骤摘要】

本方法属于计算机视觉领域,涉及医学图像处理领域,主要用于半监督医学图像分割。该方法可以在只有少量标注数据的情况下,利用未标注数据进行模型训练,提高分割性能和鲁棒性。


技术介绍

1、基于深度学习的磁共振成像(mri)目标快速分割方法近年来变得越来越流行。一般来说,深度学习方法在医学图像分割任务中的成功依赖于大量的标记数据。数据标注耗时耗力的问题是医学图像分割任务中的一大挑战。这顶工作的目的是使用少量标记数据和大量未标记数据,使用基于半监督学习的方法来增强mr图像的分割。

2、然而,目前深度学习中占主导地位的半监督学习方法包括、一致性正则化、伪标签、深度协同训练。在最近提出的方法中,基于一致性的正则化和伪标签学习方法已被普遍认为是提高半监督模型性能的有效方法。伪标签技术是为未标记图像分配伪注释,然后使用伪标记图像结合标记图像来更新分割模型。伪标记通常以迭代方式实现,因此该模型可以迭代地提高伪注释的质量。伪标签的质量是伪标签策略的主要约束。基于扰动不应改变模型输出的假设,一致性学习通过在不同扰动下强制输入图像的预测不变并将决策边界推向低密度区域来广泛应用。tarvainen等人提出mean-teacher架构,该架构基于一致性原则利用教师和学生两个模型协同进行训练,让教师模型在无标签数据上对学生模型进行监督和指导,从而提高学生模型的准确率和泛化能力。然而教师模型和学生往往会过早收敛到一致,退化为自训练模型,并在训练过程中从扰动的输入中产生低置信度的伪标签。因此如何保持模型之间的差异并同时提高生成伪标签的质量成为提高模型性能的关键。

3、基于目前现状,我们提出一种面向半监督图像分割利用像素权重来让模型关注不同的区域并使用置信度对比来提高伪标签置信度的协同均值教师模型,在协同均值教师(mean-teacher)和伪标签方法的基础上加入了伪标签置信度增强和像素权重关注。伪标签置信度增强是通过将教师模型和学生模型生成的伪标签的置信度矩阵进行融合,生成新的伪标签。像素权重关注是为每个原始图像设计一个初始权重w0,在训练过程中通过进行伪标签对比,把分类有差异的像素对应的权重进行更新,让模型更加关注需重点关注的目标区域。

4、本专利技术综合以上思想,对磁共振成像(mri)医学图像目标进行分割,调研中发现,基于半监督学习并利用像素权重提高伪标签置信度的本专利技术具有创新性和原创性。


技术实现思路

1、本专利技术所要解决的技术问题是提供一种利用像素权重提高伪标签置信度的半监督医学图像分割方法,本分割方法利用少量有精准标注的样本和大量无标注的样本共同进行训练性能更高的分割模型,可以有效的减小对有精准标注样本的依赖。

2、本专利技术所提出的半监督分割模型(模型结构图见图1),首先需将原始得2d磁共振成像(mri)医学图像调整为224×224像素大小,用于推理,而输出则恢复为原始大小用于评估。对于每个无标记的样本进行两种不同的数据增强(image augmentation),得到两个扰动样本(perturbed samples),分别输入到学生模型和教师模型中,并对教师模型添加噪声(noise)。这样可以使两个模型对同一个样本产生不同的视角和表达。并为每个样本添加一个像素权重矩阵wi,它的作用是在引导模型关注更需关注的领域。像素权重矩阵初始值全设置为λ,λ为0~1之前的一个常数。下面定义一下本专利技术中使用的符号:训练集d={dl,du},其中表示有标签数据集,表示无标签数据集,xi表示第i有标记图像,xj表示第j个无标记图像,yi是有标记样本的真实标签,n代表有标记图像的数量,m代表无标记图像的数量。

3、预处理后的数据样本和像素权重矩阵作为模型的初始输入。学生模块和教师模块均采用vit作为模型的结构,两者的结构相同,方便于教师模块通过指数移动平均从学生模块中获得当前模型的参数并进行更新。学生模块和教师模块对输入图像分别输出一个概率分布s(x),t(x)。学生模型输出的伪标签ps与真实的标签计算监督损失(使用交叉熵损失)lsup,然后再与教师模型输出的伪标签pt计算半监督一致性损失(使用相容性损失)lsemi。总的损失函数其中λ是权重因子。学生模型通过总的损失函数来更新模型的参数。然后,根据学生模型更新后的参数和指数移动平均方法(ema),更新教师模型的参数。教师模型参数的更新公式为:

4、

5、其中,表示上一轮迭代教师模型的参数,表示更新后的教师模型参数,θt表示学生模型的参数。α是一个接近于1的常数,用于控制教师模型的更新速度。α越大,表示教师模型越保留之前的信息,越平滑;α越小,表示教师模型越快地跟随学生模型的变化,越灵敏。

6、教师模型的参数通过衰减系数α进行更新。这样可以使教师模型保持一个长期的平均状态,而不是随着学生模型的波动而波动。这样的指数移动平均更新方式可以使得教师模型更加稳定和鲁棒,避免受到学生模型的噪声或者过拟合的影响。

7、因为添加了像素权重矩阵,把像素权重矩阵中的值作为一个因子输入到模型中,在计算损失函数时用像素权重矩阵中的值作为权重乘以每个像素的损失值,从而增大或减小某些像素对总损失的贡献。这样可以让模型根据像素权重优化自己的参数,并在训练时使用这一信息。添加权重后的监督损失函数为:

8、

9、其中:n代表有标记图像的数量,li表示像素样本i预测结果的交叉熵损失值,交叉熵对比了模型的预测结果和数据的真实标签,随着预测越来越准确,交叉熵的值越来越小,如果预测完全正确,交叉熵的值就为0;yi表示像素点i的label,正类为1,负类为0。pi表示像素i预测为正类的概率,ωi表示像素点i的权重。

10、教师模型和学生模型输出的伪标签之间计算相容性性损失,相容性损失(consistency loss)衡量的是学生模型和教师模型对同一个未标记数据的输出结果之间的差异。相容性损失可以使用均方误差(mean squared error)或者均方对数误差(meansquared logit error)来计算。相容性损失越小,表示学生模型和教师模型越一致,也就是说学生模型越接近教师模型。相容性损失函数为:

11、lsemi=d(s(x),t(x))

12、其中,d表示两个概率分布之间的距离度量函数,使用均方误差来计算。s(x),t(x)分别表示学生模型和教师模型输出的概率分布。

13、总的损失函数为:

14、

15、其中γ(t)是权重因子,通常由时间相关的高斯预热函数定义(由yu等人在2019年提出):其中ti表示当前训练迭代,ttotal是总迭代次数。这样可以使模型在训练初期更多的依赖有精确标注的数据,提高模型性能。

16、像素权重更新的方法使用学生和教师输出的伪标签ps和pt进行像素对比,当伪标签在该像素下的预测类别不同时,将伪标签中像素分类不同的像素对应的像素权重增加,更新权重矩阵w′i。像素权重更新公式如下:

17本文档来自技高网...

【技术保护点】

1.一种利用像素权重提高伪标签置信度的半监督医学图像分割方法,其特征在于包括如下步骤:

【技术特征摘要】

1.一种利用像素权重提高伪标签置信度的半监督...

【专利技术属性】
技术研发人员:李建强李瑞琪刘博汪婧懿
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1