一种基于半监督神经网络的医学影像处理方法技术

技术编号:38588615 阅读:7 留言:0更新日期:2023-08-26 23:29
本发明专利技术公开了一种基于半监督神经网络的医学影像处理方法,S1、获取图片数据集;S2、构建DFCPS模型并训练,所述DFCPS模型包括数据增强策略和神经网络,所述神经网络包括主干网络、ASPP模块、上采样模块和Softmax函数;所述主干网络采用ResNet

【技术实现步骤摘要】
一种基于半监督神经网络的医学影像处理方法


[0001]本专利技术涉及数据增强、语义分割
,具体指一种基于半监督神经网络的医学影像处理方法。

技术介绍

[0002]在医学方面,为了对病人病情阶段进行全面的诊断去判断器官是否存在病变以及提出相对应的治疗方案,常对病人使用的方法有:DR扫描、CT扫描或者MRI(核磁共振)扫描,得到相应图像后从而交由医生去通过肉眼观察确定病人内部器官的病变情况,在深度学习没有兴起之前,这个过程往往由经验丰富的医生直接观察完成。
[0003]虽然医生肉眼的误诊率低,判断精度较高,但培养满足上述要求的医生需要付出巨大的时间、金钱成本,且医生作为人,会受到情绪波动、长时间工作精力不足等因素的影响,导致了判断精度的不稳定性。因此,为了减小误诊率,辅助医生诊断的医学图像分割应运而生。
[0004]神经网络作为半监督学习中的重要工具,已经在医学图像分割中取得了显著的成果。神经网络能够从大规模图像数据中学习到复杂的特征表示,并通过端到端的训练过程进行优化。然而,在医学图像分割中,由于标注数据的限制和模型的复杂性,仅依靠有限的标注数据进行监督训练的神经网络难以达到令人满意的性能,因此,应对上述问题的神经网络的需求迫在眉睫。
[0005]用于医学图像的自训练是一种半监督学习的方法,它可以利用未标记的数据来通过持续的迭代训练以求改进模型的性能,达到减少标记数据数量的目的。自训练会存在伪标签噪声较高的特点,自训练方法的性能取决于伪标签的质量和可靠性。因此,在选择伪标签时需要谨慎考虑置信度和噪声问题。由于医学解剖结构特点具有相似性,所以带标签的图像可以传递强参考点,用于匹配和信息的迁移到无标签图片。
[0006]一致性学习的核心思想是对原样本进行不同程度的扰动如高斯噪声、颜色改变、随机旋转,模型仍对原样本有着相似的输出。通过一致性学习,模型可以从未标记数据中获得额外的训练信号,并学习到更鲁棒和泛化的特征表示。但是,如果模型没有得到很好的优化并提供了错误的监督信息,那么软标签和真实标签相互冲突的风险就会变得很高。
[0007]如果能解决上述两个问题,对医学图像分割识别进准度可能是一个有效的突破口。

技术实现思路

[0008]针对现有技术的不足,提出一种基于半监督神经网络的医学影像处理方法,通过合理地利用未标记数据和少量标记数据,以及强增强和弱增强的数据增强技术,对模型进行训练并取得理想的结果。
[0009]为了解决上述技术问题,本专利技术的技术方案为:
[0010]一种基于半监督神经网络的医学影像处理方法,包括如下步骤:
[0011]S1、获取图片数据集;
[0012]S2、构建DFCPS模型并训练,所述DFCPS模型包括数据增强策略和神经网络,所述神经网络包括主干网络、ASPP模块、上采样模块和Softmax函数;
[0013]所述主干网络采用ResNet

50,并引入残差连接构建深层网络,所述ASPP模块包括四个卷积层,四个所述卷积层的空洞卷积率分别为1、12、24、36;
[0014]所述DFCPS模型的训练方法为:首先,通过数据增强策略对原始样本X进行两次不同程度的强弱数据增强,生成了两组增强样本,分别为一组是强增强样本,另一组是弱增强样本,强弱增强样本分组组合,其中组合后的强弱增强样本进入到四个神经网络之中进行训练,通过不断优化模型的参数来最小化损失值;
[0015]在训练过程中,模型通过不断优化模型的参数来最小化损失值,防止出现过拟合以及欠拟合的现象,以提高模型的性能和准确性。本专利技术的loss设计在整个神经网络的训练过程涉及两个关键的损失函数:监督损失L
s
和交叉伪监督损失L
cps

[0016]综上所述,整个训练过程中的损失函数主要包括监督损失和交叉伪监督损失。监督损失通过强增强样本与弱增强样本的伪标签之间的比较来指导网络的学习。交叉伪监督损失则通过对不同组之间生成的伪分割图的比较来促使网络在整体上学习更一致的分割结果。这样的训练策略有助于提高模型的性能,并使得网络能够更好地适应不同组的数据和标签。本设计在强弱增强的方法中借鉴了Fixmatch的思想,并对其进行了相应扩展,以适用于医学图像标签分割任务。然而,需要特别注意伪标签的可靠性、准确性和清洁度,因为伪标签的质量直接影响模型的性能和泛化能力。
[0017]为了确保伪标签的质量足够高,本专利技术引入了置信阈值的概念,该阈值在本专利技术中被定义为μ。通过设置置信阈值,模型可以筛选出质量较高的伪标签,从而避免对模型训练产生负面影响。具体而言,我将伪标签的置信度与置信阈值进行对比。如果伪标签的置信度与置信阈值相近,即在0.5附近,就可以忽略不计,因为这样的伪标签可能不够可靠,将伪分割图大于置信阈值μ的部分参与损失计算。对强扩增的样本,输出的预测结果和对应的超过置信阈值的目标弱标记样本的得到的伪分割图同样做交叉熵损失。
[0018]S3、使用训练好的神经网络进行图像分割
[0019]S3

1、将经预处理的数据集作为输入,通过主干网络获取特征图;
[0020]S3

2、将获取的特征图作为输入,通过ASPP模块通过多个并行的分支来实现多尺度的综合特征提取;
[0021]S3

3、将获取的综合特征表示通过上采样技术增加数据细节,通过Softmax函数将模型的输出映射为每个类别的概率,然后根据概率选择最可能的类别作为预测结果,以生成可信度高的预测样本。
[0022]作为优选,所述步骤S1中通过数据增强策略对图片数据进行预处理。
[0023]作为优选,所述数据增强策略包括随机旋转、随机亮度、对比度调整,随机平移。
[0024]作为优选,所述步骤S2中,在训练时,每组用于强弱增强的神经网络共享参数和权重,每组中由弱增强后经神经网络输出的预测结果生成的伪标签作为每个样本的强增强样本预测的目标。
[0025]作为优选,所述步骤S2中,在训练过程中,引入监督损失为L
s
利用强增强样本和弱增强样本的信息来指导DFCPS模型的学习过程,具体而言,利用强增强样本通过神经网络生
成的预测结果与相应的弱增强样本的伪标签之间的差异来计算监督损失,进而迭代模型参数。
[0026]上述技术方案中,监督损失L
s
是通过将弱增强样本生成的伪标签作为强增强样本的目标而产生的。具体而言,利用强增强样本通过神经网络生成的预测结果与相应的弱增强样本的伪标签之间的差异来计算监督损失。这样做的目的是让网络学习从弱增强样本到强增强样本的映射关系,以提高模型在强增强样本上的预测准确性。通过最小化监督损失,鼓励网络学习正确的分割目标。
[0027]作为优选,所述步骤S2中,训练过程设计引入了交叉伪监督损失L
cps
使得不同组弱监督版本的样本生成的伪标签之间会相互约束。...

【技术保护点】

【技术特征摘要】
1.一种基于半监督神经网络的医学影像处理方法,其特征在于,包括如下步骤:S1、获取图片数据集;S2、构建DFCPS模型并训练,所述DFCPS模型包括数据增强策略和神经网络,所述神经网络包括主干网络、ASPP模块、上采样模块和Softmax函数;所述主干网络采用ResNet

50,并引入残差连接构建深层网络,所述ASPP模块包括四个卷积层,四个所述卷积层的空洞卷积率分别为1、12、24、36;所述DFCPS模型的训练方法为:首先,通过数据增强策略对原始样本X进行两次不同程度的强弱数据增强,生成了两组增强样本,分别为一组是强增强样本,另一组是弱增强样本,强弱增强样本分组组合,其中组合后的强弱增强样本进入到四个神经网络之中进行训练,通过不断优化模型的参数来最小化损失值;S3、使用训练好的神经网络进行图像分割S3

1、将经预处理的数据集作为输入,通过主干网络获取特征图;S3

2、将获取的特征图作为输入,通过ASPP模块提取特征并进行融合得到综合特征;S3

3、将获取的综合特征表示通过上采样技术增加数据细节,通过Softmax函数将模型的输出映射为每个类别的概率,然后根据概率选择最可能的类别作为预测结果,以生成可信度高的预测样本。2.根据权利要求1所述的一种基于半监督神经网络的医学影像处理方法,其特征在于,所述数据增强策略用于对图片数据进行预处理。3.根据权利要求2所述的一种基于半监督神经网络的医学影像处理方法,其特征在于,所述数据增强策略包括随机旋转、随机亮度、对比度调整,随机平移。4.根据权利要求1所述的一种基于半监督神经网络的医学影像处理方法,其特征在于,所述步骤S2中,在训练时,每组用于强弱增强的神经网络共享参数和权重,每组中由弱增强后经神经网络输出的预测结果生成的伪标签作为每个样本的强增强样本预测的目标。5.根据权利要求4所述的一种基于半监督神经网络的医学影像处理方法,其特征在于,所述步骤S2中,在训练过程中,引入监督损失为L
s
利用强增强样本和弱增强样本的信息来指导DFCPS模型的学习过程。6....

【专利技术属性】
技术研发人员:陈一飞黄凡丁刘敏哲林彬秦飞巍
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1