一种医学图像分割中的难样本处理算法制造技术

技术编号:38814378 阅读:17 留言:0更新日期:2023-09-15 19:53
本发明专利技术提供一种医学图像分割中的难样本处理算法,包括以下步骤:对待分割的医学图像进行预处理,通过标签得到前景与背景,将前景作为正样本,背景作为负样本;利用基于对比学习的医学图像分割网络模型以及后处理算法对医学图像数据集进行训练;利用难样本召回损失函数和非侵入目标区域Cutout算法对图像中的难样本进行特殊的处理。难样本召回损失函数能够关注到难样本下的小目标区域并有效定位,非侵入目标区域Cutout算法能够在保证待分割区域不被侵入受损的前提下,减少冗余区域的特征像素,减轻模型对于冗余区域的分割压力,从而提升模型的可靠性,在一定程度上解决了心脏医学图像数据集中难样本的分割问题,更好地提高心脏医学图像分割的准确性。心脏医学图像分割的准确性。心脏医学图像分割的准确性。

【技术实现步骤摘要】
一种医学图像分割中的难样本处理算法


[0001]本专利技术涉及一种医学图像分割中的难样本处理算法,属于医学图像处理领域。

技术介绍

[0002]在面对图像语义分割的任务时,可以按照学习的难度进行区分,训练集可以分为难样本和简单样本。难样本一般是难以学习的样本,对应着不平衡样本,一般表现为损失函数的值较大以及分割出来的样本各类指标较差。在建立模型的时候,如果难样本在训练集中占据比例很小,那么它们对于损失函数和梯度下降贡献都比较小,所以损失函数需要对这些不同的困难样本有着不同的特殊处理,例如权重分配、系数等。对于心脏MRI图像来说,从设备的角度上显示的图像是扫描断层,所以一定会存在扫描层的最后几张图像,这些图像一般是心脏的尖端,待分割区域会表现的很小。对于心脏MRI图像的难样本的定义是像素级难样本。
[0003]解决难样本问题的具体思路有着较多的方法。其中包括(1)难样本数据增强。难样本数据增强有两点好处,第一和上面的扩大数据量一致,使得难样本绝对数量增加;第二是可以缩小简单样本和难样本比例,使得每个batch,难样本对梯度影响更大,训练效果偏向于难样本。(2)损失函数的改进。所有应对难样本的损失函数改进核心出发点是增大损失函数大的样本对梯度的贡献。可以选择减少其他样本的权重或对难样本进行特殊项处理等。例如Focal Loss在损失函数上就可以使得难样本在损失函数中贡献更大,从而使得训练效果对难样本学的更好。(3)在线难样本挖掘策略。在线难样本挖掘策略核心思想是,训练模型的过程中,每过几个epoch,计算每个样本的损失函数的值,然后加入更多的难样本。实际中除了训练数据外还有一个数据池,用于存放额外的数据,并用来筛选难样本的数据池。当然也可以采用一种类似于重采样的做法,训练中的数据和和数据池中的数据一样,每次从数据池中选择难样本放入训练中的数据集中,用于最终的训练。

技术实现思路

[0004]本专利技术目的是提供一种医学图像分割中的难样本处理算法,解决了存在难样本的心脏MRI图像数据集中的难以分割目标区域的问题。
[0005]为实现上述目的,本专利技术提供了一种医学图像分割中的难样本处理算法,包括以下步骤:
[0006]步骤1:划分数据集,将数据集按照4:3:3划分为训练集、验证集和测试集;
[0007]步骤2:确定正样本为待分割区域,负样本为背景,确定数据集中待分割区域较小的样本图像为难样本;
[0008]步骤3:利用非侵入目标区域Cutout算法预处理方法对分割的MRI图像进行数据扩增处理,获得与待分割区域相关度高的初始的训练模型;将得到的裁剪之后的图像,划分数据集,得到训练集数据、验证集数据和测试集数据;
[0009]步骤4:将基于对比学习的医学图像分割网络的损失函数部分加入难样本召回损
失函数,并利用所述医学图像分割网络对所述MRI图像数据集进行训练,获得最终的训练模型;如果训练任务中存在半监督任务或者其他下游任务中,在基于自训练的框架下,利用伪标签对无标签的数据集进行训练并获得最终的训练模型。
[0010]作为本专利技术的进一步改进,所述步骤3具体包括:
[0011]步骤31:通过非侵入目标区域的Cutout算法确定训练集中的最近切割点,所述最近切割点由所有训练集的待分割区域中面积最大的一块决定的,是该区域中距离图像边缘最近的点;
[0012]步骤32:以最近切割点为顶点,与图像边缘一起形成矩形,不侵入前景区域,对所述的矩形进行切割,剩余部分即为经非侵入目标区域Cutout算法得到的增强数据;
[0013]步骤33:将切割后的训练集放入所述初始的训练模型中训练,让所述初始的训练模型在不影响模型学习待分割区域的位置信息和特征纹理的情况下,减少对冗余区域的特征的学习。
[0014]作为本专利技术的进一步改进,所述步骤4中的所述难样本召回损失函数如下所示:
[0015][0016]其中,TP代表了被模型预测正确的正样本,FN代表了被模型预测错误的正样本。
[0017]作为本专利技术的进一步改进,所述步骤4还包括:
[0018]在使用难样本召回损失函数时,当正样本为小目标时,通过二值交叉损失函数与难样本损失函数相加,共同指导模型梯度下降,所述难样本召回损失函数与所述二值交叉损失函数的结合公式如下所示:
[0019]L
total
=L
BCE
+L
Recall

[0020]其中,L
BCE
代表二值交叉损失函数,L
Recall
代表难样本召回损失函数。
[0021]与现有技术相比,本专利技术的医学图像分割中的难样本处理算法,关注到难样本下的小目标区域并有效定位,通过非侵入目标区域Cutout算法在保证待分割区域不被侵入受损的前提下,减少冗余区域的特征像素,减轻模型对于冗余区域的分割压力,从而提升模型的可靠性,在一定程度上解决了心脏医学图像数据集中难样本的分割问题,更好地提高心脏医学图像分割上的准确性。
附图说明
[0022]图1是本专利技术一具体实施例中非侵入目标区域Cutout算法流程示意图。
[0023]图2是本专利技术一具体实施例中医学图像分割中的难样本处理算法流程示意图。
[0024]图3是本专利技术一具体实施例中难样本召回损失函数和非侵入目标区域Cutout算法的网络结构框图。
具体实施方式
[0025]为了使本专利技术的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本专利技术进行详细描述。
[0026]一种医学图像分割中的难样本处理算法,其中非侵入目标区域Cutout算法如图1,包括以下步骤:
[0027]S1、划分数据集,将数据集按照4:3:3划分为训练集、验证集和测试集;
[0028]S2、确定正样本为待分割区域,负样本为背景,确定数据集中待分割区域较小的样本图像为难样本。
[0029]S3、利用非侵入目标区域Cutout算法预处理方法对分割的心脏医学图像进行数据扩增处理,Cutout算法不侵入目标区域,不会对待分割区域的特征产生影响,能够有效地减少冗余的背景区域的不相关特征,更加容易获得更好的与待分割区域相关的模型。将得到的裁剪之后的图像,划分数据集,得到训练集数据、验证集数据和测试集数据;
[0030]S31、遍历所有训练数据集,结合标签,确定最近切割点。最近切割点的目的在于最大限度地防止目标区域被分割矩形选中从而导致待分割区域被Cutout算法所切割,减小待分割区域特征像素占总体图像特征像素的比例。
[0031]S32、以切割点为顶点,并且找到离切割点最近的图像顶点做矩形,对数据集中的样本进行非侵入目标区域Cutout切割。
[0032]S33、将切割后的训练集放入所述初始的训练模型中训练,让所述初始的训练模型在不影响模型学习待分割区域的位置信息和特征纹理的情况下,减少对冗余区域的特征的学习。
[0033]难样本召本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医学图像分割中的难样本处理算法,应用于对特定组织结构MRI图像中的难样本进行分割,其特征在于,包括以下步骤:步骤1、划分数据集,将数据集按照4:3:3划分为训练集、验证集和测试集;步骤2、确定正样本为待分割区域,负样本为背景,确定数据集中待分割区域较小的样本图像为难样本;步骤3、利用非侵入目标区域Cutout算法预处理方法对待分割的MRI图像进行数据扩增处理,获得与待分割区域相关度高的初始的训练模型;将得到的裁剪之后的图像,划分数据集,得到训练集数据、验证集数据和测试集数据;步骤4、将基于对比学习的医学图像分割网络的损失函数部分加入难样本召回损失函数,并利用所述医学图像分割网络对所述MRI图像数据集进行训练,获得最终的训练模型;如果训练任务中存在半监督任务或者其他下游任务中,在基于自训练的框架下,利用伪标签对无标签的数据集进行训练并获得最终的训练模型。2.根据权利要求1所述的医学图像分割中的难样本处理算法,其特征在于,所述步骤3具体包括:步骤31、通过非侵入目标区域的Cutout算法确定训练集中的最近切割点,所述最近切割点由所有训练集的待分割区域中面积最大的一块决定的,是该区域中距离图像边缘最近的点;步...

【专利技术属性】
技术研发人员:朱恩嵘胡晓飞赵昊宸吴佳芸
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1