一种基于超像素和多样性的主动学习医学图像分割方法技术

技术编号:37144418 阅读:10 留言:0更新日期:2023-04-06 21:54
本发明专利技术公开了一种基于超像素和多样性的主动学习医学图像分割方法,包括以下步骤;将医学图像数据集中的图像拆分成固定尺寸的小样本,构建已标注的样本池和未标注的样本池;建立医学图像分割模型和相似度评估模型,设置主动学习策略中需要的标注预算;构建基于信息量和差异性的主动学习策略,评估未标注池中的样本,筛选出最有价值的未标注样本,由专家标注后加入已标注样本池,扣除标注预算,迭代训练;更新医学图像分割模型参数,迭代主动模型直至标注预算归零;对缺少标注的样本进行分割。本发明专利技术克服传统主动学习查询方法只关注样本信息量的缺陷,增加了样本之间关系的度量,在使用少量有标注样本的情况下进一步提高医学图像分割准确度。学图像分割准确度。学图像分割准确度。

【技术实现步骤摘要】
一种基于超像素和多样性的主动学习医学图像分割方法


[0001]本专利技术属于人工智能与计算机视觉
,具体涉及一种基于超像素和多样性的主动学习医学图像分割方法。

技术介绍

[0002]近年来,随着人工智能技术在医学领域广泛应用,越来越多的医学图像分析过程融入计算机视觉分析的技术方法,基于主动学习的医学图像分割引起了很多关注。全监督的深度学习方法传统上依赖大量且样本分布均匀的精确标注数据,通过主动学习方法,可以划分出未标注数据的关键样本和冗余样本,大幅度提高标注效率,增加可用数据。
[0003]目前基于主动学习的医学影像分割方法主要存在以下问题:1.未标注样本池通过基于区域的方法构建,样本中会出现冗余信息;2.查询策略仅考虑模型对未标记样本分割结果的效果,并未考虑多个样本间的关系。
[0004]目前基于主动学习的医学图像分割方法只度量模型对样本的不确定度,忽略了未标注样本的多样性,且在构建样本时往往通过基于区域的方式,将医学图像裁剪为固定尺寸的不重叠区域,导致样本包含更多冗余信息的同时也影响分割模型的最终效果。
[0005]在现有基于主动学习的医学影像处理方法中,如面向医疗图像分割的联邦学习方法及系统、设备和介质(公开号CN114140478A)的专利申请,对样本的度量往往只考虑样本自身的信息量,即模型是否能准确识别出样本,此类方法缺少多个样本间关系的构建,导致主动学习查询难以获得分布外样本。

技术实现思路

[0006]为了克服上述现有技术存在的不足,本专利技术的目的在于提供一种基于超像素和多样性的主动学习医学图像分割方法,通过图像具有的先验信息划分未标注样本,减少随机划分冗余的同时,提高重要样本占有总量;同时引入样本多样性机制,克服传统主动学习查询方法只关注样本信息量的缺陷,增加了样本之间关系的度量,解决了现有技术中存在的问题,在使用少量有标注样本的情况下进一步提高医学图像分割准确度。
[0007]为了实现上述目的,本专利技术采用的技术方案是:
[0008]一种基于超像素和多样性的主动学习医学图像分割方法,包括以下步骤;
[0009]S1,将医学图像数据集中的图像拆分成固定尺寸的小样本,构建已标注的样本池和未标注的样本池;
[0010]S2,建立医学图像分割模型和相似度评估模型,设置主动学习策略中需要的标注预算;此步骤需要建立医学图像分割模型和相似度评估模型,设置主动学习策略中需要的标注预算,标注预算在主动学习过程中会逐步消耗,在标注预算消耗至零后,主动学习迭代终止;
[0011]S3,构建基于信息量和差异性的主动学习策略,评估S1中未标注池中的样本,筛选出最有价值的未标注样本,由专家标注后加入已标注样本池,扣除标注预算,迭代训练,更
新医学图像分割模型参数,迭代主动模型直至标注预算归零;
[0012]S4,使用更新迭代后的医学图像分割模型,对缺少标注的样本进行分割。
[0013]所述步骤S1中,医学图像样本池中包含已标注池和未标注样本池
[0014][0015]其中,为已标注的样本池,I
i
表示有标注的第i张样本,L
i
表示I
i
对应的标注图;是未标注的医学图像样本集合,u={U1,U2,

},U
j
表示第j张未标注的样本。
[0016]所述步骤S1,具体为:
[0017]S11,对已标注的图像样本进行拆分,得到训练模型的小尺寸样本,构成已标注样本池;对于一副已标注图像I和对应标注L,按照统一方式划分图像和样本成若干个不重叠的宽为w高为h的小区域这些小样本组成已标注样本池
[0018]S12,对未标注的图像进行拆分,通过超像素算法,得到在颜色、纹理方面具有类似特征的多个小区域,根据区域中心位置以及固定的宽w高h,将图像划分为固定尺寸的多个小样本{U1,U2,

},所有未标注小样本构成了整个未标注样本池
[0019]所述步骤S2,具体为:
[0020]S21,构建医学图像分割模型M,由压缩信息提取特征的编码器E和恢复尺度的解码D构成,医学图像分割模型M用于对未标注的医学图像样本进行分割,需要经过多次主动学习迭代才能获得精确的分割结果;在主动学习迭代中,医学图像分割模型M参与两个主要过程,第一个过程为模型训练,输入为有标注的医学图像样本,输出分割结果,计算分割结果与标注的损失函数,反向传播优化模型参数;第二个为模型推理,输入无标注的医学图像样本,得到分割结果;
[0021]S22,构建相似度评估模型Model
sim
,模型Model
sim
输入为两个样本,输出样本的相似性距离,通过求取一个样本与其他所有样本的相似性距离,计算得到此样本对整体样本池的代表性分数,用于计算样本的多样性;
[0022]S23,设置标注预算Budget,标注预算是判断主动学习迭代是否终止的重要条件,每一轮主动学习的迭代中,都会通过专家标注的方式增加已标注样本数量,每次会扣除一定的标注预算Budget,当标注预算Budget消耗至零时,主动学习迭代停止,得到最终的医学图像分割模型。
[0023]所述步骤S3,具体按照以下步骤进行:
[0024]S31,使用已标注样本池的数据训练,在主动学习策略中,医学图像分割模型M经过t次主动学习迭代,记作M
t
,未经过主动学习迭代训练的模型,记作M0;
[0025]S32,使用已训练好的模型,对未标注池中的所有样本做推理,得到样本分割概率图集合和分割结果图集合和分割结果图集合
[0026]S33,在得到所有未标注样本的概率图和分割结果图后,通过信息量查询函数Query
info
(
·
)对样本进行评估;Query
info
(
·
)通过分割概率图和结果图计算来实现,对未标注样本U
i
的查询如式所示:
[0027]Query
info
(U
i
)=Q
class
(Y
i
)
×
Q
uncertainy
(P
i
)
[0028]Q
class
(Y
i
)=Σ
c∈C
I
c
(Y
i
)
[0029][0030]其中,U
i
指第i个未标注样本,Y
i
和P
i
分别是对应的分割结果图和概率图,Q
class
(Y
i
)指样本U
i
的类别分数,C是样本分割图上的总类别数,x表示位置,I_c(
·
)是指示函数,Y
i
(x)表示分割图Y
i
在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于超像素和多样性的主动学习医学图像分割方法,其特征在于,包括以下步骤;S1,将医学图像数据集中的图像拆分成固定尺寸的小样本,构建已标注的样本池和未标注的样本池;S2,建立医学图像分割模型和相似度评估模型,设置主动学习策略中需要的标注预算;S3,构建基于信息量和差异性的主动学习策略,评估S1中未标注池中的样本,筛选出最有价值的未标注样本,由专家标注后加入已标注样本池,扣除标注预算,迭代训练,更新医学图像分割模型参数,迭代主动模型直至标注预算归零;S4,使用更新迭代后的医学图像分割模型,对缺少标注的样本进行分割。2.根据权利要求1所述的一种基于超像素和多样性的主动学习医学图像分割方法,其特征在于,所述步骤S1中,医学图像样本池中包含已标注池和未标注样本池和未标注样本池其中,为已标注的样本池,I
i
表示有标注的第i张样本,L
i
表示I
i
对应的标注图;是未标注的医学图像样本集合,U
j
表示第j张未标注的样本。3.根据权利要求1所述的一种基于超像素和多样性的主动学习医学图像分割方法,其特征在于,所述步骤S1,具体为:S11,对已标注的图像样本进行拆分,得到训练模型的小尺寸样本,构成已标注样本池;对于一副已标注图像I和对应标注L,按照统一方式划分图像和样本成若干个不重叠的宽为w高为h的小区域这些小样本组成已标注样本池S12,对未标注的图像进行拆分,通过超像素算法,得到在颜色、纹理方面具有类似特征的多个小区域,根据区域中心位置以及固定的宽w高h,将图像划分为固定尺寸的多个小样本{U1,U2,

},所有未标注小样本构成了整个未标注样本池4.根据权利要求1所述的一种基于超像素和多样性的主动学习医学图像分割方法,其特征在于,所述步骤S2,具体为:S21,构建医学图像分割模型M,由压缩信息提取特征的编码器E和恢复尺度的解码D构成,医学图像分割模型M用于对未标注的医学图像样本进行分割,需要经过多次主动学习迭代才能获得精确的分割结果;在主动学习迭代中,医学图像分割模型M参与两个主要过程,第一个过程为模型训练,输入为有标注的医学图像样本,输出分割结果,计算分割结果与标注的损失函数,反向传播优化模型参数;第二个为模型推理,输入无标注的医学图像样本,得到分割结果;S22,构建相似度评估模型Model
sim
,模型Model
sim
输入为两个样本,输出样本的相似性距离,通过求取一个样本与其他所有样本的相似性距离,计算得到此样本对整体样本池的代表性分数,用于计算样本的多样性;S23,设置标注预算Budget,标注预算是判断主动学习迭代是否终止的重要条件,每一轮主动学习的迭代中,都会通过专家标注的方式增加已标注样本数量,每次会扣除一定的
标注预算Budget,当标注预算Budget消耗至零时,主动学习迭代停止,得到最终的医学图像分割模型。5.根据权利要求1所述的一种基于超像素和多样性的主动学习医学图像分割方法,其特征在于,所述步骤S3,具体按照以下步骤进行:S31,使用已标注样本池的数据训练,在主动学习策略中,医学图像分割模型M经过t次主动学习迭代,记作M
t
,未经过主动学习迭代训练的模型,记作M0;S32,使用已训练好的模型,对未标注池中的所有样本做推理,得到样本分割概率图集合和分割结果图集合和分割结果图集合S33,在得到所有未标注样本的概率图和分割结果图后,通过信息量查询函数Query
info
(
·
)对样本进行评估;Query
info
(
·
)通过分割概率图和结果图计算来实现,对未...

【专利技术属性】
技术研发人员:张亮华聪李约瀚朱光明沈沛意
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1