用于甲状腺超声图像分割的数据集智能增强方法技术

技术编号:32822711 阅读:59 留言:0更新日期:2022-03-26 20:20
本发明专利技术公开一种用于甲状腺超声图像分割的数据集智能增强方法,通过针对原始甲状腺超声数据集和专家标注好的标签进行智能数据增强,构建一个完整的初始数据集;然后确定全部的数据增强算法,从数据增强算法中自动随机选取两种构成1对组合方法,再自动随机选4对组合方法构成一种规划,使用全部的规划构成规划域,从规划域中自动选取一种规划的增强数据集,并训练子分割网络得到验证平均交并比,以得到的平均交并比作为激励更新构建并完成初始化的LSTM控制器,直至控制器训练完成;训练后,选取最优的5种规划,并将5种规划中所包含的全部20种方法对构成最终规划方案,使用最终规划方案得到智能增强数据集。规划方案得到智能增强数据集。规划方案得到智能增强数据集。

【技术实现步骤摘要】
用于甲状腺超声图像分割的数据集智能增强方法


[0001]本专利技术涉及对超声医疗图像的识别与处理领域,具体而言涉及深度学习和医疗图像交叉领域的图像增强技术,更具体地涉及一种用于甲状腺超声图像分割的数据集智能增强方法。

技术介绍

[0002]随着医疗设备的不断发展,超声成像仪器因为其无创性、实时性、操作方便、价格便宜等诸多优势,使其成为临床上应用最为广泛的医疗设备工具之一。甲状腺对人类健康的影响日益增大,超声技术是公认的适合做检查的技术。甲状腺超声图像是一种在临床中常见的医学图像技术,对甲状腺超声图像的有效分割可以为医生在临床中的诊断提供大量的有效信息。
[0003]深度学习是一种通过深度神经网络模型利用海量数据来学习这些数据规律的方法。通常需要利用海量数据对含有数以百万计参数的深度网络进行训练,以得到可以更好反映出数据集中各样本与训练目标间映射关系的模型。在医学图像技术和深度学习结合中,实现医学图像的精确分割是极具实际意义的。精确的分割可以为临床医疗提供大量目标区域的精确形状信息,以辅助专业医师出具诊断结果。
[0004]深度学习的出现使得在分割甲状腺超声图像时摆脱专业医师繁重的工作成具有了可行性。但是,甲状腺超声图像的获取和标注过程仍高度依赖于医生的技能和经验、耗时、耗力,这与深度学习网络训练所需的海量数据相矛盾。在实际应用时,使用有限的甲状腺超声样本训练的深度学习分割网络往往效果较差。集成或改进常见深度学习和传统机器学习方法,以应对利用有限超声图像进行甲状腺分割问题,在国内外已经取得了一些研究成果,但针对智能图像增强以从本质上提升分割网络性能的研究仍存在大量的研究空间。在深度学习图像分割领域中,数据集增强技术是针对图像的应用场合,根据数据集中图像的特点,从而获得数据量更充足、图像更清晰、样本更丰富的数据集,以提高深度学习泛化能力的图像处理技术。数据集增强技术中通常包含裁切、翻转、滤波去噪、随机裁切、亮度调整、对比度调整等方法。现阶段的数据集增强技术主要以人为手动设计为主,设计过程会根据工程经验选择、结合部分数据集增强方法,很难做到最大程度上保证数据集的丰富性和充足性。
[0005]因此,提出一种用于甲状腺超声图像分割的数据集智能增强方法,对有限的甲状腺超声图像数据集进行智能增强,以增加原始数据集中样本的数据量和多样性,从本质上提高数据集的质量、提升甲状腺超声图像智能分割的性能,方便后续人员对超声图像的使用,是现在市场上亟待解决的一项技术问题。

技术实现思路

[0006]为了解决现有技术中存在的不足,本专利技术的目的在于,提供一种用于甲状腺超声图像分割的数据集智能增强方法,基于甲状腺超声数据集,能够智能规划数据集增强方法,
对数据集进行更全面的扩充,充分利用甲状腺超声数据集中的样本,以有效增强样本的多样性和样本数量的充足性,进而有效提高甲状腺超声图像的识别以及分割的准确率。智能增强后的甲状腺超声数据集在训练深度学习网络时更具优势,且具备在其他医学超声图像数据集上迁移的能力。
[0007]由于在深度学习和甲状腺超声图像结合以实现分割时,往往会遇到小样本的问题,所以数据集增强方法在该领域中显得格外重要。传统数据集增强方法不仅严重依赖于人为设计,致使数据集增强过于依赖于设计者的主观意志,且在扩充后对多样性的提升有限,而且通常还需要设计者投入大量精力进行调试验证。同时,单纯使用全部增强方法改善数据集,会使得数据集冗余,致使训练时间过长、图像影响训练结果。
[0008]为了解决现有技术中存在的不足,本专利技术的目的还在于,提供一种用于甲状腺超声图像分割的数据集智能增强方法,克服传统数据集增强的上述问题,进行智能的数据集增强,从而可以在保证数据集不冗余的前提下尽可能提升数据集样本的多样性和数据量,以为后续甲状腺超声图像分割效果的提升提供完备的基础条件。
[0009]为达到上述目的,本专利技术提供了一种用于甲状腺超声图像分割的数据集智能增强方法,其包括以下步骤:
[0010]步骤S1:自动构建原始数据集;
[0011]步骤S2:确定需要使用的数据集增强方法,并根据确定的数据集增强方法自动构建包含多个数据集增强规划的规划域;
[0012]步骤S3:利用构建的规划域中的各个数据集增强规划,训练并更新LSTM控制器;
[0013]步骤S4:自动选择最优规划,串联最优规划,得到用于甲状腺超声图像分割的增强数据集。
[0014]在本专利技术一实施例中,其中,步骤S1包括如下子步骤:
[0015]步骤S11:获取原始甲状腺超声图像,获取医学专家标注的标签,其中所述医学专家标注的标签的类型为二值图像;
[0016]步骤S12:对所述原始甲状腺超声图像和所述医学专家标注的标签进行自动匹配;
[0017]步骤S13:建立原始数据集,并按照预设的比例将原始数据集自动划分为多个数据子集,包括:训练集、测试集和验证集。
[0018]在本专利技术一实施例中,其中,在步骤S13中,基于获取的原始甲状腺超声图像和医学专家标注的标签,对原始数据集进行划分的具体规则包括:
[0019]确保任一被检测人在同一次检查中不同扫查角度的多个原始甲状腺超声图像及其对应匹配的医学专家标注的标签在同一数据子集中;以及
[0020]确保同一被检测人多次检查所获取的多个原始甲状腺超声图像及其对应匹配的医学专家标注的标签在同一个数据子集中。
[0021]在本专利技术一实施例中,其中,步骤S2包括如下子步骤:
[0022]步骤S21:确定需要使用的数据集增强方法的集合,其包括:确定深度学习领域通用的数据集增强方法,以及超声图像分割领域专用的数据集增强方法;
[0023]步骤S22:为每种数据集增强方法额外自动赋予2个参数,分别为增强概率和增强强度,且每个参数都预设有至多9个离散值,其中:
[0024]如果任一数据集增强方法不需要增强概率和/或增强强度参数,则对应数据集增
强方法的对应参数标记为False;
[0025]如果任一数据集增强方法需要增强概率和/或增强强度参数,则对应数据集增强方法的对应参数标记为True;
[0026]当参数标记为False时对应参数没有取值,当参数标记为True时对应参数取值为该参数的多个离散值,并对每一数据集增强方法的2个参数的不同取值进行组合,并对组合后的方法本身自设一方法参数,得到一数据集增强方法的集合,且集合中的每一方法至少包含3个参数;
[0027]步骤S23:每次从数据集增强方法的集合中自动随机选择两个构成一对组合方法,得到数据集增强组合方法的集合,其中每对组合方法具有2
×
3=6个参数;
[0028]步骤S24:从构建好的数据集增强组合方法的集合中,每次自动随机选择4对组合方法得到一数据集增强规划,则每个数据集增强规划包含6
×
4=24个参数;
[0029]步骤S25:将得到的全部数据集增强规划组成规划域。
[0030]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于甲状腺超声图像分割的数据集智能增强方法,其特征在于,包括以下步骤:步骤S1:自动构建原始数据集;步骤S2:确定需要使用的数据集增强方法,并根据确定的数据集增强方法自动构建包含多个数据集增强规划的规划域;步骤S3:利用构建的规划域中的各个数据集增强规划,训练并更新LSTM控制器;步骤S4:自动选择最优规划,串联最优规划,得到用于甲状腺超声图像分割的增强数据集。2.根据权利要求1所述的方法,其特征在于,步骤S1包括如下子步骤:步骤S11:获取原始甲状腺超声图像,获取医学专家标注的标签,其中所述医学专家标注的标签的类型为二值图像;步骤S12:对所述原始甲状腺超声图像和所述医学专家标注的标签进行自动匹配;步骤S13:建立原始数据集,并按照预设的比例将原始数据集自动划分为多个数据子集,包括:训练集、测试集和验证集。3.根据权利要求2所述的方法,其特征在于,在步骤S13中,基于获取的原始甲状腺超声图像和医学专家标注的标签,对原始数据集进行划分的具体规则包括:确保任一被检测人在同一次检查中不同扫查角度的多个原始甲状腺超声图像及其对应匹配的医学专家标注的标签在同一数据子集中;以及确保同一被检测人多次检查所获取的多个原始甲状腺超声图像及其对应匹配的医学专家标注的标签在同一个数据子集中。4.根据权利要求1所述的方法,其特征在于,步骤S2包括如下子步骤:步骤S21:确定需要使用的数据集增强方法的集合,其包括:确定深度学习领域通用的数据集增强方法,以及超声图像分割领域专用的数据集增强方法;步骤S22:为每种数据集增强方法额外自动赋予2个参数,分别为增强概率和增强强度,且每个参数都预设有至多9个离散值,其中:如果任一数据集增强方法不需要增强概率和/或增强强度参数,则对应数据集增强方法的对应参数标记为False;如果任一数据集增强方法需要增强概率和/或增强强度参数,则对应数据集增强方法的对应参数标记为True;当参数标记为False时对应参数没有取值,当参数标记为True时对应参数取值为该参数的多个离散值,并对每一数据集增强方法的2个参数的不同取值进行组合,并对组合后的方法本身自设一方法参数,得到一数据集增强方法的集合,且集合中的每一方法至少包含3个参数;步骤S23:每次从数据集增强方法的集合中自动随机选择两个构成一对组合方法,得到数据集增强组合方法的集合,其中每对组合方法具有2
×
3=6个参数;步骤S24:从构建好的数据集增强组合方法的集合中,每次自动随机选择4对组合方法得到一数据集增强规划,则每个数据集增强规划包含6
×
4=24个参数;步骤S25:将得到的全部数据集增强规划组成规划域。5.根据权利要求4所述的方法,其特征在于,所述深度学习领域通用的数据集增强方法包括:X轴投影、Y轴投影、旋转/旋转+翻转、X轴平移、Y轴平移、对比度调整、锐化、...

【专利技术属性】
技术研发人员:刘鹏孟凡刚都杨刘丽香范丽珺李明孙殿军
申请(专利权)人:哈尔滨医科大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1