结合迁移学习和半监督学习的超声乳腺结节图像分类方法技术

技术编号:39845220 阅读:10 留言:0更新日期:2023-12-29 16:42
本发明专利技术提供了结合迁移学习和半监督学习的超声乳腺结节图像分类方法,首先使用迁移学习的方式,利用预训练好的神经网络模型,进行微调以实现高精度分类,由于预训练网络已经经过充分的训练,因此针对乳腺结节超声图像的特定网络结构参数的优化可以快速收敛,同时还能避免从头开始训练时出现过拟合等问题

【技术实现步骤摘要】
结合迁移学习和半监督学习的超声乳腺结节图像分类方法


[0001]本专利技术涉及乳腺结节影像识别领域
,具体涉及结合迁移学习和半监督学习的超声乳腺结节图像分类方法


技术介绍

[0002]乳腺结节的及时检查与准确诊断对患者的治疗和康复具有重要意义

早期发现乳腺结节有助于提高患者的治愈概率,降低病情恶化的风险

对乳腺结节良恶性的及时

准确诊断能够减轻患者的痛苦,降低生命危险,并可以有效降低乳腺癌的致死率

因此,关注乳腺结节检查与诊断对于提高患者生活质量和预防乳腺癌具有重要价值

目前,乳腺结节检查主要包括触诊

穿刺活检和医学影像检查等方法,触诊准确率较低,穿刺活检可能给患者带来不必要的痛苦,因此,无创

无痛的影像检查成为首选

影像检查通常包括乳腺
X
射线成像

乳腺超声成像和乳腺磁共振成像等

乳腺超声成像具有无辐射

可检测微小肿块

适用于高密度乳腺患者

识别囊性和实性肿块以及提供细节图像等优点,尤其适用于我国
40
岁以下致密性乳腺女性患者

然而,超声图像的阅片和诊断通常依赖于经验丰富的专业医师耗费大量人力和时间成本进行人工阅片

人工阅片也可能受技术

经验偏差和设备影响,过于依赖专业医师的经验,容易出错

此外,相关医疗人才短缺使得专业阅片诊断难以覆盖大量基层医院,这使得乳腺疾病诊断更加困难和谨慎,会给患者带来不必要的负担

[0003]目前,传统的机器学习技术在处理图像诊断任务时,通常首先需要人工提取图像特征,这些特征可能包括形状

纹理

颜色等方面的信息

然后,计算机会根据这些特征之间的关系,通过训练分类器
(
如支持向量机

决策树等
)
来进行辅助诊断

这种方法依赖于人工设计的特征提取器,可能无法充分捕捉图像中的复杂信息,从而影响诊断的准确性和效率

并且这些工作需要大量的金标准数据集,而对数据进行专业标注需要耗费医生大量的时间和精力来进行特征提取,并且数据库样本较小的情况下很难有精准的预测模型

随着技术的发展,人工智能在日常生活中的深入应用

结合,深度学习技术已经极大地推动了图像分类和检测的进步

深度学习不需要人工手动设计特征,而是通过层次化的特征提取自动完成,深度卷积神经网络能够自动有效地从样本中学习到图像的特征,实现端到端的分类和检测

利用神经网络自动提取乳腺结节特征并进行检测和分类,很多研究者采取的是全监督模型的训练方法

然而,全监督模型需要大量的有标签样本,在医学任务中,收集图像数据只需要使用
B
超仪进行扫描成像,但是获取其准确标签则需要患者进行手术活体组织检查,所以收集大量标记数据较为困难,需要大量时间

金钱和人力成本

在乳腺结节智能诊断中,由于标签数据不足,基于标签数据进行分类器训练可能导致模型表现不佳


技术实现思路

[0004]为解决上述问题,本专利技术公开了结合迁移学习和半监督学习的超声乳腺结节图像分类方法
,
能够帮助医生更准确地诊断

治疗乳腺疾病,提高乳腺结节超声影像分类的准确性和泛化能力,还能够应用于其他医学领域的诊断问题中,通过深度学习与迁移学习相结
合的新方法,为医学研究提供更有力的技术支持

[0005]本专利技术首先使用迁移学习的方式,利用预训练好的神经网络模型,进行微调以实现高精度分类,由于预训练网络已经经过充分的训练,因此针对乳腺结节超声图像的特定网络结构参数的优化可以快速收敛,同时还能避免从头开始训练时出现过拟合等问题

然后使用半监督学习的方式,利用网络对未标注的数据进行特征提取,计算与已经标注的数据的特征距离,进一步提高分类的准确率和泛化能力

在实际应用中,该方法可以为医疗诊断提供可靠的辅助诊断依据

经实验验证,采用迁移学习可以提高超声乳腺结节良恶性分类准确率5%,采用半监督学习可以提高准确率3%

[0006]具体方案如下:
[0007]结合迁移学习和半监督学习的超声乳腺结节图像分类方法,其特征在于,包括以下步骤:
[0008]S1、
采用迁移学习方法,将使用有标签甲状腺结节超声图像预先训练的分类模型作为乳腺结节良恶性结节诊断的骨干;
[0009]S2、
使用迭代半监督学习方法来利用大量未注释乳腺结节图像;在标注样本和未标注样本之间的语义表示空间中计算深度特征相似度,对最有信心的未标注样本进行标注,利用“伪标签”的方法,将未标注数据逐步加入到训练过程中,最终选取验证参数效果最好的模型

[0010]作为本专利技术的进一步改进的,具体为:
[0011](1)
搭建一个
ResNet

18
的迁移学习分类网络,将有标注的甲状腺结节超声图像利用该网络进行深度学习训练得到一个分类模型,并冻结前几层网络的权重,对最后几层进行微调;将有标注的乳腺结节超声图像数据分成五份,取其中四份送入分类模型进行乳腺结节分类训练,得到对乳腺结节具有良恶性分类的分类模型,再将剩下的有标签数据送入该分类模型进行验证,此为迁移学习过程;
[0012](2)
利用迁移学习得到的分类模型对无标签乳腺结节超声图像数据进行初步良恶性判别,利用“伪标签”方法对无标签数据打上“伪标签”,再将具有“伪标签”的图像数据不断加入有标签数据集进行迭代,并将迭代后的数据集一起送入分类模型进行训练,多次重复数据集迭代过程,此为半监督深度学习过程

[0013]作为本专利技术的进一步改进的,甲状腺结节和乳腺结节都是医学领域常见的疾病图像,虽然甲状腺结节超声图像和乳腺结节超声图像之间存在一些差异,但是它们的图像特征在许多方面是相似的,例如纹理

形状等方面

因此,使用迁移学习来解决乳腺结节超声图像分类问题,可以提高算法的准确性

在乳腺结节超声图像的分类中,首先使用训练的甲状腺结节超声图像模型来初始化乳腺结节超声图像分类模型的权重矩阵,然后在乳腺结节超声图像数据集上进行微调

[0014]作为本专利技术的进一步改进的,
ResNet

18
的迁移学习分类网络是
ResNet本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
结合迁移学习和半监督学习的超声乳腺结节图像分类方法,其特征在于,包括以下步骤:
S1、
采用迁移学习方法,将使用有标签甲状腺结节超声图像预先训练的分类模型作为乳腺结节良恶性结节诊断的骨干;
S2、
使用迭代半监督学习方法来利用大量未注释乳腺结节图像;在标注样本和未标注样本之间的语义表示空间中计算深度特征相似度,对最有信心的未标注样本进行标注,利用“伪标签”的方法,将未标注数据逐步加入到训练过程中,最终选取验证参数效果最好的模型
。2.
根据权利要求1所述的结合迁移学习和半监督学习的超声乳腺结节图像分类方法,其特征在于,具体为:
(1)
搭建一个
ResNet

18
的迁移学习分类网络,将有标注的甲状腺结节超声图像利用该网络进行深度学习训练得到一个分类模型,并冻结前几层网络的权重,对最后几层进行微调;将有标注的乳腺结节超声图像数据分成五份,取其中四份送入分类模型进行乳腺结节分类训练,得到对乳腺结节具有良恶性分类的分类模型,再将剩下的有标签数据送入该分类模型进行验证,此为迁移学习过程;
(2)
利用迁移学习得到的分类模型对无标签乳腺结节超声图像数据进行初步良恶性判别,利用“伪标签”方法对无标签数据打上“伪标签”,再将具有“伪标签”的图像数据不断加入有标签数据集进行迭代,并将迭代后的数据集一起送入分类模型进行训练,多次重复数据集迭代过程,此为半监督深度学习过程
。3.
根据权利要求2所述的结合迁移学习和半监督学习的超声乳腺结节图像分类方法,其特征在于,在乳腺结节超声图像的分类中,首先使用训练的甲状腺结节超声图像模型来初始化乳腺结节超声图像分类模型的权重矩阵,然后在乳腺结节超声图像数据集上进行微调
。4.
根据权利要求2所述的结合迁移学习和半监督学习的超声乳腺结节图像分类方法,其特征在于,所述
ResNet

18
的迁移学习分类网络具有
18
层卷积层和全连接层,包括:
(4.1)
输入层:输入原始图像数据,大小为
3*224*224

(4.2)
卷积层:使用大小为
7*7
的卷积核进行卷积,步长为2,结果通道数为
64

(4.3)
最大池化层:使用大小为
2*2
的池化核进行最大池化,在每个
2*2
的窗口中,取该窗口内的最大值作为输出值,步长为2,有助于减少特征图大小,降低模型复杂度,提高计算效率,并且能帮助生成对平移和缩放等变换有鲁棒性的特征;
(4.4)
残差块1:由2个残差单元构成,每个残差单元包括两个
3*3
大小的卷积层和一个标准化层,其中第一个卷积层的输出通道数为
64
,第二个卷积层的输出通道数也为
64

(4.5)
残差块2:由2个残差单元构成,每个残差单元包括两个
3*3
大小的卷积层和一个标准化层,其中第一个卷积层的输出通道数为
128
,第二个卷积层的输出通道数也为
128

(4.6)
残差块3:由2个残差单元构成,每个残差单元包括两个
3*3
大小的卷积层和一个标准化层,其中第一个卷积层的输出通道数为
256
,第二个卷积层的输出通道数也为
256

(4.7)
残差块4:由2个残差单元构成,每个残差单元包括两个
3*3
大小的卷积层和一个标准化层,其中第一个卷积层的输出通道数为
512
,第二个卷积层的输出通道数也为
512

(4.8)
平均池化层:使用大小为
7*7
的池化核进行池化,池化后的大小为
512*1*1

(4.9)
全连接层:将池化结果通过
SoftMax
激活函数产生最终结果,分类到两个类中的某一个
。5.
根据权利要求4所述的结合迁移学习和半监督学习的超声乳腺结节图像分类方法,其特征在于,所述
SoftMax
激活函数输出两个值,即良性和恶性概率;
SoftMax
函数的定义为:对于输入向量
z

(z1,z2,

,z
k
)

SoftMax
函数将其映射成概率分布向量<...

【专利技术属性】
技术研发人员:田传耕封波张居远马崇杰封新闻田秀玲唐璐
申请(专利权)人:江苏锦源医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1