基于半监督迁移学习的新冠肺炎CT图像分类方法技术

技术编号:34927563 阅读:58 留言:0更新日期:2022-09-15 07:21
本发明专利技术公开了一种基于半监督迁移学习的新冠肺炎CT图像分类方法,主要包括三个步骤:inf

【技术实现步骤摘要】
基于半监督迁移学习的新冠肺炎CT图像分类方法


[0001]本专利技术属于数字图像处理方法
,具体涉及一种基于半监督迁移学习的新冠肺炎CT图像分类方法。

技术介绍

[0002]随着人工智能的高速发展,越来越多的领域开始应用深度学习算法,帮助解决更多实际生活中的问题。在医学图像领域,将人工智能技术应用于患者CT图像等医学图像的处理已经变得十分普遍。将深度学习图像分类算法应用于新冠肺炎患者CT图像分类中,可以辅助医生的诊断工作,极大地减轻医生的工作负担,具有十分重要的现实意义。
[0003]对大量的临床影像数据进行标记需要巨大的人力成本,而目前,针对大量未标记的数据所提出的半监督分类算法都是在公开数据集上进行实验。我们尝试应用半监督学习算法处理大量未标记的火神山医院的3900多条实际 CT数据集,然而,实际的分类效果并不理想。我们采取自监督学习方法充分利用CT图像本身的图片信息,使用分割的辅助任务,提高分类效率。

技术实现思路

[0004]本专利技术的目的是提供一种基于半监督迁移学习的新冠肺炎CT图像分类方法,解决了现有半监督学习算法实际应用于完全未标记数据集上效果不好的问题。
[0005]本专利技术所采用的技术方案是:
[0006]基于半监督迁移学习的新冠肺炎CT图像分类方法,具体按照以下步骤实施:
[0007]步骤1、构建感染新冠肺炎的CT图像数据集;
[0008]步骤2、将步骤1获得的数据集放入inf

net网络中进行病灶的分割,加入transformer模块提高边缘表示;
[0009]步骤3、将步骤2中inf

net网络输出的病灶表示与原图进行像素级的融合,突出病灶在原图中的表示;
[0010]步骤4、利用已做好分类标记的CT公开数据集对小样本模型进行训练,作为半监督迁移学习的预训练模型;
[0011]步骤5、将步骤3融合后的图片放入到经过步骤4训练的半监督迁移学习框架中,对新冠肺炎CT图像进行普通、重症、危重症的分类,得到分类准确率。
[0012]本专利技术的特点还在于:
[0013]步骤1具体按照以下步骤实施:
[0014]步骤1.1、将DCM类型的原始CT图像转化为png格式图像;
[0015]步骤1.2、对每张图像的所有像素对应的数值进行求和,剔除和的数值低于40000000阈值的图像,保留阈值高于40000000的图像。
[0016]步骤3具体按照以下步骤实施:
[0017]对图像进行融合叠加,将两张图像中的每个像素的值乘以0.5,然后对应点相加,
最后输出,得到新的图像作为半监督迁移学习网络框架的输入。
[0018]步骤4具体按照以下步骤实施:
[0019]步骤4.1、对已做好分类标记的CT公开数据进行增强,使用的策略依次为:
[0020](1)随机左右翻转,概率p=0.5;
[0021](2)随机裁剪,将图像大小调整为32*32,每边填充4,填充类型为反射;
[0022](3)转化为张量,归一化至[0

1];
[0023](4)标准化,对数据按照通道进行标准化,均值为(0.4811,0.4575,0.4078),标准差为(0.2605,0.2533,0.2683);
[0024]步骤4.2、将增强后的CT公开数据集送入半监督迁移学习神经网络中提取特征表示,训练神经网络,使用resnet50作为特征提取器,在提取器的末端加入L2归一化层,使得特征向量具有单位长度;
[0025]步骤4.3、将每个类别的样本对应特征向量都作为该类别的权重向量存储到权重矩阵中;
[0026]步骤4.4、计算样本的特征向量与权重矩阵中对应的各个类别的权重向量之间的内积,再利用softmax分类器映射成未归一化的logit分数,利用 softmax激活函数,从而在所有类别上产生概率分布。
[0027]步骤5具体按照以下步骤实施:
[0028]步骤5.1、对经步骤3融合后的CT图像进行数据增强;
[0029]步骤5.2、将经步骤5.1增强后的数据集放入到半监督迁移学习框架中,模型框架有两条网络分支,分别为步骤4中的预训练模型和目标模型,目标模型就是学习参数的模型;
[0030]步骤5.3、目标模型初始值与步骤4的预训练模型设置相同,将待测试数据集中的数据,一批大小为16,分批喂入预训练模型和目标模型,将提取的特征进行AKC正则化,并更新目标模型的参数,再通过ARC正则项将未标记数据与标记数据的分布相似,并更新目标模型参数;
[0031]步骤5.4、半监督迁移学习模型的迭代次数设置为50次,每次喂入模型的一批大小为16,使用SGD优化器,学习率为0.001,权重衰减默认为0.001,动量速率为0.9,AKC和ARC参数设置为:正则化权重因子λ
K
=1、λ
R
=50,阈值K和R默认值为0.7;设置好参数后,将待测试数据集放入到半监督迁移学习框架中,得到分类准确率。
[0032]步骤5.1中对CT图像进行数据增强的具体步骤为:
[0033]将待测试数据分为标记数据和未标记数据,对标记数据采用的随机数据增强策略依次为:
[0034](1)随机左右翻转,概率p=0.5;
[0035](2)随机裁剪,当图片大小为224时,将放缩调整为224/0.875,随后随机裁剪,大小为224;否则,随机裁剪,高为图片大小,宽为图片大小乘以 0.125,填充模式为reflect;
[0036](3)标准化,均值为(0.485,0.456,0.406),标准差为(0.229,0.224,0.225);
[0037](4)添加噪声,采用高斯噪音,标准差为0.15;
[0038]对于未标记数据,分为弱数据增强和强数据增强,弱数据增强的步骤与上述标记数据相同,强数据增强是在弱数据增强的基础上,增加了随机遮挡,概率float=0.5。
[0039]步骤5.3中的AKC正则项和ARC正则项具体为:
[0040]AKC正则项的输入就是预训练模型和目标模型提取出来的特征向量, AKC的正则项为:
[0041][0042]其中,B
l
为标记实例,B
u
为未标记实例,L表示B
l
的微型批次,U表示 B
u
的微型批次,W为权重;
[0043]ARC表示目标模型中标记数据和未标记数据之间的自适应表示一致性,使用最大平均差异MMD来衡量标记数据和未标记数据的数据分布之间的距离,ARC的正则项为:
[0044][0045]其中,Q
F*l
为所选标记样本的分布,Q
F*u
为所选未标记样本的分布;
[0046]完整的自适应一致性由AKC和ARC组成的正则化为:
[0047]R本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于半监督迁移学习的新冠肺炎CT图像分类方法,其特征在于,具体按照以下步骤实施:步骤1、构建感染新冠肺炎的CT图像数据集;步骤2、将步骤1获得的数据集放入inf

net网络中进行病灶的分割,加入transformer模块提高边缘表示;步骤3、将步骤2中inf

net网络输出的病灶表示与原图进行像素级的融合,突出病灶在原图中的表示;步骤4、利用已做好分类标记的CT公开数据集对小样本模型进行训练,作为半监督迁移学习的预训练模型;步骤5、将步骤3融合后的图片放入到经过步骤4训练的半监督迁移学习框架中,对新冠肺炎CT图像进行普通、重症、危重症的分类,得到分类准确率。2.根据权利要求1所述的基于半监督迁移学习的新冠肺炎CT图像分类方法,其特征在于,所述步骤1具体按照以下步骤实施:步骤1.1、将DCM类型的原始CT图像转化为png格式图像;步骤1.2、对每张图像的所有像素对应的数值进行求和,剔除和的数值低于40000000阈值的图像,保留阈值高于40000000的图像。3.根据权利要求1所述的基于半监督迁移学习的新冠肺炎CT图像分类方法,其特征在于,所述步骤3具体按照以下步骤实施:对图像进行融合叠加,将两张图像中的每个像素的值乘以0.5,然后对应点相加,最后输出,得到新的图像作为半监督迁移学习网络框架的输入。4.根据权利要求1所述的基于半监督迁移学习的新冠肺炎CT图像分类方法,其特征在于,所述步骤4具体按照以下步骤实施:步骤4.1、对已做好分类标记的CT公开数据进行增强,使用的策略依次为:(1)随机左右翻转,概率p=0.5;(2)随机裁剪,将图像大小调整为32*32,每边填充4,填充类型为反射;(3)转化为张量,归一化至[0

1];(4)标准化,对数据按照通道进行标准化,均值为(0.4811,0.4575,0.4078),标准差为(0.2605,0.2533,0.2683);步骤4.2、将增强后的CT公开数据集送入半监督迁移学习神经网络中提取特征表示,训练神经网络,使用resnet50作为特征提取器,在提取器的末端加入L2归一化层,使得特征向量具有单位长度;步骤4.3、将每个类别的样本对应特征向量都作为该类别的权重向量存储到权重矩阵中;步骤4.4、计算样本的特征向量与权重矩阵中对应的各个类别的权重向量之间的内积,再利用softmax分类器映射成未归一化的logit分数,利用softmax激活函数,从而在所有类别上产生概率分布。5.根据权利要求1所述的基于半监督迁移学习的新冠肺炎CT图像分类方法,其特征在于,所述步骤5具体按照以下步骤实施:步骤5.1、对经步骤3融合后的CT图像进行数据增强;
步骤5.2、将经步骤5.1增强后的数据集放入到半监督迁移...

【专利技术属性】
技术研发人员:张杰王静宜向坤兰康孟飞张鑫潘志庚
申请(专利权)人:西安理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1