一种基于NASNet的肺炎图像分类方法技术

技术编号:29089517 阅读:10 留言:0更新日期:2021-06-30 09:55
本发明专利技术属于图像分类技术领域,具体涉及一种基于NASNet的肺炎图像分类方法,包括获取Mendeley数据集,将Mendeley数据集中的肺炎图片缩放到预设大小,并将数据和数据标签读取保存为矩阵形式;对读取保存后的数据集进行预处理,得到标准化的数据集;将预处理后的数据集划分为训练集S、验证集V和测试集T;基于NASNet网络构建深度学习网络,并使用训练集S对该深度学习网络进行训练;采用训练完成的深度学习网络对待识别分类的肺炎图像进行分类。NASNet深度学习网络可以多尺度多模态特征提取,对肺炎图像特征进行了深入的分析与有效的智能化提取,网络的参数训练摆脱了人为干扰,避免了主观误差,并且可以高效率的进行肺炎X光图像的识别工作。的识别工作。

【技术实现步骤摘要】
一种基于NASNet的肺炎图像分类方法


[0001]本专利技术属于图像分类
,具体涉及一种基于NASNet的肺炎图像分类方法。

技术介绍

[0002]在传统的肺炎诊断过程中,肺炎图像的判断主要取决于医生的经验,但由于人工经验的差异,无法保证准确率。在一些CAD系统中,使用了如SVM的一些机器学习算法,作为一种出色的机器学习方法,SVM算法通过使用高维映射解决了许多线性不可分的问题,并且在图像和文本信息分类中取得了很好的效果。但是,当数据量太大时,通常会导致模型计算量过多,效率低下,并且无法保证鲁棒性和准确性。
[0003]现有技术存在的问题或者缺陷:当前的肺炎图像诊断容易受到主观因素的干扰,影响病情的判别。而现有辅助诊断系统所应用的算法计算效率较低,且准确率难以达到现实要求。

技术实现思路

[0004]针对上述的技术问题,本专利技术提供了一种效率高、误差小、成本低的基于NASNet的肺炎图像分类方法。
[0005]为了解决上述技术问题,本专利技术采用的技术方案为:
[0006]一种基于NASNet的肺炎图像分类方法,包括下列步骤:
[0007]S1、获取Mendeley数据集,将Mendeley数据集中的肺炎图片缩放到预设大小,并将数据和数据标签读取保存为矩阵形式;
[0008]S2、对读取保存后的数据集进行预处理,得到标准化的数据集;将预处理后的数据集划分为训练集S、验证集V和测试集T;
[0009]S3、基于NASNet网络构建深度学习网络,所述深度学习网络包括CNN层、NASNet层与全连接层,并使用训练集S对该深度学习网络进行训练;
[0010]S4、采用训练完成的深度学习网络对待识别分类的肺炎图像进行分类。
[0011]所述S1中将数据和数据标签读取保存为矩阵形式的方法为:包括下列步骤:
[0012]S1.1、使用python的matplotlib包读取数据,并使用scipy将数据保存为矩阵形式,保存格式为npy,得到矩阵为(n,x,y)形式,其中,n为数据量,x为数据长度,y为数据宽度;
[0013]S1.2、将csv格式的标签文件读取并保存为矩阵,以npy格式保存,得到矩阵为(n,a),其中,n为数据量,a代表该条数据的类别,0代表正常,1代表肺炎。
[0014]所述S2中对读取保存后的数据集进行预处理的方法为:读取npy图像数据集,对数据进行标准化操作,标准化公式如下:
[0015][0016]其中,x
i

为标准化后的数据值,x
i
为待处理数据,μ代表样本均值,σ代表样本方差。
[0017]所述S2中将预处理后的数据集划分为训练集S、验证集V和测试集T的方法为
[0018]以hold

out方法对数据集进行划分,将数据集划分为是三个互斥的集合,包括训练集S、验证集V和测试集T;所述训练集S用于对深度学习网络模型进行训练,所述验证集V用于验证深度学习网络模型是否训练完全,所述测试集T用于评估测试深度学习网络模型的泛化误差。
[0019]所述S3中的CNN层用于数据特征的初步提取,所述CNN层将单通道X光数据提升为高维度数据特征;所述NASNet层由多个NASNet控制器模块构建,用于以不同的方式与感受野对数据特征进行进一步的提取;所述全连接层用于对数据特征进行最后的运算,完成分类任务。
[0020]所述S3中的CNN层包括三个CNN模块,每个CNN模块均包括一次卷积运算、一次池化和一次激活;第一个CNN模块的卷积核大小为5*5,步长为2,采用Max Pooling,池化范围为2*2,步长为1;第二个CNN模块的卷积核大小为3*3,步长为1,采用Max Pooling,池化范围为2*2,步长为1;第三个CNN模块的卷积核大小为3*3,步长为1,采用Max Pooling,池化范围为2*2,步长为1;第三个CNN模块还包括一个BN层,用于对数据进行一次批量标准化操作。
[0021]所述S3中的NASNet层包括1*1CNN部分和NASNet控制器,1*1CNN部分的输入为F(x

1),将feature map提升为8通道,输出F(x);NASNet控制器首先以F(x)为输入进行一次3*3的卷积运算与一次3*3的最大池化,步长均为1,将2次运算得到的结果以ADD方式进行融合;之后分别以F(x)与F(x

1)为输入进行一次3*3卷积,二者步长都为1,之后将2次运算得到的结果以ADD方式进行融合;最后以F(x

1)为输入进行一次3*3的卷积运算与一次3*3的最大池化,步长均为1;将2次运算得到的结果以ADD方式进行融合,将3次ADD所得的feature map以Concate方式进行结合,得到NASNet层的最终输出特征。
[0022]所述S3中的全连接层的计算方法为:将上一层的输出进行flatten,之后进行两次全连接运算,得到最终的分类结果,采用Sigmoid进行输出,表达式为:
[0023][0024]其中,k为全连接输出,S(k)为最终输出,若输出值小于0.5,则认为正常,若大于等于0.5,则标记为肺炎图像。
[0025]所述S4中的深度学习网络的训练的方法为:采用Adam作为优化器,初始学习率为0.02,每100个epoch学习率衰减30%,batch size大小为32,损失函数使用指数损失函数,设定训练300个epoch,连续20个epoch模型损失值无下降则停止训练,保存模型。
[0026]所述S4中的深度学习网络的验证过程和评估的方法为:
[0027]验证过程:使用V集数据对训练的到的数据模型进行100个epoch的二次训练,若模型损失无下降,保存模型;若模型损失降低,将学习率设置为原来的0.5倍,使用训练集数据继续对模型进行训练,直到模型损失稳定;
[0028]评估过程:使用训练完成的模型对T集数据进行测试,根据模型识别结果与数据标签,对模型识别效果进行评估,评估方式为对每一个类别的数据进行准确率与召回率的计算;
[0029]准确率:Acc=(TP+TN)/(TP+TN+FN+FP)
[0030]召回率:R=TP/(TP+FN)
[0031]其中,TP为正类判定为正类数量;FP为负类判定为正类数量;FN为正类判定为负类数量;TN为负类判定为负类数量。
[0032]本专利技术与现有技术相比,具有的有益效果是:
[0033]本专利技术提供了一种基于NASNet的肺炎图像分类方法,采用深度学习的方法,对肺炎/正常图像进行二分类操作,本方案模型使用了可以进行多尺度多模态特征提取的NASNet网络,对肺炎X光图像的信息特征进行了深入的分析与有效的智能化提取,网络的参数训练摆脱了人为干扰,避免了主观误差,并且可以高效率的进行肺炎X光图像的识别工作。
附图说明
[0034]图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于NASNet的肺炎图像分类方法,其特征在于:包括下列步骤:S1、获取Mendeley数据集,将Mendeley数据集中的肺炎图片缩放到预设大小,并将数据和数据标签读取保存为矩阵形式;S2、对读取保存后的数据集进行预处理,得到标准化的数据集;将预处理后的数据集划分为训练集S、验证集V和测试集T;S3、基于NASNet网络构建深度学习网络,所述深度学习网络包括CNN层、NASNet层与全连接层,并使用训练集S对该深度学习网络进行训练;S4、采用训练完成的深度学习网络对待识别分类的肺炎图像进行分类。2.根据权利要求1所述的一种基于NASNet的肺炎图像分类方法,其特征在于:所述S1中将数据和数据标签读取保存为矩阵形式的方法为:包括下列步骤:S1.1、使用python的matplotlib包读取数据,并使用scipy将数据保存为矩阵形式,保存格式为npy,得到矩阵为(n,x,y)形式,其中,n为数据量,x为数据长度,y为数据宽度;S1.2、将csv格式的标签文件读取并保存为矩阵,以npy格式保存,得到矩阵为(n,a),其中,n为数据量,a代表该条数据的类别,0代表正常,1代表肺炎。3.根据权利要求1所述的一种基于NASNet的肺炎图像分类方法,其特征在于:所述S2中对读取保存后的数据集进行预处理的方法为:读取npy图像数据集,对数据进行标准化操作,标准化公式如下:其中,x

i
为标准化后的数据值,x
i
为待处理数据,μ代表样本均值,σ代表样本方差。4.根据权利要求1所述的一种基于NASNet的肺炎图像分类方法,其特征在于:所述S2中将预处理后的数据集划分为训练集S、验证集V和测试集T的方法为以hold

out方法对数据集进行划分,将数据集划分为是三个互斥的集合,包括训练集S、验证集V和测试集T;所述训练集S用于对深度学习网络模型进行训练,所述验证集V用于验证深度学习网络模型是否训练完全,所述测试集T用于评估测试深度学习网络模型的泛化误差。5.根据权利要求1所述的一种基于NASNet的肺炎图像分类方法,其特征在于:所述S3中的CNN层用于数据特征的初步提取,所述CNN层将单通道X光数据提升为高维度数据特征;所述NASNet层由多个NASNet控制器模块构建,用于以不同的方式与感受野对数据特征进行进一步的提取;所述全连接层用于对数据特征进行最后的运算,完成分类任务。6.根据权利要求1所述的一种基于NASNet的肺炎图像分类方法,其特征在于:所述S3中的CNN层包括三个CNN模块,每个CNN模块均包括一次卷积运算、一次池化和一次激活;第一个CNN模块的卷积核大小为5*5,步长为2,采用Max Pooling,池化范围为2*2,步长为1;第二个CNN模块的卷积核大小为3*3,步长为1,采用M...

【专利技术属性】
技术研发人员:潘晓光张娜令狐彬陈智娇姚珊珊
申请(专利权)人:山西三友和智慧信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1