一种基于特征迁移的肺部CT图像分类方法技术

技术编号:25757547 阅读:13 留言:0更新日期:2020-09-25 21:06
本发明专利技术提供了一种基于特征迁移的肺部CT图像分类方法。该技术方案通过对CT图像数据进行预处理、数据增强、特征可视化确定预训练GoogLeNet网络的深度和冻结层数,有效的提取图像内在信息,提高了模型的分类准确率和分类效率。本发明专利技术采用自适应CT图像滤波算法对实现不同设备采集的图像进行滤波;对CT图像进行对比度拉伸,丰富了图像信息,更好地提取图像特征;使用特征图可视化技术为模型的网络深度确定提供了一种选择,减少超参数调整。应用本发明专利技术,可解决无标签图像的特征提取问题,缓解高维图像数据分类面临的维数灾难问题,使图像分类的准确率得到显著提升。

【技术实现步骤摘要】
一种基于特征迁移的肺部CT图像分类方法
本专利技术涉及机器学习领域,具体涉及一种基于特征迁移的肺部CT图像分类方法。
技术介绍
冠状病毒是自然界广泛存在的一大类病毒,其中多种毒株对包括人在内的脊椎动物具有感染性。早发现、早确诊、早隔离是控制此类疾病传播的重要方法,由于核酸检测存在检测速度不够快,并存在核酸检测敏感度问题可能导致假阴性情况的出现。因此,利用计算机视觉对可能的新冠肺炎筛CT图像进行辅助诊断能够有效降低新冠肺炎的漏诊或者误诊率,缓解医疗资源的不足。目前,基于深度学习框架的新冠肺炎检测及基于迁移学习的新冠肺炎检测方法一般采用对图像进行数据增强,接着使用深度学习框架对图像进行特征提取,最后使用训练完成模型进行计算机辅助诊断。然而,基于深度学习的方法需要大量带标记的图像数据来训练模型,这种方式对计算机硬件要求高。基于迁移学习的方法可以降低模型训练对训练数据规模的依赖,但现有的深度模型往往具有较高的网络深度,直接使用现有的模型难以适用于新型冠状肺炎的检测。
技术实现思路
本专利技术旨在针对现有技术的技术缺陷,提供一种基于特征迁移的肺部CT图像分类方法,以解决现有技术中,常规方法对模型分类的准确率和效率较低的技术问题。为实现以上技术目的,本专利技术采用以下技术方案:一种基于特征迁移的肺部CT图像分类方法,包括:1)在图像预处理阶段采用自适应二维高斯噪声滤波方法对图像进行滤波;2)图像滤波之后采用对比度拉伸进行处理;3)对数据进行放缩、旋转、平移或镜像处理,并调整图像的大小;4)调整网络输出以适应分类类别数;5)采用可视化技术优化模型网络深度。作为优选,步骤1)所述采用自适应二维高斯噪声滤波方法对图像进行滤波,是通过以下式1、式2实现的:其中,η是图像A中每个像素的x×y局部邻域;采用以上估计值创建像素级滤波器f如下:式3中,v2是噪声方差。作为优选,当没有给出噪声方差时,使用所有局部估计方差的平均值。作为优选,所述采用对比度拉伸进行处理,是通过以下式4实现的:作为优选,步骤3)中,调整图像的大小以适应GoogLeNet网络的输入。作为优选,步骤5)中,使用CT图像输入网络,观察不同层的特征输出,确定网络深度。本专利技术提供了一种基于特征迁移的肺部CT图像分类方法。该技术方案提出一种无监督图像特征提取融合及分类方法和系统,解决无标签图像的特征提取问题,缓解高维图像数据分类面临的“维数灾难”问题,从而提高图像的分类准确率。具体来看,本专利技术首先通过自适应二维高斯噪声滤波技术、对比度拉伸对图像进行预处理,而后进行数据增强、特征迁移、特征可视化确定网络深度,并采取了网络层冻结技术。本专利技术是一种基于图像特征迁移的CT图像分类方法,通过对CT图像数据进行预处理、数据增强、特征可视化确定预训练GoogLeNet网络的深度,有效的提取图像内在信息,提高了模型的分类准确率和分类效率。本专利技术的创新性特征集中体现在以下方面:1、采用自适应CT图像滤波算法对实现不同设备采集的图像进行滤波。2、对CT图像进行对比度拉伸,丰富了图像信息,更好地提取图像特征。3、使用特征图可视化技术为模型的网络深度确定提供了一种选择,减少超参数调整。附图说明图1是本专利技术方法的原理图;图2是本专利技术的算法流程图;图3是本专利技术具体实施方式中,部分数据集CT图像;图4是本专利技术具体实施方式中,图像预处理结果图;图5是本专利技术具体实施方式中,图像增强结果图;图6是本专利技术具体实施方式中,输入图像和第2、11、25层特征图;图7是本专利技术具体实施方式中,输入图像和第39、54、68、82层特征图;图8是本专利技术具体实施方式中,输入图像和第96、100、125、139层特征图;图9是本专利技术具体实施方式中,冻结前39层网络训练过程图;图10是本专利技术具体实施方式中,冻结前54层网络训练过程图;图11是本专利技术具体实施方式中,冻结前110层网络训练过程图;图12是本专利技术具体实施方式中,冻结前125层网络训练过程。具体实施方式以下将对本专利技术的具体实施方式进行详细描述。为了避免过多不必要的细节,在以下实施例中对属于公知的结构或功能将不进行详细描述。以下实施例中所使用的近似性语言可用于定量表述,表明在不改变基本功能的情况下可允许数量有一定的变动。除有定义外,以下实施例中所用的技术和科学术语具有与本专利技术所属领域技术人员普遍理解的相同含义。为了不同设备生成的CT图像产生噪声及训练样本规模有限的问题,本专利技术提出了一种基于特征迁移的新冠肺炎计算机辅助诊断方法,进行新冠肺炎CT图像的分类学习。1、为进一步减少不同CT设备生成CT图像具有不同的噪声系,图像预处理阶段引入了自适应二维高斯噪声滤波技术。η是图像A中每个像素的x×y局部邻域。使用这些估计值创建像素级滤波器f如下:式3中,v2是噪声方差。如果没有给出噪声方差,则使用所有局部估计方差的平均值。2、图像滤波之后采用对比度拉伸进行处理,方法如下:3、为了增加数据训练数据规模以及提高模型的泛化性能,对数据进行放缩、旋转、平移、镜像,并调整图像的大小以适应GoogLeNet网络的输入。4、调整网络输出以适应分类类别数,因训练数据只有新冠肺炎和非新冠肺炎两类图像,因此调整模型输出使其使用对应的应用场景。5、采用可视化技术优化模型网络深度。通过使用CT图像输入网络,观察不同层的特征输出,确定网络深度,有效减少网络训练时间及缓解模型过拟合。本专利技术的原理如图1所示。根据上述过程,伪代码如以下表1所示:表1伪代码列表本专利技术的算法流程如图2所示。实施例采用https://github.com/UCSD-AI4H/COVID-CT网站上公开的数据集来进行验证。该数据集是发布者从medRxiv1和bioRxiv2收集了760个关于COVID-19的文章,并于1月19日至3月发布25日。这些文章中有许多报告了COVID-19的病例,有些还显示了报告中有CT扫描,以及相关的临床表现的说明相关。使用PyMuPDF3来提取文章中PDF文件的底层结构信息,并定位所有嵌入的图形。图像的质量(包括分辨率、大小等)保存得很好。最后,获得275个CT扫描标记为COVID-19阳性。图3显示了COVID-19CT扫描的一些示例。图像滤波及对比度拉伸结果图4所示,其中左侧为原始CT图像,中间为自适应噪声滤波后图像,右侧为对比度拉伸后图像:网络批输入增强图像如图5,增强图像是原始图像上进行随机的像素平移,随机翻转、图像缩放处理。为了方便显示,根据GoogLeNet网络整体性及层特点本文档来自技高网...

【技术保护点】
1.一种基于特征迁移的肺部CT图像分类方法,其特征在于,包括:/n1)在图像预处理阶段采用自适应二维高斯噪声滤波方法对图像进行滤波;/n2)图像滤波之后采用对比度拉伸进行处理;/n3)对数据进行放缩、旋转、平移或镜像处理,并调整图像的大小;/n4)调整网络输出以适应分类类别数;/n5)采用可视化技术优化模型网络深度。/n

【技术特征摘要】
1.一种基于特征迁移的肺部CT图像分类方法,其特征在于,包括:
1)在图像预处理阶段采用自适应二维高斯噪声滤波方法对图像进行滤波;
2)图像滤波之后采用对比度拉伸进行处理;
3)对数据进行放缩、旋转、平移或镜像处理,并调整图像的大小;
4)调整网络输出以适应分类类别数;
5)采用可视化技术优化模型网络深度。


2.根据权利要求1所述的一种基于特征迁移的肺部CT图像分类方法,其特征在于,步骤1)所述采用自适应二维高斯噪声滤波方法对图像进行滤波,是通过以下式1、式2实现的:






其中,η是图像A中每个像素的x×y局部邻域;
采用以上估计值创建像素级滤波器f如下:

【专利技术属性】
技术研发人员:杨东海陈小娟
申请(专利权)人:漳州卫生职业学院
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1