当前位置: 首页 > 专利查询>东北大学专利>正文

一种肺部CT图像中模糊模式的多示例学习识别方法技术

技术编号:24889862 阅读:24 留言:0更新日期:2020-07-14 18:16
本发明专利技术公开一种肺部CT图像中模糊模式的多示例学习识别方法,属于CT图像处理技术领域。该方法首先对不同模式下的肺部CT图像进行随机抽样并进行预处理,其次对预处理后的样本采用迁移学习的方法进行特征提取,并采用主成分分析法对特征进行降维,最后采用优化后的多示例学习的方案对不同模式的肺部CT图像进行分类。本发明专利技术把卷积神经网络和多示例学习相结合,能够在数据量不足且存在未知的示例标签的情况下利用CNN提取样本特征,采用网格搜索优化多示例学习的参数,有效提高了分类准确率。

【技术实现步骤摘要】
一种肺部CT图像中模糊模式的多示例学习识别方法
本专利技术涉及CT图像处理
,尤其涉及一种肺部CT图像中模糊模式的多示例学习识别方法。
技术介绍
对于不同模糊模式的多层CT序列图像的分类问题,传统的机器学习方法是利用局部二进制模式、定向梯度直方图、ORB、SURF和SIFT等手工提取的特征,需要该领域的专门知识。而卷积神经网络可以作为一个自动的特征提取器,利用浅层来提取每一层CT图像中类似于边缘、轮廓、色调、阴影和纹理等较为低级的特征;利用靠近输出的层提取更加抽象和复杂的特征。但从零开始训练需要大量的有标注的数据。值得注意的是,标注每一层切片图像不仅耗时耗力,而且需要高成本的、特定专业的知识和技能。而迁移学习可以降低对上述的要求。此外,卷积神经网络与传统的机器学习相结合的方法得到越来越多的重视,在很多情况下这种混合方法比单独利用卷积神经网络对图像进行分类所得到的准确率更高。当处理多层CT序列图像时,存在部分切片图像标签未知的情况。此时多示例学习,例如引用-k最近邻(Citation-KNN),更加适合。具体来说,为识别两种模式的肺部CT图像,可将扫描自同一肺部的切片图像看做一个包中的示例,然后基于这些包进行后续分类。综上,对CT序列图像进行分类的传统方法的问题主要包括数据量缺乏,标签和特征不易获取。因此,本专利提出了一种肺部CT图像中模糊模式的多示例学习识别方法,准确且高效,避免了对切片图像进行标签标注的问题,同时弱化了大量数据对于特征的自动提取器的必要性。
技术实现思路
<br>针对上述现有技术的不足,提供一种肺部CT图像中模糊模式的多示例学习识别方法。为解决上述技术问题,本专利技术所采取的技术方案是:一种肺部CT图像中模糊模式的多示例学习识别方法,其流程如图1所示,包括如下步骤:步骤1:采用随机抽样的方法分别对模式A和模式B的肺部CT图像样本进行采集,并进行预处理;步骤1.1:在人体冠状面方向,分别去掉肺部上下两部分含有较小肺区的切片;也可以从其他各个方向抽样,如矢状切面、其他斜切面等。步骤1.2:将其余的肺部平均分成n份,n∈Z,从每份中随机抽取一张切片作为一个示例;步骤1.3:对抽取的示例进行像素值标准化和灰度变换;步骤1.4:将从同一个肺部CT序列图像中获取的n个样本特征视为一个包。步骤2:对预处理后的样本采用迁移学习的方法进行特征提取,并采用主成分分析法对特征进行降维;步骤2.1:用已知的自然图像数据集预训练卷积神经网络CNN;步骤2.2:输入步骤1预处理后的样本利用卷积层进行特征提取;所述利用卷积层进行特征提取的方法为:利用浅层即靠近输入层的卷积层的输出作为特征,分别按不同卷积层输出的特征进行分类,比较各个卷积层输出特征的分类准确率,选择准确率最高的一个卷积层的输出特征作为最终提取的特征。步骤2.3:采用主成分分析法对提取后的样本特征进行降维。步骤3:基于提取后的特征采用多示例学习的方案对模式A和模式B进行分类;步骤3.1:对降维后的样本包按一定比例划分为训练集和测试集;步骤3.2:将训练集和测试集的样本包输入多示例学习模型中;多示例学习模型包括:引用-k最近邻模型Citation-KNN,多示例支持向量机模型MI-SVM以及期望最大化-多样性密度模型EM-DD,选择其中的一种即可。步骤3.3:采用网格搜索的方法确定多示例学习模型的最优参数;其中采用网格搜索的方法确定引用-k最近邻模型的最优参数包括:最近邻的个数k和确定引用者时的参数C。步骤3.4:对数据集进行十折交叉验证,保证结果的准确性。采用上述技术方案所产生的有益效果在于:(1)能够在数据量不足且存在未知的示例标签的情况下利用CNN提取样本特征;(2)降低人工成本以及对专业知识的依赖;(3)利用自然图像预训练的卷积层能较好的表现出肺部CT图像的特点,例如灰度和形态等特征,从而得到较高的分类准确率。附图说明图1为本专利技术一种肺部CT图像中模糊模式的多示例学习识别方法的一般流程图;图2为本专利技术实施例中从每个CT序列图像中随机抽取的8个轴向切片图像以图像组合方式表示两种模式下包中的8个示例;(a)模式A一个包中的示例图;(b)模式B一个包中的示例图;图3为本专利技术实施例中基于迁移学习进行特征提取的示意图;图4为本专利技术实施例中基于不同参数设置下的模型性能;(a)不同的神经层的深度下的模型准确率;(b)不同的特征维度下模型的准确率。具体实施方式下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述。以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。本实施例中的数据均来自于同一家医院,由此减小了由于设备不同可能产生的误差。本实施例中分别采集190例模式A的肺部CT图像和90例模式B的肺部CT图像,如图1所示,本实施例的方法如下所述:步骤1:采用随机抽样的方法分别对模式A和模式B的肺部CT图像样本进行采集,并进行预处理;本实施例中模式A为含有COPD病灶特征的数据,模式B为健康人数据,利用pulmonary_toolkit将所获得的DICOM文件转换为NIFT文件,从而方便利用MATLAB处理上述图像矩阵;步骤1.1:在人体冠状面方向,分别去掉肺部上下两部分含有较小肺区的切片;也可以从其他各个方向抽样,如矢状切面、其他斜切面等。步骤1.2:将其余的肺部平均分成8份,从每份中随机抽取一张切片作为一个示例,即共有280×8张CT轴向切片图像;步骤1.3:对抽取的示例进行像素值标准化,统一标定在0到1范围内;同时,根据图像的直方图信息进行灰度变换,减少亮度差异对分类结果造成的影响;控制图像尺寸大小和分辨率一致,保存为.png格式;步骤1.4:将从同一个肺部CT序列图像中获取的8个样本特征视为一个包。如图2所示,(a)为模式A中的一个包中的8个示例;(b)为模式B中的一个包中的8个示例。步骤2:对预处理后的样本采用迁移学习的方法进行特征提取,并采用主成分分析法对特征进行降维;步骤2.1:用已知的自然图像数据集预训练卷积神经网络CNN;步骤2.2:输入步骤1预处理后的样本利用卷积层进行特征提取;所述利用卷积层进行特征提取的方法为:利用浅层即靠近输入层的卷积层的输出作为特征,分别按不同卷积层输出的特征进行分类,比较各个卷积层输出特征的分类准确率,选择准确率最高的一个卷积层的输出特征作为最终提取的特征。本实施例利用预训练的CNN的第四层卷积层提取特征,并以一维大小输出,即每一个示例用大小为1×64896的特征向量表示;图3列出了上述卷积神经网络的主要结构以及从每一个卷积层提取出的特征映射。主要结构包括5个卷积层(Conv1,Conv2,Conv3,Conv4和Conv5),三本文档来自技高网...

【技术保护点】
1.一种肺部CT图像中模糊模式的多示例学习识别方法,其特征在于包括如下步骤:/n步骤1:采用随机抽样的方法分别对模式A和模式B的肺部CT图像样本进行采集,并进行预处理;/n步骤2:对预处理后的样本采用迁移学习的方法进行特征提取,并采用主成分分析法对特征进行降维;/n步骤3:基于提取后的特征采用多示例学习的方案对模式A和模式B进行分类。/n

【技术特征摘要】
1.一种肺部CT图像中模糊模式的多示例学习识别方法,其特征在于包括如下步骤:
步骤1:采用随机抽样的方法分别对模式A和模式B的肺部CT图像样本进行采集,并进行预处理;
步骤2:对预处理后的样本采用迁移学习的方法进行特征提取,并采用主成分分析法对特征进行降维;
步骤3:基于提取后的特征采用多示例学习的方案对模式A和模式B进行分类。


2.根据权利要求1所述的一种肺部CT图像中模糊模式的多示例学习识别方法,其特征在于:所述步骤1的过程如下:
步骤1.1:在人体冠状面方向,分别去掉肺部上下两部分含有较小肺区的切片;
步骤1.2:将其余的肺部平均分成n份,n∈Z,从每份中随机抽取一张切片作为一个示例;
步骤1.3:对抽取的示例进行像素值标准化和灰度变换;
步骤1.4:将从同一个肺部CT序列图像中获取的n个样本特征视为一个包。


3.根据权利要求2所述的一种肺部CT图像中模糊模式的多示例学习识别方法,其特征在于:用所述矢状切面方向或斜切面方向代替步骤1.1中的冠状面方向。


4.根据权利要求1所述的一种肺部CT图像中模糊模式的多示例学习识别方法,其特征在于:所述步骤2的过程如下:
步骤2.1:用已知的自然图像数据集预训练卷积神经网络CNN;
步骤2.2:输入步骤1预处理后的样本利用卷积层进行特征提取;<...

【专利技术属性】
技术研发人员:齐守良徐偲文马贺钱唯
申请(专利权)人:东北大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1