当前位置: 首页 > 专利查询>东北大学专利>正文

一种基于聚类算法和卷积神经网络的肺实质提取方法技术

技术编号:16875454 阅读:81 留言:0更新日期:2017-12-23 12:58
本发明专利技术提出一种基于聚类算法和卷积神经网络的肺实质提取方法,本发明专利技术采用聚类算法对肺部CT图像进行预处理,得到CT图像的肺实质区域和非肺实质区域的数据集,将已知的肺部CT图像的数据集划分为训练集和验证集,将未知的肺部CT图像的数据集作为测试集;建立卷积神经网络模型,采用训练集和验证集数据对卷积神经网络模型进行训练,得到训练后的卷积神经网络模型;将测试集输入训练后的卷积神经网络模型中,得到CT图像肺实质区域,实现了对未知患者的肺部CT图像进行肺实质区域提取功能,并对下一阶段自动搜寻肺癌区域垒下基础,有助于下一阶段的肺癌提取、分类。

A method of lung parenchyma extraction based on clustering algorithm and convolution neural network

The invention provides a method for lung parenchyma extraction method of clustering algorithm and convolution based on neural network, the invention adopts clustering algorithm to preprocess the lung CT images, CT images of the pulmonary parenchyma and non pulmonary parenchyma data sets, the lung CT images of the known data set is divided into training set and validation set. The lung CT images of the unknown data set as the test set; a convolutional neural network model, using the training set and validation of convolutional neural network model training data by convolution neural network model after training; the test set of convolutional neural network model input after training, CT images the lung region, realize the lung CT images of unknown function were extracted from lung parenchyma, and the next phase of the automatic search area of base of lung cancer, is helpful to the next stage Lung cancer is extracted and classified.

【技术实现步骤摘要】
一种基于聚类算法和卷积神经网络的肺实质提取方法
本专利技术属于医学图像处理
,具体涉及一种基于聚类算法和卷积神经网络的肺实质提取方法。
技术介绍
在组织学里,肺组织分为肺实质和肺间质两部分,肺实质即肺内支气管的各级分支及其终末的大量肺泡结构,肺间质为结缔组织及血管、淋巴管、神经等。为了评估与研究肺容积、肺癌,往往医生需要第一步知道肺实质情况,肺实质的准确分割作为进一步研究肺内各器官功能的组织及病变,对医生起着十分重要的作用。在图像的研究和应用的过程中,人们往往仅对图像中的某些部分感兴趣。这些部分常称为目标,他们一般对应图像中特定的具有独特性质的区域。为了辨别和分析目标,需要将这些区域分离提取出来,在此基础上进一步利用。图像分割就是将图像分成各具特色的区域并提取出感兴趣目标的技术和过程。经典的图像分割方法如阈值法、区域增长、边缘检测、聚类和神经网络技术等。阈值分割是最古老的分割技术,也是最简单实用的。许多情况下,图像中目标区域与背景区域或者说不同区域之间其灰度值存在差异,此时可以将灰度的均一性作为依据进行分割,通常受噪声影响较大。边缘检测算法比较适合边缘灰度值过渡比较显著且噪声较小的简单图像的分割。对于边缘比较复杂以及存在较强噪声的图像,则面临抗噪性和检测精度的矛盾。若提高检测精度,则噪声产生的伪边缘会导致不合理的轮廓:若提高抗噪性,则会产生轮廓漏检和位置偏差。聚类分析是模式识别中非监督模式识别的一个重要分支。根据数据集合的内部结构将其分成不同的类别,使得同一类内样本的特征尽可能相似,而属于不同类别的样本点的差异尽可能大。基于神经网络的分割方法的基本思想是通过训练多层感知机来得到线性决策函数,然后用决策函数对像素进行分类来达到分割的目的。这种方法需要大量的训练数据。神经网络存在巨量的连接,容易引入空间信息,能较好地解决图像中的噪声和不均匀问题。选择何种网络结构是这种方法要解决的主要问题。综上所述,目前已提出的分割方法大都针对具体问题,且各有所长,并没有一种通用标准。针对肺实质分割,本专利技术提出了一种利用聚类生成数据训练的卷积神经网络,无阈值的自动化分割肺实质区域,高效且准确。
技术实现思路
针对现有技术的不足,本专利技术提出一种基于聚类算法和卷积神经网络的肺实质提取方法。一种基于聚类算法和卷积神经网络的肺实质提取方法,包括以下步骤:步骤1:采用聚类算法对肺部CT图像进行预处理,得到CT图像的肺实质区域和非肺实质区域的数据集,将已知的肺部CT图像的数据集划分为训练集和验证集,将未知的肺部CT图像的数据集作为测试集;步骤1.1:将肺部CT图像进行标准化处理,对标准化后的肺部CT图像进行分割,分割为尺寸为A的图像小块;步骤1.2:采用Kmeans算法分别对尺寸为A的图像小块的CT值平均值和CT值最小值进行聚类,将其聚类为低密度组织和高密度组织两类;步骤1.3:将对图像小块的CT值平均值的聚类结果和图像小块的CT值最小值的聚类结果进行十字检验,去除CT图像的背景区域;步骤1.4:提取图像小块的CT值平均值的聚类结果中的肺实质区域和图像小块的CT值最小值的聚类结果的肺实质区域的交集;步骤1.5:对步骤1.4中得到的肺实质区域的交集做最大连通体操作,得到CT图像的肺实质区域和非肺实质区域的数据集,将已知的肺部CT图像的数据集划分为训练集和验证集,将待划分的肺部CT图像的数据集作为测试集。步骤2:建立卷积神经网络模型,采用训练集和验证集数据对卷积神经网络模型进行训练,得到训练后的卷积神经网络模型;步骤2.1:将训练集和验证集中的尺寸为A的图像小块进行扩展,将其扩展为尺寸为B的图像小块;步骤2.2:建立卷积神经网络模型,将扩展后的图像小块输入卷积神经网络模型,训练卷积神经网络模型的各层的权重和偏差;步骤2.3:将验证集输入卷积神经网络模型进行分类,通过运行时间损耗和验证集的分类准确率确定最优化的训练参数,得到训练后的卷积神经网络模型。步骤3:将测试集输入训练后的卷积神经网络模型中,得到CT图像肺实质区域。所述卷积神经网络模型结构为:第一层为图像小块输入层,第二层为卷积层,第三层为最大值池化层,第四层为全连接层;所述卷积层包括卷积层ReLU层和Norm层;所述全连接层包括全连接层ReLU层、随机遗忘层、全连接层分类器和Softmax函数层。所述尺寸A的划分标准为:所划分的尺寸为A的图像小块中均包含有CT图像中的肺部组织,且各CT图像的图像小块自动分割时间在50MS以内。所述训练集和验证集中肺实质的尺寸为A的图像小块与非肺实质的尺寸为A的图像小块的数量各占50%。所述将对图像小块的CT值平均值的聚类结果和图像小块的CT值最小值的聚类结果进行十字检验,去除CT图像的背景区域的具体过程如下所示:检验每个低密度组织的图像小块的四个径向是否都存在高密度组织的图像小块,若存在,则该低密度组织的图像小块为疑似肺实质区域,否则该低密度组织的图像小块为背景区域。所述将训练集和验证集中的尺寸为A的图像小块进行扩展,将其扩展为尺寸为B的图像小块的具体过程如下所示:以尺寸为A的图像小块为中心在原CT图像内的位置上扩展为尺寸为B的图像小块。所述的训练参数包括:学习速率、卷积核尺寸、卷积核数目、Norm层标准化通道数目、全连接第一层输出数目、Dropout层遗忘率、池化层类型、Batch数目、Epochs数值。本专利技术的有益效果:本专利技术提出一种基于聚类算法和卷积神经网络的肺实质提取方法,本专利技术通过无监督学习算法,即聚类算法,对患者CT图像自动划分肺实质区域与非肺实质区域,达到自动生成训练卷积神经网络所需的训练集、验证集功能;通过有监督学习算法,即卷积神经网络,针对肺实质区域分类,设计最佳的卷积神经网络模型,达到准确率高的肺实质区域分类效果;实现了对未知患者的肺部CT图像进行肺实质区域提取功能,并对下一阶段自动搜寻肺癌区域垒下基础,有助于下一阶段的肺癌提取、分类。附图说明图1为本专利技术具体实施方式中基于聚类算法和卷积神经网络的肺实质提取方法的流程图;图2为本专利技术具体实施方式中对标准化后的肺部CT图像进行分割的过程示意图;其中,(a)为分割尺寸为64*64的肺部CT图像;(b)为分割尺寸为32*32的肺部CT图像;(c)为分割尺寸为16*16的肺部CT图像;(d)为分割尺寸为8*8的肺部CT图像;(e)为分割尺寸为4*4的肺部CT图像;(f)为分割尺寸为2*2的肺部CT图像;图3为本专利技术具体实施方式中得到CT图像的肺实质区域和非肺实质区域的过程示意图;其中,(a)为采用Kmeans算法分别对尺寸为A的图像小块的CT值平均值进行聚类的结果;(b)为CT值平均值的低密度类十字检验结果;(c)为采用Kmeans算法分别对尺寸为A的图像小块的CT值最小值进行聚类的结果;(d)为CT值最小值的低密度类十字检验结果;(e)为提取图像小块的CT值平均值的聚类结果中的肺实质区域和图像小块的CT值最小值的聚类结果的肺实质区域的交集的示意图;(f)为CT图像的肺实质区域和非肺实质区域的示意图;图4为本专利技术具体实施方式中将尺寸为A的图像小块进行扩展为尺寸为B的图像小块的示意图;其中,(a)为尺寸为A的图像小块;(b)为尺寸为B的图像小块;图5为本专利技术具体实施方式中卷积神经本文档来自技高网
...
一种基于聚类算法和卷积神经网络的肺实质提取方法

【技术保护点】
一种基于聚类算法和卷积神经网络的肺实质提取方法,其特征在于,包括以下步骤:步骤1:采用聚类算法对肺部CT图像进行预处理,得到CT图像的肺实质区域和非肺实质区域的数据集,将已知的肺部CT图像的数据集划分为训练集和验证集,将未知的肺部CT图像的数据集作为测试集;步骤2:建立卷积神经网络模型,采用训练集和验证集数据对卷积神经网络模型进行训练,得到训练后的卷积神经网络模型;步骤3:将测试集输入训练后的卷积神经网络模型中,得到CT图像肺实质区域。

【技术特征摘要】
1.一种基于聚类算法和卷积神经网络的肺实质提取方法,其特征在于,包括以下步骤:步骤1:采用聚类算法对肺部CT图像进行预处理,得到CT图像的肺实质区域和非肺实质区域的数据集,将已知的肺部CT图像的数据集划分为训练集和验证集,将未知的肺部CT图像的数据集作为测试集;步骤2:建立卷积神经网络模型,采用训练集和验证集数据对卷积神经网络模型进行训练,得到训练后的卷积神经网络模型;步骤3:将测试集输入训练后的卷积神经网络模型中,得到CT图像肺实质区域。2.根据权利要求1所述的基于聚类算法和卷积神经网络的肺实质提取方法,其特征在于,所述步骤1包括以下步骤:步骤1.1:将肺部CT图像进行标准化处理,对标准化后的肺部CT图像进行分割,分割为尺寸为A的图像小块;步骤1.2:采用Kmeans算法分别对尺寸为A的图像小块的CT值平均值和CT值最小值进行聚类,将其聚类为低密度组织和高密度组织两类;步骤1.3:将对图像小块的CT值平均值的聚类结果和图像小块的CT值最小值的聚类结果进行十字检验,去除CT图像的背景区域;步骤1.4:提取图像小块的CT值平均值的聚类结果中的肺实质区域和图像小块的CT值最小值的聚类结果的肺实质区域的交集;步骤1.5:对步骤1.4中得到的肺实质区域的交集做最大连通体操作,得到CT图像的肺实质区域和非肺实质区域的数据集,将已知的肺部CT图像的数据集划分为训练集和验证集,将待划分的肺部CT图像的数据集作为测试集。3.根据权利要求1所述的基于聚类算法和卷积神经网络的肺实质提取方法,其特征在于,所述步骤2包括以下步骤:步骤2.1:将训练集和验证集中的尺寸为A的图像小块进行扩展,将其扩展为尺寸为B的图像小块;步骤2.2:建立卷积神经网络模型,将扩展后的图像小块输入卷积神经网络模型,训练卷积神经网络模型的各层的权重和偏差;步骤2.3:将验证集输入卷积神经网络模型进行分类,通过运行时间损耗和验证集的分类准确率确定最...

【专利技术属性】
技术研发人员:齐守良徐明杰杨帆钱唯
申请(专利权)人:东北大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1