一种基于改进的深度玻尔兹曼机肺结节特征提取方法技术

技术编号:16501689 阅读:39 留言:0更新日期:2017-11-04 12:02
本发明专利技术公开了一种基于改进的深度玻尔兹曼机肺结节特征提取和良恶性分类方法,包括以下步骤:步骤A,通过阈值概率图像图方法从CT图像分割肺结节,得到感兴趣区域(ROI),并裁剪成同一大小的结节图像;步骤B,设计有监督的深度学习算法Pnd‑EBM实现肺结节的诊断,其中包括三大步骤:B1采用基于深度玻尔兹曼机(DBM)提取肺结节ROI的具有深层表达能力的特征;B2、采用稀疏交叉熵惩罚因子改进代价函数,以解决训练过程中“特征同质化”现象;B3,采用基于极限学习机(ELM)将提取出来的肺结节特征进行良恶性分类。本发明专利技术的方法基于改进的深度波尔兹曼机肺结节特征提取方法,优于传统的特征提取方法,避免了人工提取复杂性及特征选择的差异性,能够为临床诊断提供参考依据。

Feature extraction and benign and malignant classification of lung nodules based on improved depth Boltzmann machine

The invention discloses a method for depth Boltzmann machine improved feature extraction of pulmonary nodules and benign or malignant based classification, which comprises the following steps: step A, segmentation of pulmonary nodules from CT images by image threshold probability method, get the region of interest (ROI), and cut into one small nodule image; step B. The design has realized the diagnosis of pulmonary nodules Pnd EBM learning algorithm of depth supervision, which includes three steps: B1 the depth based on Boltzmann machine (DBM) extraction with deep expression ability characteristics of pulmonary nodules ROI; B2, using sparse cross entropy penalty factor improved cost function, in order to solve the feature in the training process of homogenization \phenomenon; B3, the extreme learning machine (ELM) based on the extracted features of pulmonary nodules were benign and malignant classification. Extraction method of nodules feature depth Boltzmann machine based on improved lung method of the invention, a feature extraction method is superior to the traditional, to avoid the complexity of the differences and characteristics of artificial extraction, to provide reference for clinical diagnosis.

【技术实现步骤摘要】
一种基于改进的深度玻尔兹曼机肺结节特征提取和良恶性分类方法
本专利技术涉及肺结节特征提取,具体涉及一种基于改进的深度玻尔兹曼机肺结节特征提取和良恶性分类方法。
技术介绍
传统的计算机辅助诊断系统(computeraideddiagnosis,简称CAD)分析肺结节一般采用基于形态学的结节分割和人工提取肺结节纹理特征或形状特征。这种基于底层特征的分类方法可以克服人眼的惰性和对灰度图像的不敏感性,提高放射科医生对结节识别和诊断的精确性,但是选取什么样肺结节图像表征,很大程度上依靠经验和运气;而且使用形态学对结节的描述是不准确的,比如结节边缘的定义是模糊的、主观的。基于深度波尔兹曼机无监督方法能够让机器自动地学习到肺结节图像深层结构特征,就能很好地避免人为因素的影响,借鉴人脑的多层抽象机制来实现对肺结节抽象表达,使学习到的特征相似于生物视觉的特征,从而提升分类的准确性,并辅助医师做出可靠的诊断决策。
技术实现思路
本专利技术针对现有技术的不足提供一种基于深度波尔兹曼机的肺结节特征提取以及采用极限学习机进行良恶性分类,既能自动提取到肺结节具有表达能力的深层特征,又能对提取的特征进行准确、快速的分类,为医师对查询病灶的诊断提供决策支持,从客观方面起到辅助诊断的作用。本专利技术采用的技术方案为:一种基于改进的深度玻尔兹曼机肺结节特征提取和良恶性分类方法,包括以下步骤:步骤A,采用阈值概率图方法从肺部CT图像分割肺结节,得到感兴趣区域(ROI),并裁剪成同一大小的结节图像存入样本数据库;步骤B,设计有监督的深度学习算法Pnd-EBM实现肺结节的诊断,具体为采用基于深度玻尔兹曼机(DBM)提取肺结节ROI的具有深层表达能力的特征:通过DBM两个隐层提取肺结节浅层和高层特征,并通过修改代价函数,解决训练过程中特征同质化现象,从而获得表达肺结节高维的特征信息,并为下一步分类做准备;然后采用基于极限学习机(ELM)将提取的肺结节特征进行良恶性分类。所述的方法,所述步骤A具体步骤如下:A1、预处理数据集第1步,假设LIDC数据库中4位放射性专家专家经验值一样,因此赋给每个专家的权重值均为0.25;第2步,如果区域中的某个像素同时被μ(1≤μ≤4)名专家标注,则该像素为结节区域的概率值为0.25μ;第3步,经过上述操作,将肺结节ROI转换为0~1之间的概率映射图;第4步,设置一个阈值K,分割肺结节区域时概率值低于K的像素设置为0,高于K的像素设置为1,就生成了相应的二值图像;第5步,将此二值图像与原图像进行AND运算,即得到肺结节图像;第6步,将肺结节图像统一裁剪成大小为32×32,存入样本数据库中,作为Pnd-DBM的输入;A2、扩充并平衡数据集:第1步,将良性结节向x轴、y轴方向平移±2像素,以及将肺结节旋转90°,180°,270°后存储;第2步,将恶性结节每隔90°旋转一次并存储;经过扩充数据集操作后,良性结节扩充8倍,恶性结节扩充4倍,在扩充数据集的同时也解决了数据集不平衡的问题。所述的方法,所述步骤B具体步骤如下:基于DBM和ELM算法,提出Pnd-EDBM用于肺结节特征提取与良恶性分类,DBM前两个隐含层用来提取肺结节特征,可见层与第一个隐含层构成第一个RBM模型,第一个隐含层与第二个隐含层构成第二个RBM模型,由于第二个隐含层同时也作为ELM的隐含层,因此第二、三个隐含层与分类层构成ELM模型;第一个RBM模型提取肺结节特征信息并对输入数据构建低层特征表达,第二个RBM模型构建肺结节高层的特征表达,ELM模型对提取到的高层特征进行快速准确分类;具体训练步骤如下:第1步,无监督训练:以重构误差函数作为目标函数,采用贪婪逐层算法,先对第一层的RBM进行无监督学习,直到数据达到收敛条件或超过训练迭代次数后,固定本层的参数并传递给下一个RBM进行训练;第2步,有监督微调:首先,利用带标签的训练样本对ELM分类器进行训练,然后利用将已经调好的DBM网络参数作为微调的初始值,采用mini-batch梯度下降法,通过最小化交叉熵函数,找到全局最优点,微调网络参数;B1、DBM提取肺结节过程如下;第1步,采用两隐含层深度玻尔兹曼机来提取肺结节特征,用一个二值的可见单元向量来表示输入结节图像,h1与h2是底层与高层的二值隐含单元向量;对于给定的一组状态{v,h1,h2},定义如下能量函数:E(v,h1,h2,θ)=-vTWh1-h1Jh2-a1Th1-a2Th2-bTv其中,θ={W,J,a1,a2,b}为DBM参数,W为可见单元v到隐含单元h1的权值矩阵,J为隐含单元h1到隐含单元h2的权值矩阵,a1和a2分别为表示隐含单元的偏置,b表示可见单元的偏置;第2步,则可见单元与隐藏单元的联合概率为:其中,常数项Z(θ)定义为:第3步,根据逻辑回归函数得到两个隐含层以及可见层单元重构的条件分布概率为:通过上述几个式子,就得到了DBM模型的参数;B2、采用稀疏交叉熵惩罚因子改进代价函数;定义两个随机分布q(x)与p(x)之间的交叉熵(crossentropy)为q(x)与p(x)之间的Kullback-Leiber距离与p(x)的熵之和,定义如下所示:CrossEntropy=-∫p(x)lnq(x)dx当q(x)等于p(x)时,交叉熵最小,即Kullback-Leiber距离最小;利用交叉熵的概念,提出新的稀疏惩罚因子——交叉熵稀疏惩罚因子,p(x)为隐单元稀疏度,q(x)为隐单元激活概率分布,RBM隐单元个数为M,L为训练样本V的个数,如下所示:对给定训练集V={v(1),...,v(m)},对于RBM的训练,就是处理下式的优化问题:式中λ为稀疏正则化常数,p用于控制隐单元的稀疏程度,即通过稀疏惩罚因子鼓励隐单元在学习过程中的平均激活概率与p之间的Kullback-Leiber距离达到最小,使隐单元具备稀疏性;B3、采用ELM进行良恶性分类第1步,设训练样本为[xi,ti](i=1,2,3,...,k),对于一个M个隐层节点的神经网络可以表示为:其中,xi代表每一个肺结节特征样本,ti代表良性或者恶性结果,β为隐含层和输出层之间的连接权值矩阵;g(x)为隐含层的激活函数,可取sigmoid、sine或者RBF函数;w为输入层和隐含层之间的连接权值,c为隐含层的偏置向量;第2步,单隐层的神经网络学习的目的是使得输出的误差最小,也就是存在w,β,b使得o与t近似相等:第3步,确定隐含层神经元个数,随机设定输入层与隐含层的连接权值w和隐含层神经元的阈值b;第4步,选择一个无限可微的函数作为隐含层神经元的激活函数,进而计算隐含层输出层矩阵H,用矩阵形式可表示为:HB=T,式中H被称作网络的隐含层输出矩阵;第5步,隐含层和输出层之间的连接权值β可由HB=T的极小二范数最小二乘解得:计算输出值权值式中为隐含层输出矩阵H的Moore-penrose广义逆。与现有技术相比,本专利技术的有益效果为:1、本专利技术的方法针对LIDC数据库中CT进行预处理,采用的是概率阈值图,而不是分割结节,也没有使用任何形态学处理结节,保留了原始结节信息;2、与传统的方法手工提取结节特征相比,比如纹理特征、形状特性等,本专利技术方法使用的DBM算法能够自动获取结节有区别能力的特征本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/55/201710507191.html" title="一种基于改进的深度玻尔兹曼机肺结节特征提取方法原文来自X技术">基于改进的深度玻尔兹曼机肺结节特征提取方法</a>

【技术保护点】
一种基于改进的深度玻尔兹曼机肺结节特征提取和良恶性分类方法,其特征在于,包括以下步骤:步骤A,采用阈值概率图方法从肺部CT图像分割肺结节,得到感兴趣区域(ROI),并裁剪成同一大小的结节图像存入样本数据库;步骤B,设计有监督的深度学习算法Pnd‑EBM实现肺结节的诊断,具体为采用基于深度玻尔兹曼机(DBM)提取肺结节ROI的具有深层表达能力的特征:通过DBM两个隐层提取肺结节浅层和高层特征,并通过修改代价函数,解决训练过程中特征同质化现象,从而获得表达肺结节高维的特征信息,并为下一步分类做准备;然后采用基于极限学习机(ELM)将提取的肺结节特征进行良恶性分类。

【技术特征摘要】
1.一种基于改进的深度玻尔兹曼机肺结节特征提取和良恶性分类方法,其特征在于,包括以下步骤:步骤A,采用阈值概率图方法从肺部CT图像分割肺结节,得到感兴趣区域(ROI),并裁剪成同一大小的结节图像存入样本数据库;步骤B,设计有监督的深度学习算法Pnd-EBM实现肺结节的诊断,具体为采用基于深度玻尔兹曼机(DBM)提取肺结节ROI的具有深层表达能力的特征:通过DBM两个隐层提取肺结节浅层和高层特征,并通过修改代价函数,解决训练过程中特征同质化现象,从而获得表达肺结节高维的特征信息,并为下一步分类做准备;然后采用基于极限学习机(ELM)将提取的肺结节特征进行良恶性分类。2.根据权利要求1所述的方法,其特征在于,所述步骤A具体步骤如下:A1、预处理数据集第1步,假设LIDC数据库中4位放射性专家专家经验值一样,因此赋给每个专家的权重值均为0.25;第2步,如果区域中的某个像素同时被μ(1≤μ≤4)名专家标注,则该像素为结节区域的概率值为0.25μ;第3步,经过上述操作,将肺结节ROI转换为0~1之间的概率映射图;第4步,设置一个阈值K,分割肺结节区域时概率值低于K的像素设置为0,高于K的像素设置为1,就生成了相应的二值图像;第5步,将此二值图像与原图像进行AND运算,即得到肺结节图像;第6步,将肺结节图像统一裁剪成大小为32×32,存入样本数据库中,作为Pnd-DBM的输入;A2、扩充并平衡数据集:第1步,将良性结节向x轴、y轴方向平移±2像素,以及将肺结节旋转90°,180°,270°后存储;第2步,将恶性结节每隔90°旋转一次并存储。3.根据权利要求1所述的方法,其特征在于,所述步骤B具体步骤如下:基于DBM和ELM算法,提出Pnd-EDBM用于肺结节特征提取与良恶性分类,DBM前两个隐含层用来提取肺结节特征,可见层与第一个隐含层构成第一个RBM模型,第一个隐含层与第二个隐含层构成第二个RBM模型,由于第二个隐含层同时也作为ELM的隐含层,因此第二、三个隐含层与分类层构成ELM模型;第一个RBM模型提取肺结节特征信息并对输入数据构建低层特征表达,第二个RBM模型构建肺结节高层的特征表达,ELM模型对提取到的高层特征进行快速准确分类;具体训练步骤如下:第1步,无监督训练:以重构误差函数作为目标函数,采用贪婪逐层算法,先对第一层的RBM进行无监督学习,直到数据达到收敛条件或超过训练迭代次数后,固定本层的参数并传递给下一个RBM进行训练;第2步,有监督微调:首先,利用带标签的训练样本对ELM分类器进行训练,然后利用将已经调好的DBM网络参数作为微调的初始值,采用mini-batch梯度下降法,通过最小化交叉熵函数,找到全局最优点,微调网络参数;B1、DBM提取肺结节过程如下;第1步,采用两隐含层深度玻尔兹曼机来提取肺结节特征,用一个二值的可见单元向量来表示输入结节图像,h1与h2是底层与高层的二值隐含单元向量;对于给定的一组状态{v,h1,h2},定义如下能量函数:E(v,h1,h2,θ)=-vTWh1-h1Jh2-a1Th1-a2Th2-bTv其中,θ={W,J,a1,a2,b}为DBM参数,W为可见单元v到隐含单元h1的权值矩阵,J为隐含单元h1到隐含单元h2的权值矩阵,a1和a2分别为表示隐含单元的偏置,b表示可见单元的偏置;第2步,则可见单元与隐藏单元的联合概率为:

【专利技术属性】
技术研发人员:赵涓涓张婷强彦罗嘉滢
申请(专利权)人:太原理工大学
类型:发明
国别省市:山西,14

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1