基于深度学习的早期肺癌预测方法技术

技术编号:26035441 阅读:45 留言:0更新日期:2020-10-23 21:13
本发明专利技术涉及一种基于深度学习的早期肺癌预测方法,包括步骤:获取多中心的早期肺腺癌的肺结节CT扫描图像数据,并进行图像数据预处理;对预处理后的肺结节CT扫描图像数据依据掩膜方式进行节点区域提取;基于mdCNN工具箱,构建顺次连接的三重CNN神经网络模型;将实时的病患的肺结节CT扫描图像数据进行预处理后,输入训练好的三重CNN神经网络模型,对病患是否为早期肺腺癌进行判断。通过本发明专利技术,能够对早期肺腺癌疑似患者的患病情况进行预测,节省人工判断时间,缩短就诊流程。

【技术实现步骤摘要】
基于深度学习的早期肺癌预测方法
本专利技术涉及机器学习
,更具体地说,涉及一种基于深度学习的早期肺癌预测方法。
技术介绍
中国最新癌症流行病学统计显示2015年新增肺癌病人73万,死亡病人60万,肺癌已成为中国发病率和死亡率均居于首位的癌症。肺癌死亡例数占总体癌症死亡例数的25%。由于肺癌的高复发风险和低存活率,绝大多数处于IB-IIIA期的肺癌病人都会进行术后辅助化疗。但基于病灶残留程度、淋巴结转移情况、癌症分期等参数,即使是同样的治疗方案,病人总体预后也会大不相同。近年来,临床医生一直致力于寻找肺癌有关的独立预后因素。肿瘤大小和病理分级、淋巴结是否转移、受累淋巴结的数目和部位以及是否存在基因突变等都被发现是与肿瘤预后有关的因素,准确评估这些因素可以帮助我们正确筛选出具有高复发转移倾向的预后不良现象,从而为患者提供更个性化的治疗方案,对提高肺癌的疗效具有重要意义。
技术实现思路
针对现有方法的不足,提出一种基于深度学习的早期肺癌预测方法。本专利技术解决其技术问题所采用的技术方案是:构造一种基于深度学习的早期肺癌预测方法,包括:获取多中心的早期肺腺癌的肺结节CT扫描图像数据,并进行图像数据预处理;其中,预处理的方式至少包括数据整合、数据清洗、缺失填补及归一化处理;对预处理后的肺结节CT扫描图像数据依据掩膜方式进行节点区域提取,按切片顺序进行组装,用插值方法扩增肺癌病灶节点图像,将扩增后的肺癌病灶节点图像分为训练集和测试集两组;基于mdCNN工具箱,构建顺次连接的三重CNN神经网络模型,将作为训练集的的肺癌病灶节点图像作为作为三重CNN神经网络模型的输入,通过调整三重CNN神经网络模型的参数,并通过作为测试集的肺癌病灶节点图像验证三重CNN神经网络模型的准确度;将实时的病患的肺结节CT扫描图像数据进行预处理后,输入训练好的三重CNN神经网络模型,对病患是否为早期肺腺癌进行判断。其中,在进行图像数据预处理的步骤中,包括步骤:对属于同一病患的肺结节CT扫描图像进行删除,对缺失及命名不规范的图像数据进行删除;利用画图软件在图像中勾的结节病灶;对肺结节CT扫描图像的像素值进行归一化处理。其中,在对预处理后的肺结节CT扫描图像数据依据掩膜方式进行节点区域提取的步骤中,使用掩膜方式的目的是在肺结节CT扫描图像上选定的区域中对一个不透明的图形模板遮盖,继而后续的腐蚀或扩散将只影响选定的区域以外的区域。其中,经过肺癌病灶节点图像扩充后,扩充后的肺癌病灶节点图像形成64x64x64的向量数据表示形式。其中,在第一重CNN神经网络模型的构建过程中,设计7层的CNN神经网络模型,并将64x64x64的向量数据输入第一重CNN神经网络模型,输出结果为三类早期肺腺癌的病症类型。其中,在第二重CNN神经网络模型的构建过程中,包括步骤:对肺癌病灶节点图像进行缩放,使其像素间距为1mm,依据掩膜方式进行节点区域提取,确定节点中心位置,按切片顺序进行组装,提取节点28x28x28mm的区域,并用差值法形成28x28x28的向量数据;截取节点所在区域,进行归一化使像素值在0~1之间,并进行边缘检测,并依据边缘检测结果进行进行二值化赋值,以边缘检测结果的二值化赋值组成的三维向量表征取肺癌病灶节点图像中的肺癌节点;设计8层的CNN神经网络模型,将28x28x28的肺癌病灶节点图像数据作为输入,输出结果为三类早期肺腺癌的病症类型。其中,在构建28x28x28的肺癌病灶节点图像数据的步骤之后,对于样本进行多增强,对于三类早期肺腺癌的病症样本,增强的目标数目为训练集的样本数目的10倍;增强的方法为:识别三类早期肺腺癌的病症样本类别中的图像,进行三维的-180~180度的随机旋转。其中,在第三重CNN神经网络模型的构建过程中,包括步骤:按顺序获取肺癌病灶节点图像的中心位置,从中心位置开始进行扩展从序列CT图像中提取节点中心28x28x28的的图像序列,通过插值方法获取28张28mmx28mm的序列图像,根据像素间距将图像缩放到像素间距表示1mm,28mmx28mm正好为28x28像素,除了之前的整张图像做归一化后进行截取缩放不做任何其余处理;将每个肺癌病灶节点图像对应的临床信息换算为做成28x28的矩阵添加到肺癌节点的数据中,28x28x29的肺癌病灶节点图像数据;设计8层的CNN神经网络模型,将28x28x29的肺癌病灶节点图像数据作为输入,输出结果为三类早期肺腺癌的病症类型。其中,在构建28x28x29的肺癌病灶节点图像数据的步骤之后,对于样本量少类别样本进行多增强,对于三类早期肺腺癌的病症样本类别少的样本进行少增强,使三个类别保持训练样本的均衡,增强的目标数目为训练集的样本数目的10倍;增强的方法为:识别三类早期肺腺癌的病症样本类别中数量最少的一类图像,进行三维的-180~180度的随机旋转。其中,在建模完成的步骤之后,还包括对三重CNN神经网络模型的能效进行验证评估的步骤,其中采用准确率、错误率、灵敏度、特效度、精度、召回率、综合评价及ROC曲线方面来进行模型效能的评估。区别于现有技术,本专利技术提供了一种基于深度学习的早期肺癌预测方法,包括步骤:获取多中心的早期肺腺癌的肺结节CT扫描图像数据,并进行图像数据预处理;对预处理后的肺结节CT扫描图像数据依据掩膜方式进行节点区域提取;基于mdCNN工具箱,构建顺次连接的三重CNN神经网络模型;将实时的病患的肺结节CT扫描图像数据进行预处理后,输入训练好的三重CNN神经网络模型,对病患是否为早期肺腺癌进行判断。通过本专利技术,能够对早期肺腺癌疑似患者的患病情况进行预测,节省人工判断时间,缩短就诊流程。附图说明下面将结合附图及实施例对本专利技术作进一步说明,附图中:图1是本专利技术提供的一种基于深度学习的早期肺癌预测方法的流程示意图。具体实施方式为了对本专利技术的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本专利技术的具体实施方式。参阅图1,本专利技术提供了一种基于深度学习的早期肺癌预测方法,包括:获取多中心的早期肺腺癌的肺结节CT扫描图像数据,并进行图像数据预处理;其中,预处理的方式至少包括数据整合、数据清洗、缺失填补及归一化处理;对预处理后的肺结节CT扫描图像数据依据掩膜方式进行节点区域提取,按切片顺序进行组装,用插值方法扩增肺癌病灶节点图像,将扩增后的肺癌病灶节点图像分为训练集和测试集两组;基于mdCNN工具箱,构建顺次连接的三重CNN神经网络模型,将作为训练集的的肺癌病灶节点图像作为作为三重CNN神经网络模型的输入,通过调整三重CNN神经网络模型的参数,并通过作为测试集的肺癌病灶节点图像验证三重CNN神经网络模型的准确度;将实时的病患的肺结节CT扫描图像数据进行预处理后,输入训练好的三重CNN神经网络模型,对病患是否为早期肺腺癌进行判断。数字图像处本文档来自技高网...

【技术保护点】
1.一种基于深度学习的早期肺癌预测方法,其特征在于,包括:/n获取多中心的早期肺腺癌的肺结节CT扫描图像数据,并进行图像数据预处理;其中,预处理的方式至少包括数据整合、数据清洗、缺失填补及归一化处理;/n对预处理后的肺结节CT扫描图像数据依据掩膜方式进行节点区域提取,按切片顺序进行组装,用插值方法扩增肺癌病灶节点图像,将扩增后的肺癌病灶节点图像分为训练集和测试集两组;/n基于mdCNN工具箱,构建顺次连接的三重CNN神经网络模型,将作为训练集的的肺癌病灶节点图像作为作为三重CNN神经网络模型的输入,通过调整三重CNN神经网络模型的参数,并通过作为测试集的肺癌病灶节点图像验证三重CNN神经网络模型的准确度;/n将实时的病患的肺结节CT扫描图像数据进行预处理后,输入训练好的三重CNN神经网络模型,对病患是否为早期肺腺癌进行判断。/n

【技术特征摘要】
1.一种基于深度学习的早期肺癌预测方法,其特征在于,包括:
获取多中心的早期肺腺癌的肺结节CT扫描图像数据,并进行图像数据预处理;其中,预处理的方式至少包括数据整合、数据清洗、缺失填补及归一化处理;
对预处理后的肺结节CT扫描图像数据依据掩膜方式进行节点区域提取,按切片顺序进行组装,用插值方法扩增肺癌病灶节点图像,将扩增后的肺癌病灶节点图像分为训练集和测试集两组;
基于mdCNN工具箱,构建顺次连接的三重CNN神经网络模型,将作为训练集的的肺癌病灶节点图像作为作为三重CNN神经网络模型的输入,通过调整三重CNN神经网络模型的参数,并通过作为测试集的肺癌病灶节点图像验证三重CNN神经网络模型的准确度;
将实时的病患的肺结节CT扫描图像数据进行预处理后,输入训练好的三重CNN神经网络模型,对病患是否为早期肺腺癌进行判断。


2.根据权利要求1所述的基于深度学习的早期肺癌预测方法,其特征在于,在进行图像数据预处理的步骤中,包括步骤:
对属于同一病患的肺结节CT扫描图像进行删除,对缺失及命名不规范的图像数据进行删除;
利用画图软件在图像中勾的结节病灶;
对肺结节CT扫描图像的像素值进行归一化处理。


3.根据权利要求1所述的基于深度学习的早期肺癌预测方法,其特征在于,在对预处理后的肺结节CT扫描图像数据依据掩膜方式进行节点区域提取的步骤中,使用掩膜方式的目的是在肺结节CT扫描图像上选定的区域中对一个不透明的图形模板遮盖,继而后续的腐蚀或扩散将只影响选定的区域以外的区域。


4.根据权利要求3所述的基于深度学习的早期肺癌预测方法,其特征在于,经过肺癌病灶节点图像扩充后,扩充后的肺癌病灶节点图像形成64x64x64的向量数据表示形式。


5.根据权利要求4所述的基于深度学习的早期肺癌预测方法,其特征在于,在第一重CNN神经网络模型的构建过程中,设计7层的CNN神经网络模型,并将64x64x64的向量数据输入第一重CNN神经网络模型,输出结果为三类早期肺腺癌的病症类型。


6.根据权利要求1所述的基于深度学习的早期肺癌预测方法,其特征在于,在第二重CNN神经网络模型的构建过程中,包括步骤:
对肺癌病灶节点图像进行缩放,使其像素间距为1mm,依据掩膜方式进行节点区域提取,确定节点中心位置,按切片顺序进行组装,提取节点28x28x28mm...

【专利技术属性】
技术研发人员:吴云飞
申请(专利权)人:南昌迭心信息科技有限公司
类型:发明
国别省市:江西;36

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1