基于深度学习的医学图像肺结节检测方法技术

技术编号:16839049 阅读:81 留言:0更新日期:2017-12-19 20:54
本发明专利技术公开了一种基于深度学习的医学图像肺结节检测方法,主要解决现有技术由于提取的有效医学图像数据量不足而导致检测精度低的问题。其实现方案为:1)获取医学图像;2)在医学图像中引入高斯噪声,扩充数据样本集;3)构建新的特征提取网络;4)用新的特征提取网络,结合现有的区域建议网络和分类网络,获得检测模型;5)利用扩充数据样本集对检测模型进行训练;6)用训练好的检测模型进行肺结节检测。本发明专利技术构建的新的特征提取网络,减轻了网络过拟合的程度,提高了对医学图像肺结节的检测精度,可用于计算机辅助诊断系统。

Detection of pulmonary nodules in medical images based on depth learning

The invention discloses a medical image lung nodule detection method based on deep learning, which mainly solves the problem of low detection accuracy due to the lack of effective medical image data extracted from the existing technology. In fact, this scheme is: 1) to obtain medical images; 2) the introduction of Gauss noise in the medical image, expand the data set; 3) to construct a new feature extraction network; 4) network extraction with new features, combined with the existing network region is proposed and the classification network, detection model; 5) using extended data sample set of detection models are trained; 6) for detection of pulmonary nodules detected by the trained model. The new feature extraction network constructed by the invention reduces the over fitting degree of the network, improves the detection accuracy of the medical image pulmonary nodules, and can be applied to the computer-aided diagnosis system.

【技术实现步骤摘要】
基于深度学习的医学图像肺结节检测方法
本专利技术属于图像处理
,涉及一种医学图像肺结节检测方法。可用于计算机辅助诊断系统。
技术介绍
肺结节是肺癌最重要的早期征象之一,根据肺结节的病变特征能推断出肺部病灶的病变特性。所以,对肺部疾病患者进行及早的肺结节检测和治疗是降低肺癌死亡率的关键措施。肺癌因其高发病率、高死亡率已成为癌症中最为致命的肿瘤疾病,随着人们生活习惯的改变和环境的日益恶化,肺癌人群日益增加,社会对此关注度日益增加。结合肺结节的医学特性,利用深度学习技术对医学图像进行处理和研究,能为医生提供有用的参考信息,辅助医生及时地对肺部疾病患者做出准确的诊断。现有的肺癌计算机辅助诊断主要流程包括:肺结节的特征提取和肺结节的分类识别。在特征提取环节,对肺结节的形态学特征、纹理特征、局部特征等方面的病理特征和图像信息进行人工提取特征。人工提取特征的步骤繁琐,效率低。分类识别方法通常是基于统计学得到的,例如贝叶斯分类算法、人工神经网络、模糊聚类等。这些方法共同的理论基础是传统统计学,均属于浅层结构模型,通常需要强的先验知识或者需要通过不同的特征尝试和参数选择才能得到满意的特征,给整个分类问题带来复杂性,导致现有的医学图像肺结节的检测速度较慢、精度较低。
技术实现思路
本专利技术的目的在于针对上述现有技术的不足,提出一种基于深度学习的医学图像肺结节检测方法,以提高肺结节图像的检测精度。本专利技术的技术方案设计这样实现的:一.技术原理卷积神经网络其权值共享的特点可降低网络模型的复杂度,减少权值的数量,避免传统算法中复杂的特征提取和数据重建过程。卷积神经网络对平移、比例缩放和倾斜具有高度不变性,训练模型不需要使用任何人工特征,可以自动探索图像所隐含的特征。本专利技术从原始的像素出发通过卷积神经网络来自动发现医学图像中隐藏的特征,通过不断学习后得到有效特征。为了防止现有的带标签的医学图像数据量较少和网络结构的过拟合,本专利技术引入随机数据过拟合策略,通过复制样本,并在复制后的数据样本中加入高斯噪声,扩充训练样本集。针对现有的卷积神经网络结构参数多的问题,本专利技术采用高层特征融合方法,减少网络结构参数,以更有效地提取特征,提高检测精度。二.根据上述原理,本专利技术具体技术方案包括如下:(1)从肺部图像数据库联盟LIDC的原始数据集随机选取100个病例的图像,通过读取原始数据集的XML格式注释文件,提取出肺结节坐标信息,并用病例图像和肺结节坐标信息组成样本数据集;(2)引入高斯噪声,扩充样本数据集:对样本数据集进行数据扩充,即对数据样本进行缩放和裁剪,并对所有样本进行复制,在复制后的数据样本中加入均值为0,方差为0.02的高斯噪声,组成扩充后的样本数据集;(3)构建新的共享特征的特征提取网络:(3a)从牛津大学计算机视觉组VGGNet-16网络中选择其前12层卷积层作为特征提取的第一部分网络;(3b)在第一部分网络之后增加第二部分网络,组成共享特征的新的特征提取网络,该第二部分网络由7层新卷积网络组成,且第二层新卷积层(22)的输出与第四层新卷积层(24)的输入连接,第三层新卷积层(23)的输出与第五层新卷积层(25)的输入连接,第五层新卷积层(25)的输出与第六层新卷积层(26)的输入连接,且将第一层新卷积层(21)的输出、第四层新卷积层(24)的输出、和第六层新卷积层(26)的输出相连接,组成第七层新拼接层(27)。(3c)将第一部分网络第12层的输出分别与第二部分网络中的第一层新卷积层(21)的输入、第二层新卷积层(22)的输入、第三层新卷积层(24)的输入连接,组成共享特征的新的特征提取网络。(4)根据步骤3获得的新的特征提取网络,结合Faster-RCNN模型现有的区域建议网络和分类网络,获得检测模型:将新的特征提取网络的第二部分网络的第七层新拼接层(27)的输出分别与区域建议网络中的第一层卷积层的输入和分类网络中第一层感兴趣区域池化层的输入相连接;将区域建议网络中的第一层卷积层的输出与分类网络中第一层感兴趣区域池化层的输入连接,组成检测模型;(5)训练检测模型:检测模型中的区域建议网络和分类网络使用特征提取网络中每层相同的特征参数,通过交替优化的方法调整区域建议网络和分类网络中每一层的权重参数,得到训练好的新检测模型;(6)肺结节检测:用训练好的新检测模型对测试数据集中每张医学图像进行测试,得到每张医学图像中的肺结节检测结果。本专利技术具有如下优点:第一,本专利技术针对现有的含肺结节医学图像数据量较少的情况,对含有肺结节目标的数据引入高斯噪声进行数据扩充,可使网络结构学习更多的特征,解决数据量不足的问题。第二,本专利技术利用现有的Faster-RCNN模型进行目标检测,设计新的深层特征提取网络结构,对高层特征进行多层融合,挖掘医学图像目标的高层特征,训练的模型参数变少,可减轻网络过拟合的程度,检测效果较好,提高检测平均精度。第三,本专利技术由于将提取候选框、检测与识别集成于同一网络结构,实现了端对端图像级别的医学图像检测。附图说明图1是本专利技术的实现流程图;图2是本专利技术中构建新的特征提取网络结构图;图3是用本专利技术对单张图像的检测结果图;图4是用本专利技术对测试数据集的检测平均精度图。具体实施方式参照附图1,本专利技术的具体步骤如下。步骤1,获取医学图像。从肺部图像数据库联盟LIDC的原始数据集随机选取100个病例的图像,通过读取原始数据集的XML格式注释文件,提取出肺结节坐标信息,并用病例图像和肺结节坐标信息组成样本数据集。步骤2,引入高斯噪声,扩充数据样本集。对数据样本集进行数据扩充,即对数据样本进行缩放和裁剪,并对所有样本进行复制,在复制后的数据样本中加入高斯噪声,组成扩充后的样本数据集,具体实现如下:(2a)通过自适应裁剪含肺结节的图像:在含肺结节的图像中定位结节中心,将其作为裁剪中心点,对结节进行裁剪,并将裁剪后的图像扩大成512*512像素,构成原始数据样本图像;(2b)对(2a)中原始数据样本图像均加入均值为0,方差为0.02的高斯噪声得到新数据样本图像;(2c)将(2a)中原始数据样本图像与(2b)中新数据样本图像组成扩充后的数据样本集。步骤3,构建新的共享特征的特征提取网络。参照附图2,本步骤的具体实现如下:(3a)从牛津大学计算机视觉组VGGNet-16网络中选择其前12层卷积层作为特征提取的第一部分网络;(3b)在第一部分网络之后增加第二部分网络,组成共享特征的新的特征提取网络,该第二部分网络由7层新卷积网络组成,且第二层新卷积层22的输出与第四层新卷积层24的输入连接,第三层新卷积层23的输出与第五层新卷积层25的输入连接,第五层新卷积层25的输出与第六层新卷积层26的输入连接,且将第一层新卷积层21的输出、第四层新卷积层24的输出、和第六层新卷积层26的输出相连接,组成第七层新拼接层27;所述第二部分网络的各层的结构如下:第一层新卷积层21,使用256个卷积核,卷积核大小为1*1,用于输出256个特征图;第二层新卷积层22,使用128个卷积核,卷积核大小为1*1,用于输出128个特征图;第三层新卷积层23,使用128个卷积核,卷积核大小为1*1,用于输出128个特征图;第四层新卷积层24,使用128个卷积核,卷积核大小本文档来自技高网...
基于深度学习的医学图像肺结节检测方法

【技术保护点】
一种基于深度学习的医学图像肺结节检测方法,包括:(1)从肺部图像数据库联盟LIDC的原始数据集随机选取100个病例的图像,通过读取原始数据集的XML格式注释文件,提取出肺结节坐标信息,并用病例图像和肺结节坐标信息组成样本数据集;(2)引入高斯噪声,扩充样本数据集:对样本数据集进行数据扩充,即对数据样本进行缩放和裁剪,并对所有样本进行复制,在复制后的数据样本中加入高斯噪声,组成扩充后的样本数据集;(3)构建新的共享特征的特征提取网络:(3a)从牛津大学计算机视觉组VGGNet‑16网络中选择其前12层卷积层作为特征提取的第一部分网络;(3b)在第一部分网络之后增加第二部分网络,组成共享特征的新的特征提取网络,该第二部分网络由7层新卷积网络组成,且第二层新卷积层(22)的输出与第四层新卷积层(24)的输入连接,第三层新卷积层(23)的输出与第五层新卷积层(25)的输入连接,第五层新卷积层(25)的输出与第六层新卷积层(26)的输入连接,且将第一层新卷积层(21)的输出、第四层新卷积层(24)的输出、和第六层新卷积层(26)的输出相连接,组成第七层新拼接层(27)。(3c)将第一部分网络第12层的输出分别与第二部分网络中的第一层新卷积层(21)的输入、第二层新卷积层(22)的输入、第三层新卷积层(24)的输入连接,组成共享特征的新的特征提取网络。(4)根据步骤3获得的新的特征提取网络,结合Faster‑RCNN模型现有的区域建议网络和分类网络,获得检测模型:将新的特征提取网络的第二部分网络的第七层新拼接层(27)的输出分别与区域建议网络中的第一层卷积层的输入和分类网络中第一层感兴趣区域池化层的输入相连接;将区域建议网络中的第一层卷积层的输出与分类网络中第一层感兴趣区域池化层的输入连接,组成检测模型;(5)训练检测模型:检测模型中的区域建议网络和分类网络使用特征提取网络中每层相同的特征参数,通过交替优化的方法调整区域建议网络和分类网络中每一层的权重参数,得到训练好的新检测模型;(6)肺结节检测:用训练好的检测模型对测试数据集中每张医学图像进行测试,得到每张医学图像中的肺结节检测结果。...

【技术特征摘要】
1.一种基于深度学习的医学图像肺结节检测方法,包括:(1)从肺部图像数据库联盟LIDC的原始数据集随机选取100个病例的图像,通过读取原始数据集的XML格式注释文件,提取出肺结节坐标信息,并用病例图像和肺结节坐标信息组成样本数据集;(2)引入高斯噪声,扩充样本数据集:对样本数据集进行数据扩充,即对数据样本进行缩放和裁剪,并对所有样本进行复制,在复制后的数据样本中加入高斯噪声,组成扩充后的样本数据集;(3)构建新的共享特征的特征提取网络:(3a)从牛津大学计算机视觉组VGGNet-16网络中选择其前12层卷积层作为特征提取的第一部分网络;(3b)在第一部分网络之后增加第二部分网络,组成共享特征的新的特征提取网络,该第二部分网络由7层新卷积网络组成,且第二层新卷积层(22)的输出与第四层新卷积层(24)的输入连接,第三层新卷积层(23)的输出与第五层新卷积层(25)的输入连接,第五层新卷积层(25)的输出与第六层新卷积层(26)的输入连接,且将第一层新卷积层(21)的输出、第四层新卷积层(24)的输出、和第六层新卷积层(26)的输出相连接,组成第七层新拼接层(27)。(3c)将第一部分网络第12层的输出分别与第二部分网络中的第一层新卷积层(21)的输入、第二层新卷积层(22)的输入、第三层新卷积层(24)的输入连接,组成共享特征的新的特征提取网络。(4)根据步骤3获得的新的特征提取网络,结合Faster-RCNN模型现有的区域建议网络和分类网络,获得检测模型:将新的特征提取网络的第二部分网络的第七层新拼接层(27)的输出分别与区域建议网络中的第一层卷积层的输入和分类网络中第一层感兴趣区域池化层的输入相连接;将区域建议网络中的第一层卷积层的输出与分类网络中第一层感兴趣区域池化层的输入连接,组成检测模型;(5)训练检测模型:检测模型中的区域建议网络和分类网络使用特征提取网络中每层相同的特征参数,通过交替优化的方法调整区域建议网络和分类网络中每一层的权重参数,得到训练好的新检测模型;(6)肺结节检测:用训练好的检测模型对测试数据集中每张医学图像进行测试,得到每张医学...

【专利技术属性】
技术研发人员:姬红兵王厚华张文博朱志刚曹奕
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1