一种基于机器学习的医学图像肺结节检测方法技术

技术编号:18972795 阅读:34 留言:0更新日期:2018-09-19 03:48
本发明专利技术公开一种基于机器学习的肺结节检测方法,能够自动进行肺结节检测并且保持较高的精度,包括以下步骤:获取肺部CT图像;对肺部CT图像进行分割,得到肺实质;对肺实质图像进行分割,得到多个肺结节候选;提取肺结节候选的灰度、形状和纹理特征;对多维的混合特征进行降维,并用混合了规则和支持向量机的分类器进行分类,达到检测肺结节的效果。本发明专利技术提出的新的分割方法和分类方法,降低了假阳性,提高了医学图像肺结节的检测精度,可用于计算机辅助诊断系统。

Medical image lung nodule detection method based on machine learning

The invention discloses a method for detecting pulmonary nodules based on machine learning, which can automatically detect pulmonary nodules and maintain high accuracy. The method comprises the following steps: acquiring pulmonary CT images; segmentation of pulmonary CT images to obtain pulmonary parenchyma; segmentation of pulmonary parenchyma images to obtain multiple pulmonary nodule candidates; and extraction of pulmonary nodules. Candidate gray, shape and texture features; Reduce the dimension of multi-dimensional mixed features, and classify them with a classifier that mixes rules and support vector machines to detect pulmonary nodules. The new segmentation method and classification method proposed by the invention can reduce false positive, improve the detection accuracy of pulmonary nodules in medical images, and can be used in computer aided diagnosis system.

【技术实现步骤摘要】
一种基于机器学习的医学图像肺结节检测方法
本专利技术属于图像处理
,尤其涉及一种基于机器学习的医学图像肺结节检测方法。
技术介绍
中国的肺癌居恶性肿瘤发病第一位,30年来死亡率上升了465%。早期肺癌平均5年的生存率在55%到70%之间。因此,早期发现和治疗,可以大大提高肺癌的治愈率。肺癌总是以肺结节表现出来,根据肺结节的病变特征能推断出肺部病灶的病变特性。因此对肺部疾病患者进行及早的肺结节检测和治疗是降低肺癌死亡率的关键措施。结合肺结节的医学特性,利用计算机辅助检测系统(CAD)技术对医学图像进行处理和研究,能为医生提供有用的参考信息,辅助医生及时地对肺部疾病患者做出准确的诊断。该系统一方面大大减轻了医生的工作量,能有效地帮助医生对潜在的肺癌进行早期检测和特征描述;另一方面使医学影像诊断更客观,提高了诊断效率和准确率,最大程度上避免了漏诊和误诊。因此,用计算机进行肺结节辅助诊断,提取肺结节的特征,检测和识别肺结节,具有重要的理论指导意义和应用研究价值。肺癌的计算机辅助诊断主要流程包括:肺结节图像分割、肺结节特征提取和肺结节的分类识别。在图像分割环节,通常分为基于阈值的分割、基于边缘的分割、基于区域的分割和基于图论的分割,单一的分割方法通常不能完整的分割出图像中的肺结节。在特征提取环节,由于肺结节具有实性结节、混合型磨玻璃结节、磨玻璃结节等各种形态,无法通过单一的形状特征进行检测。在肺结节分类识别环节,通常是基于统计学得到的,需要先验知识或者需要通过不同的特征尝试和参数选择才能得到满意的特征,给整个分类问题带来复杂性,导致现有的医学图像肺结节的检测速度较慢、精度较低。
技术实现思路
本专利技术的目的在于针对上述现有医学影像诊断技术的不足,提供一种基于机器学习的医学图像肺结节检测方法,采用改进的阈值分割方法,提取形状、灰度与纹理信息作为混合特征,经过特征选择后进行肺结节检测,达到很高的精确度、灵敏度和特异性。本专利技术具有以下特点:1.基于阈值图像分割模型和肺结节分类模型设计1.1.图像分割,本专利技术采用基于阈值的图像分割。在图像分割之前,先对病例图像进行预处理,采用图像插值的方法将低分辨率的医学图像转化成高分辨率的图像。为了增强图片的内部结构,尤其是肺结节部分,采用均值漂移算法对所有的病例图像进行处理。首先采用迭代阈值算法对所有切片进行初步分割处理,再用孔洞填充算法进一步分割得到肺实质部分。由于这种分割可能会遗漏掉并列结节即边缘结节,本专利技术采用滚球算法对肺实质边缘进行补偿,从而得到完整的肺实质部分。对于肺结节候选的分割同样采用迭代阈值算法。1.2.图像分割步骤完成以后是特征提取与特征选择,本专利技术提取了多种特征包括形状特征、灰度特征与纹理特征。形状特征能够基本概括肺结节轮廓,形状的信息;灰度特征是基于像素的特征,根据肺结节区域与背景区域的像素差异从而提取的;纹理特征是用灰度共生矩阵提取的图像熵和能量的信息。采用Fisher判别分析算法进行特征选择,该算法将高维含噪的特征矩阵降低到低维的分类空间,并且特征选择后的矩阵包含了原始特征矩阵的信息。1.3.分类器的性能在很大程度上影响了肺结节分类精度,本专利技术构造了混合分类器进行肺结节诊断。首先采用基于规则的分类器运用多个if-then规则混叠形成了一个完整的专家系统,去除一部分非结节,实现了肺结节的初步分类。然后采用支持向量机分类器进行肺结节的精确分类,特征样本被分为训练样本和测试样本,用训练好的新检测模型对测试数据集中每张医学图像进行测试,得到每张医学图像的肺结节检测结果。2.计算机辅助检测的使用方法2.1.从肺部图像数据库LIDC的原始数据集随机选取200个病例的图像,通过读取原始数据集的XML格式注释文件,提取出肺结节坐标信息,并用病例图像和肺结节坐标信息组成样本数据集;2.2.利用迭代阈值选取合适的阈值对图像进行分割,先设定初始阈值T,通常是图像的最大灰度值Tmax和最小灰度值Tmin的均值;将图像分为两个部分:灰度值大于T的集合和灰度值小于等于T的集合,分别计算其平均值,然后计算出新的阈值Tnew;如果新的阈值小于一个特定值,则停止迭代。分割完所有切片后便得到了肺结节候选,需要提取肺结节候选的混合特征。采用Fisher判别法将高维数据转化为低维数据,通过计算本征值和本征向量实现这一过程。2.3.肺结节检测运用的是混合分类器。基于规则的分类器实现了简单的阈值筛选,去除了一部分非结节;支持向量机分类器将低维特征投影到高维空间,然后建立一个超平面并采用粒子群算法优化参数,实现肺结节的精确分类。为实现上述目的,本专利技术采用如下的技术方案:一种基于机器学习的肺结节检测方法,包括如下步骤:(1)获取CT图像:从肺部图像数据库LIDC的原始数据集中随机选取200个病人的图像,通过读取原始数据集的XML格式注释文件,提取出肺结节坐标信息,并用病例图像和肺结节坐标信息组成样本数据集;(2)对CT图像进行图像分割:用聚类增强算法对200个病例图片进行预处理,采用基于阈值分割的方法对每个病例图像进行分割,先分割出图像中的肺实质区域,再分割出图像中的肺实质候选;(3)提取肺结节候选的混合特征:包括灰度特征,形状特征和纹理特征;(4)根据步骤3获得的多维特征矩阵,做基于规则的简单分类,去除肺结节候选中的一部分非结节;(5)特征选择:将高维的特征矩阵降低到低维,并且新的特征矩阵能够完整的表示出元特征矩阵的所有信息;(6)肺结节检测:用训练好的检测模型对测试数据集中每张医学图像进行测试,得到每张医学图像中的肺结节检测结果。作为优选,步骤(2)所述图像预处理的方法包括图像线性插值和均值漂移算法;阈值分割采用迭代阈值的方法自动获取分割阈值;作为优选,步骤(2)所述阈值分割采用迭代阈值的方法自动获取分割阈值,孔洞填充去除小面积区域,区域生长去除支气管部分。作为优选,步骤(3)所述提取的密度特征包括灰度均值、灰度方差、灰度最小值、偏度和峰度;形状特征包括面积、半径、周长、圆度、紧凑性、凹性率、细长度、矩形度;纹理特征包括:能量、对比度、熵和逆差矩。作为优选,步骤(4)所述的基于规则的初步分类是基于灰度均值、灰度方差、宏观圆形度、扁度、细长度和矩形度的特征制定的,参数分别为15、7000、0.13、2、0.5、1.5,如果特征值大于这些参数,则认定为非结节,筛去这些区域,保留小于这些值的特征;作为优选,步骤(5)-(6)先是由Fisher线性判别分析提取的特征并进行特征降维,选择后的低维特征输入分类器中进行训练,最后用分类器进行肺结节检测。本专利技术具有如下优点:第一,采用基于阈值的分割方法不用人工选取交互点,避免了大量繁琐的计算工作。用迭代的方式自动获取最优阈值比固定阈值达到更好的分割效果。第二,与单一特征相比,混合特征包含了肺结节更全面的特征信息。特征选择过程挑选了最具代表性的特征,提高了检测速率,降低了时间复杂度。对分类器的优化方案能够自动选择最优参数,提高了肺结节的检测精度。第三,支持向量机能够解决小样本学习问题,能够克服训练中过学习、欠学习、维度灾难和局部最优等问题,更高效的处理样本。附图说明图1为本专利技术实施例中计算机辅助检测方法的结构示意图;图2为本专利技术实施例中图像分割方法的结果示意本文档来自技高网
...

【技术保护点】
1.一种基于机器学习的肺结节检测方法,其特征在于,包括如下步骤:(1)获取CT图像:从肺部图像数据库LIDC的原始数据集中随机选取200个病人的图像,通过读取原始数据集的XML格式注释文件,提取出肺结节坐标信息,并用病例图像和肺结节坐标信息组成样本数据集;(2)对CT图像进行图像分割:用聚类增强算法对200个病例图片进行预处理,采用基于阈值分割的方法对每个病例图像进行分割,先分割出图像中的肺实质区域,再分割出图像中的肺实质候选;(3)提取肺结节候选的混合特征:包括灰度特征,形状特征和纹理特征;(4)根据步骤3获得的多维特征矩阵,做基于规则的简单分类,去除肺结节候选中的一部分非结节;(5)特征选择:将高维的特征矩阵降低到低维,并且新的特征矩阵能够完整的表示出元特征矩阵的所有信息;(6)肺结节检测:用训练好的检测模型对测试数据集中每张医学图像进行测试,得到每张医学图像中的肺结节检测结果。

【技术特征摘要】
1.一种基于机器学习的肺结节检测方法,其特征在于,包括如下步骤:(1)获取CT图像:从肺部图像数据库LIDC的原始数据集中随机选取200个病人的图像,通过读取原始数据集的XML格式注释文件,提取出肺结节坐标信息,并用病例图像和肺结节坐标信息组成样本数据集;(2)对CT图像进行图像分割:用聚类增强算法对200个病例图片进行预处理,采用基于阈值分割的方法对每个病例图像进行分割,先分割出图像中的肺实质区域,再分割出图像中的肺实质候选;(3)提取肺结节候选的混合特征:包括灰度特征,形状特征和纹理特征;(4)根据步骤3获得的多维特征矩阵,做基于规则的简单分类,去除肺结节候选中的一部分非结节;(5)特征选择:将高维的特征矩阵降低到低维,并且新的特征矩阵能够完整的表示出元特征矩阵的所有信息;(6)肺结节检测:用训练好的检测模型对测试数据集中每张医学图像进行测试,得到每张医学图像中的肺结节检测结果。2.根据权利要求1所述的基于机器学习的肺结节检测方法,其特征在于:步骤(2)所述图像预处理的方法包括图像线性插值和均值漂移算法;阈值分割采用迭代阈值的方法自动获取分割阈值。3.根据权利要求1所述的基于机器学习的肺结节检测方法,其特征在于:步骤(2)所述阈值分割采用迭代阈值的方法自动获取分割阈值,孔洞填...

【专利技术属性】
技术研发人员:袁海英刘昶王秀玉周昌世郑彤张凯
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1