基于3D卷积神经网络与深度学习的肺结节良恶性分类方法技术

技术编号:18659304 阅读:33 留言:0更新日期:2018-08-11 14:58
本发明专利技术提供了一种基于3D卷积神经网络与深度学习的肺结节良恶性分类方法,具体步骤为:S1:获取用户的肺部CT序列影像,提取出肺结节所在感兴趣区域的3D影像;S2:对3D影像进行标准化,得到多个大小相同的3D正方体样本块;S3:对训练样本集按比例进行复制,并且进行增强处理;S4:将增强后的训练样本集输入预设的深度神经网络模型,利用BCE损失函数进行深度训练,得到训练好的新深度神经网络模型;S5:根据测试样本集的结果绘制ROC曲线,由ROC曲线特性和AUC值确定最佳阈值,用于训练好的新神经网络模型对于肺结节良恶性的分类。本发明专利技术可以实现对肺结节的准确分类,帮助医生快速识别肺结节种类,节约时间并保证医生长时间工作依然有极高的准确率。

Classification of pulmonary nodules based on 3D convolutional neural network and deep learning

The invention provides a classification method of benign and malignant pulmonary nodules based on 3D convolution neural network and depth learning. The specific steps are as follows: S1: acquiring the CT sequence images of the user's lungs, extracting the 3D images of the region of interest where the pulmonary nodules are located; S2: standardizing the 3D images and obtaining multiple 3D cube samples of the same size; S3: Reproduce the training sample set proportionally and enhance it; S4: Input the enhanced training sample set into the preset depth neural network model, and use BCE loss function to train in depth to get the trained new depth neural network model; S5: Draw the ROC curve according to the results of the test sample set, and RO. C curve characteristics and ACU values determine the best threshold for the trained new neural network model for the classification of benign and malignant pulmonary nodules. The invention can realize accurate classification of pulmonary nodules, help doctors quickly identify the types of pulmonary nodules, save time and ensure that doctors still have high accuracy in long-term work.

【技术实现步骤摘要】
基于3D卷积神经网络与深度学习的肺结节良恶性分类方法
本专利技术涉及医学影像和人工智能领域,是一种基于3D卷积神经网络和深度学习的肺结节良恶性分类方法。
技术介绍
肺癌是中国发病率和死亡率最高的疾病,近30年肺癌死亡率增长465%。其中很大的原因是75%的癌症患者都是在中晚期才确诊,即便在发达国家里,肺癌是所有恶性肿瘤中最常见最致命的一种。肿瘤的早期诊断及检测对于患者的治疗和愈后具有非常重要的临床意义。所有的早期干预措施都必须在明确病变性质和程度的基础上进行,而影像学检查是发现病变、对病变进行定性定量分析、预测疾病的关键。一组1.25毫米层厚的CT会有200-300张层面图像,面对产生的大量CT图像,如果能够运用人工智能技术帮助医生给出一定的辅助诊断,在节约人力的同时,还能够减少因为过度疲劳造成的漏诊。因此,利用深度学习技术对医学图像进行处理和研究,能为医生提供有用的参考信息,辅助医院及时地对肺部疾病做出准确地诊断,使得漏诊情况得以改善,进一步提高CT在肺部疾病筛查中的价值。卷积神经网络是深度学习技术中极具代表的网络结构之一,在图像处理领域取得了很大的成功,在国际标准的ImageNet数据集上,许多成功的模型都是基于CNN(ConstitutionalNeuralNetworks,卷积神经网络)的。CNN相较于传统的图像处理算法的优点之一在于,避免了对图像复杂的前期预处理过程(提取人工特征等),可以直接输入原始图像。
技术实现思路
本专利技术提供了一种基于3D卷积神经网络与深度学习的肺结节良恶性分类方法,其可以准确地对肺结节3D区域图像块进行分类并提高肺结节良恶性判断的准确度。一种基于3D卷积神经网络与深度学习的肺结节良恶性分类方法,其特征在于包括以下步骤:S1:获取用户的肺部CT序列影像,利用医生标记的肺结节位置信息提取出肺结节所在感兴趣区域的3D影像;S2:对不同大小的肺结节3D影像进行标准化,得到多个大小相同的3D正方体样本块;S3:对训练样本集进行复制,并且对复制后的训练样本集进行增强处理;S4:将增强后的训练样本集输入预设的深度神经网络模型,利用BCE损失函数对预设的深度神经网络模型进行深度训练,得到训练好的新深度神经网络模型;S5:将测试样本集输入训练好的深度神经网络模型中,并且根据测试样本集的结果,绘制ROC曲线,由ROC曲线特性和AUC值确定最佳阈值,用于训练好的深度神经网络模型对于肺结节良恶性的分类。优选地,S2步骤还包括:按照预定的比例随机提取测试样本集和训练样本集。优选地,S3步骤还包括:统计训练样本集中良恶性的比例情况,对训练样本集中的良恶性样本进行反比例的复制,从而保证训练样本集中良恶性样本在输入预设的深度神经网络模型之前达到大致上相同的数量。优选地,S3步骤还包括:对复制后的训练样本集进行增强处理包括随机选取旋转、翻折、放大、缩小和交换变化中的二至五种,并对复制后的训练样本集进行变换,从而得到更多更加随机的样本以供使用。优选地,在S4步骤:预定的深度神经网络模型是基于深度残差网络和U型结构网络两者的组合,利用了3D卷积和3D逆卷积两者结合,提取不同层次上的3D特征,对提取的3D特征进行全连接的分类网络操作。优选地,在S4步骤:利用如下的BCE损失函数作为损失函数:Ln=-Wn×[Yn×logXn+(1-Yn)×log(1-Xn)]其中,Wn为权重,Xn为预测类别,Yn为真实类别,Ln为损失值大小;利用SGD优化方法来优化预定的深度神经网络。优选地,在S5步骤:利用绘制的ROC曲线,得到一系列FPR值和TPR值,当得到TPR-FPR最大时,选取当前阈值为最佳阈值来评定测试样本。本专利技术提供的技术方案带来的有益效果体现在:第一,本专利技术针对现有的含肺结节医学图像数据量较少的情况,对含有肺结节的数据进行了数据扩充,同时结合了ResNet(残差网络)结构和Unet(U型网络)两者优点,建立了3D网络结构,以此提取更多更细节的特征信息。第二,本专利技术利用全连接层,将特征信息用于分类,利用ROC(ReceiverOperatingCharacteristic,受试者工作特征)曲线特性寻找最佳阈值,提升了分类器性能。第三,本专利技术将提取、检测与识别集成于同一网络结构,实现了端到端的图像级别的医学图像检测。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是根据本专利技术的基于3D卷积神经网络与深度学习的肺结节良恶性分类方法的示意图。图2是根据本专利技术的对于训练样本进行增强处理的流程图。图3是根据本专利技术的3D卷积神经网络结构图。图4是根据本专利技术的基于3D卷积神经网络与深度学习的肺结节良恶性分类方法的不同参数实际分类结果示意图。图5是根据本专利技术的ROC曲线图。图6是根据本专利技术的基于3D卷积神经网络与深度学习的肺结节良恶性分类方法的流程图。图7是根据本专利技术提取的3D肺结节图像块的示意图。图8是根据本专利技术的基于3D卷积神经网络与深度学习的肺结节良恶性分类方法的相同参数不同阈值实际分类结果示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的实施方式做进一步地详细描述。本专利技术的总体构思为,利用自主构建的卷积神经网络模型,将输入的增强后的样本进行网络的训练,使网络能够提取出最好的特征向量,并使用此特征向量,通过全连接神经网络层做出分类。图1为根据本专利技术的基于3D卷积神经网络与深度学习的肺结节良恶性分类方法的示意图。参照图1,本专利技术的方法主要分为三个主体部分:数据集制作、分类网络构建和分类器阈值选取。三个部分以串联形式链接,本专利技术提供了三部分的自动运行过程,可以实现端到端的操作,即给定标记好的医疗影像图像,可以自动完成数据集制作,将训练集投入网络训练,绘制ROC(ReceiverOperatingCharacteristic,受试者工作特征)曲线进行阈值选择的过程,直接得到测试集结果。第一部分为数据集的制作。参照图1,数据集的制作主要分为四个子部分:数据的标定、数据的预处理、数据的集划分和数据的增强处理。数据的标定由资深医生根据病理分析完成。其中CT图片存储为DICOM(DigitalImagingandCommunicationsinMedicine,医学数字成像和通信)文件,标记的位置和良恶性等信息存储为XML(eXtensibleMarkupLanguage,可扩展标记语言)文件。数据的预处理过程分为两步,转换XML文件和提取目标样本块。先提取标记的位置和良恶性等信息的XML文件内容,并将其存储为更好处理的npy或者csv格式。然后利用位置信息,在DICOM文件中找到肺结节位置,以肺结节为中心,提取64×64×64大小的正方体样本块。64个像素点对应了实际4mm大小的区域,可以包含所有样本中的各个尺度的肺结节。最后将样本块和标记文件各自存储为npy文件。数据集划分过程为,按照2:8的比例随机提取测试样本集和训练样本集。测试样本集不进行数据的增强,直接用于最后的测试步骤。数据的增强是本文档来自技高网...

【技术保护点】
1.一种基于3D卷积神经网络与深度学习的肺结节良恶性分类方法,其特征在于包括以下步骤:S1:获取用户的肺部CT序列影像,利用医生标记的肺结节位置信息提取出肺结节所在感兴趣区域的3D影像;S2:对不同大小的肺结节3D影像进行标准化,得到多个大小相同的3D正方体样本块;S3:对训练样本集进行复制,并且对复制后的训练样本集进行增强处理;S4:将增强后的训练样本集输入预设的深度神经网络模型,利用BCE损失函数对预设的深度神经网络模型进行深度训练,得到训练好的新深度神经网络模型;S5:将测试样本集输入训练好的深度神经网络模型中,并且根据测试样本集的结果,绘制受试者工作特征曲线,由受试者工作特征曲线特性和曲线所覆盖的区域面积值确定最佳阈值,用于训练好的深度神经网络模型对于肺结节良恶性的分类。

【技术特征摘要】
1.一种基于3D卷积神经网络与深度学习的肺结节良恶性分类方法,其特征在于包括以下步骤:S1:获取用户的肺部CT序列影像,利用医生标记的肺结节位置信息提取出肺结节所在感兴趣区域的3D影像;S2:对不同大小的肺结节3D影像进行标准化,得到多个大小相同的3D正方体样本块;S3:对训练样本集进行复制,并且对复制后的训练样本集进行增强处理;S4:将增强后的训练样本集输入预设的深度神经网络模型,利用BCE损失函数对预设的深度神经网络模型进行深度训练,得到训练好的新深度神经网络模型;S5:将测试样本集输入训练好的深度神经网络模型中,并且根据测试样本集的结果,绘制受试者工作特征曲线,由受试者工作特征曲线特性和曲线所覆盖的区域面积值确定最佳阈值,用于训练好的深度神经网络模型对于肺结节良恶性的分类。2.根据权利要求1所述的基于3D卷积神经网络与深度学习的肺结节良恶性分类方法,其特征在于,S2步骤还包括:按照预定的比例随机提取测试样本集和训练样本集。3.根据权利要求1所述的基于3D卷积神经网络与深度学习的肺结节良恶性分类方法,其特征在于,S3步骤还包括:统计训练样本集中良恶性的比例情况,对训练样本集中的良恶性样本进行反比例的复制,从而保证训练样本集中良恶性样本在输入预设的深度神经网络模型之前达到大致上相同的数...

【专利技术属性】
技术研发人员:唐雯张荣国王少康陈宽
申请(专利权)人:北京推想科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1