当前位置: 首页 > 专利查询>复旦大学专利>正文

一种基于深度学习3D目标检测的肺部CT图像识别方法技术

技术编号:24759522 阅读:24 留言:0更新日期:2020-07-04 09:56
本发明专利技术涉及一种基于深度学习3D目标检测的肺部CT图像识别方法,包括以下步骤:S1:CT图像预处理;S2:生成图像样本,构建设定尺寸数据块的训练集;S3:构建3D目标检测模型;S4:训练3D目标检测模型;S5:利用训练好的3D目标检测模型,检测得到待识别物的坐标和尺寸,与现有技术相比,本发明专利技术具有假阳性率低、对数据噪音容忍性好且模型鲁棒性强等优点。

A lung CT image recognition method based on deep learning 3D target detection

【技术实现步骤摘要】
一种基于深度学习3D目标检测的肺部CT图像识别方法
本专利技术涉及计算机图像处理
,尤其是涉及一种基于深度学习3D目标检测的肺部CT图像识别方法。
技术介绍
随着大数据时代的到来,各医院中产生了海量的肺部CT图像数据,对这些肺部CT图像的筛查处理,可以实现对肺部异常的检测识别,以肺结节的检测为例,检测肺结节可以辅助早期肺癌的发现,利用医院数据库中的肺部CT图像数据,可以通过基于深度学习的图像处理,筛查出结果为阳性的CT图像,通过筛查,可以确定哪些样本需要采取其他医疗手段进行后续肺癌的确诊及治疗。传统肺部CT图像识别算法的候选区提取算法有几类,一类是基于阈值简单寻找图像中所有高CT值区域,但是由于肺部包含大量血管、气管等其他组织,这种做法会大大提高候选区数量,从而降低算法整体的效率和准确率,另一类方法基于待识别物的形态学特征,但是这类方法往往会漏检具有非常规形状的待识别物,以肺结节检测为例,虽然大部分肺结节为圆形,但仍会存在具有空洞、毛刺、磨玻璃结构的肺结节,且这类结节具有比较高的恶性风险,所以这样的漏检必须避免。第三种方法是基于深度学习的卷积神经网络的方法,但是大部分是以2D卷积为主,由于肺部CT数据是3D图像,若用2D卷积或者循环网络,则会丢失深度信息使之检测出来的结果会将部分血管及其分支、肺壁等被误判为待识别物,造成假阳性比较多的现象。为了降低假阳率,很多方法是另外设计一个深度卷积网络解决假阳性问题,其缺点是严重的拖慢整个肺部CT图像识别的速度,并且GPU占比较高,可落地实用性和可拓展性不大。>
技术实现思路
本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种假阳性率较低且鲁棒性强的基于深度学习3D目标检测的肺部CT图像识别方法。本专利技术的目的可以通过以下技术方案来实现:一种基于深度学习3D目标检测的肺部CT图像识别方法,包括以下步骤:S1:CT图像预处理;S2:生成图像样本,构建设定尺寸数据块的训练集;S3:构建3D目标检测模型;S4:训练3D目标检测模型;S5:利用训练好的3D目标检测模型,识别CT图像中是否存在待识别物,若存在,则输出待识别物的坐标和尺寸。进一步地,所述的步骤S2具体包括:S201:提取预处理过后的CT图像;S202:以待识别物为中心,在平面上选取设定尺寸大小,在厚度上选取设定层数;S203:将超过肺部区域部分的骨质HU值补全为180,图像样本;S204:选取80%的正样本和20%负样本,所述的正样本为至少包含一个待识别物的图像样本,所述的空样本为正常的图像样本;S205:对包含不同尺寸的待识别物图像样本,按照相同的比例进行采样,得到数据块,并进行归一化操作,得到包含设定尺寸数据块的训练集。进一步地,所述的步骤S3具体包括:S301:构建编码器中的widegroupattentionblock聚合块;S302:构建编码器;S303:构建解码器;S304:构建filterRPN模块;S305:构建RPN模块。更进一步地,所述的widegroupattentionblock聚合块中,各分组之间采用不同的膨胀卷积率。更进一步地,所述的解码器和编码器之间的侧连接为级联。进一步地,所述的步骤S4具体包括:S401:生成filterRPN模块的标签值,以待识别物位置为圆心,并以待识别物直径的0.8倍为半径,在3D层面构建一个球体,球内像素点设为1,球外像素点设为0。S402:构建损失函数;S403:预训练设定轮次后,使用步骤S302中构建的编码器进行训练;S404:训练达到设定轮次后,计算最后设定个数轮次的参数平均值,作为最后的参数取值,完成训练。更进一步地,构建损失函数时,首先对坐标值进行处理,其表达式为:其中,(x,y,z)为待识别物的坐标,r为待识别物的直径,dx为x的要回归的坐标变换,dy为y的要回归的坐标变换,dz为z的要回归的坐标变换,dr为r的要回归的半径变换,Gx为待识别物的x坐标,Ax为对应位置的锚框的x坐标,Gy为待识别物的y坐标,Ay为对应位置的锚框的y坐标,Gz为待识别物的z坐标,Az为对应位置的锚框的半径,Gr为待识别物的半径,Ar为对应位置的锚框的半径。更进一步地,所述的损失函数Loss的表达式为:Loss=Lreg+λLcls+γLfilterRPNLfilterRPN=αLpos+(1-α)Lneg其中,Lreg为坐标回归损失,Lcls为二类交叉熵函数,LfilterRPN为二类交叉熵函数,λ为平衡因子,γ为平衡因子,S损失函数为smoothL1损失函数,为预测值,dk为回归的目标值,α为平衡因子,Lpos为正样本的损失值,Lneg为负样本的损失值,p为预测的概率值。进一步地,所述的步骤S5中,采用滑窗拼接式进行预测,其中步长为12。进一步地,所述的步骤S1具体包括:S101:将CT图像转化为8位256级的灰度图,并对所有切片重新采样成1×1×1大小;S102:对切片数据进行成像并利用高斯滤波对切片进行高斯平滑,所述的高斯平滑过程为:S103:设定HU阈值为-604,对肺部切片二值化,将最大连通域小于30mm2的部分剔除并去除离心率大于0.99的部分,得到两个连通域最大的部分;S104:腐蚀孔洞并进行孔洞填充;S105:生成包围两个肺部的凸包,并膨胀形成一个连通域;S106:将生成的二值化图像和原图像进行叠加得到肺部图像。与现有技术相比,本专利技术具有以下优点:1)采用3D的卷积神经网络来构建编码器和解码器,利用了encoder-decoder的模型架构,通过对编码器设计特殊的widegroupattentionblock聚合块,可以考虑不同场景需求下的各个应用,使得网络在小批量样本有很多的噪音的情况下仍可以得到比较好的效果,从而得到有更高的精准性和鲁棒性的模型,有效降低检测结果的假阳性率,不需要另外设计网络去除假阳性;2)本专利技术的目标检测模型中,利用编码器和解码器结构,通过编码器提取语义特征,解码器进行细节修补,并且通过侧连接进行细节补全,同时通过FiterRPN模块进行加速训练和推断,可以很好地完成肺部CT图像的识别,对其中待识别物的位置和类型进行检测,同时能够提高检测精度和速度;3)本专利技术通过对CT图像进行重采样后,切取1283大小的数据块,使得分布和每个医院数据库中的数据分布大体一致,从而得到更加精准的检测结果;4)由于医院的算力不足,从而只能小批量数据训练算法,然而小批量数据对模型的性能产生很大的影响,本专利技术通过特殊设计编码器,加入filterRPN模块,降低由于小批量数据对模型的影响;5)本专利技术中,大小尺寸不同的待识别物的检测识别由不同膨胀卷积率负责,并且本文档来自技高网...

【技术保护点】
1.一种基于深度学习3D目标检测的肺部CT图像识别方法,其特征在于,包括以下步骤:/nS1:CT图像预处理;/nS2:生成图像样本,构建设定尺寸数据块的训练集;/nS3:构建3D目标检测模型;/nS4:训练3D目标检测模型;/nS5:利用训练好的3D目标检测模型,识别CT图像中是否存在待识别物,若存在,则输出待识别物的坐标和尺寸。/n

【技术特征摘要】
1.一种基于深度学习3D目标检测的肺部CT图像识别方法,其特征在于,包括以下步骤:
S1:CT图像预处理;
S2:生成图像样本,构建设定尺寸数据块的训练集;
S3:构建3D目标检测模型;
S4:训练3D目标检测模型;
S5:利用训练好的3D目标检测模型,识别CT图像中是否存在待识别物,若存在,则输出待识别物的坐标和尺寸。


2.根据权利要求1所述的一种基于深度学习3D目标检测的肺部CT图像识别方法,其特征在于,所述的步骤S2具体包括:
S201:提取预处理过后的CT图像;
S202:以待识别物为中心,在平面上选取设定尺寸大小,在厚度上选取设定层数;
S203:将超过肺部区域部分的骨质HU值补全为180,图像样本;
S204:选取80%的正样本和20%负样本,所述的正样本为至少包含一个待识别物的图像样本,所述的空样本为正常的图像样本;
S205:对包含不同尺寸的待识别物图像样本,按照相同的比例进行采样,得到数据块,并进行归一化操作,得到包含设定尺寸数据块的训练集。


3.根据权利要求1所述的一种基于深度学习3D目标检测的肺部CT图像识别方法,其特征在于,所述的步骤S3具体包括:
S301:构建编码器中的widegroupattentionblock聚合块;
S302:构建编码器;
S303:构建解码器;
S304:构建filterRPN模块;
S305:构建RPN模块。


4.根据权利要求3所述的一种基于深度学习3D目标检测的肺部CT图像识别方法,其特征在于,所述的widegroupattentionblock聚合块中,各分组之间采用不同的膨胀卷积率。


5.根据权利要求3所述的一种基于深度学习3D目标检测的肺部CT图像识别方法,其特征在于,所述的解码器和编码器之间的侧连接为级联。


6.根据权利要求3所述的一种基于深度学习3D目标检测的肺部CT图像识别方法,其特征在于,所述的步骤S4具体包括:
S401:生成filterRPN模块的标签值,以待识别物位置为圆心,并以待识别物直径的0.8倍为半径,在3D层面构建一个球体,球内像素点设为1,球外像素点设为0。
S402:构建损失函数;
S403:预训练设定轮次后,使用步骤S302中构建的编码器进行训练;
S404:训练达到设定轮次后,计算最后设定个数轮次的参...

【专利技术属性】
技术研发人员:张文强
申请(专利权)人:复旦大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1