一种基于深度学习的X射线图像检测方法及系统技术方案

技术编号:32189404 阅读:20 留言:0更新日期:2022-02-08 15:53
本发明专利技术公开了一种基于深度学习的X射线图像检测方法及系统,将标注完成的X射线图像输入到基础网络中,通过基础网络对X射线图像进行若干卷积组件的操作,提取到图像五个尺度不同的特征图;通过RPN网络生成regionproposals,再经过softmax层判断anchors属于背景还是前景信息,再进行标定框的回归操作,修正anchors来获取精确的proposals;将五个尺度不同的特征图和一系列proposals输入进RoI Align层,得到尺寸相同的RoI;经过2个全连接层,分别实现proposals的分类和精确定位。本发明专利技术将多层网络信息进行融合,同时学习不同深度的图像特征,极大程度提高了检测的准确性。高了检测的准确性。高了检测的准确性。

【技术实现步骤摘要】
一种基于深度学习的X射线图像检测方法及系统


[0001]本专利技术属于图像处理
,具体涉及一种基于深度学习的X射线图像检测方法及系统。

技术介绍

[0002]现有的X射线图像检测方法,需要X射线图像具有非常高的分辨率和清晰度,很难在内容复杂、低质量的图像中进行检测,检测方法不具有很强的迁移性。
[0003]除此之外,现有的X射线图像检测方法大多依赖于后续的矫正,会带来沉重的计算代价,耗费很长的处理时间。传统的X射线图像检测方法,经常会出现不能正确区分前景和背景的问题,过于简单地使用形态学信息,难度大,泛化性能差,检测精度低。
[0004]综上,现有的X射线图像炎检测方法过于繁琐和低效,效率低,速度慢。

技术实现思路

[0005]本专利技术所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于深度学习的X射线图像检测方法及系统,能够快速、准确地区分出X射线图像,简化了识别流程。
[0006]本专利技术采用以下技术方案:
[0007]一种基于深度学习的X射线图像检测方法,包括以下步骤:
[0008]S1、在X射线图像中选取标注区域Ground Truth进行标注,将标注完成的X射线图像经过预处理成尺寸为M*N的图像,将尺寸为M*N的图像输入卷积残差网络中,输出得到五个尺寸的特征图;
[0009]S2、将步骤S1得到的五个尺寸特征图输入RPN网络中,生成若干anchors,将属于前景的anchors作为proposals输出,同时输出proposals的坐标;
[0010]S3、将步骤S2生成的若干proposals输入用于池化的RoI Align层,整合成相同尺寸的proposals;
[0011]S4、将步骤S1得到的五个尺寸的特征图和步骤S3得到的相同尺寸的proposals同步输入检测网络的两个全连接层,一个全连接层输出每个proposal的位置坐标,将得到的坐标定义的框作为检测对象的位置,另一个全连接层通过一个softmax层对proposal进行判断,将每个proposal输出的若干检测类别概率分数最高的类别作为proposal所属的类别,得到检测对象的位置和类别,实现X射线图像检测。
[0012]具体的,步骤S1中,将尺寸为M*N的图像输入卷积残差网络中,输出得到五个尺寸的特征图具体为:
[0013]S101、将尺寸为M*N的图像输入7*7*64的卷积层,然后经过最大池化层输入至stage1、stage2、stage3、stage4、stage5层,分别得到特征图C1、C2、C3、C4、C5;
[0014]S102、将特征图C5经过1*1*256的卷积层得到特征图P5,将特征图C4经过1*1*256的卷积层和P5经过上采样得到的特征图相加得到特征图P4,将特征图C3经过1*1*256的卷积层和P4经过上采样得到的特征图相加得到特征图P3,将特征图C2经过1*1*256的卷积层
和P3经过下采样得到的特征图相加得到特征图P2;
[0015]S103、将得到的特征图P2、P3、P4和P5分别通过3*3*256的卷积层到得P2

、P3

、P4

、P5

,P5

经过下采样得到P6

,将P2

、P3

、P4

、P5

和P6

作为经过残差网络得到的五个尺寸的特征图。
[0016]具体的,步骤S2具体为:
[0017]S201、在特征图上使用窗口进行滑动,每个位置最大的proposals个数为9个,三个不同的尺寸分别为128*128、256*256和512*512,以及1:2,1:1和2:1三个不同的比例作为anchors;
[0018]S202、将生成的anchors输入RPN网络的两个1*1的卷积层,一个1*1的卷积层输出anchors属于前景和属于背景的分数,另一个1*1的卷积层输出anchors框的位置坐标;
[0019]S203、将anchors进行坐标回归操作,实现位置修正,提取前N个经位置修正的代表前景的anchors映射回anchors所属的feature maps,实现边框回归操作,判断anchors的位置是否超过图像范围;再利用前景的分数对没有超出范围的anchors进行非极大值抑制,提取剩余前2000个anchors及其对应的坐标作为proposals的输出。
[0020]进一步的,步骤S201中,在特征图上用3*3的窗口进行滑动。
[0021]进一步的,步骤S202中,RPN网络的损失函数L(p
i
,t
i
)为:
[0022][0023]其中,N
cls
是mini

batch的标准化,L
cls
是log损失函数,L
reg
是smoothL1损失函数,i代表一个anchor在mini

batch中的索引值,p
i
代表预测的分数,为Ground Truth的标签,λ为用于加权的平衡参数,t
i
代表预测边框的坐标向量,代表anchor是positive时,Ground Truth的坐标,L
reg
只对positive的anchor有效,N
reg
是anchor的数量的标准化。
[0024]进一步的,步骤S203中,当anchors的位置超过图像的边界,剔除超出边界的anchors。
[0025]进一步的,步骤S203中,定义边框回归如下:
[0026][0027][0028][0029][0030]其中,x,y是框中心点的坐标,w,h代表框的宽和高度,x,y,x
a
,y
a
,x
*
,y
*
分别代表预测框、anchor和Ground Truth的中心点坐标,w,h,w
a
,h
a
,w
*
,h
*
分别代表预测框、anchor和Ground Truth的框的宽和高度。
[0031]具体的,步骤S3中,将RoI进行2*2的划分,得到4个框,每个框有四个采样点,利用
双线性插值算法从特征图的像素点上计算采样点的值,并通过最大值或者平均值法聚合结果,将聚合的结果作为框的像素值。
[0032]具体的,步骤S4中,定义目标分类和定位的损失函数L(p,u,t
u
,v)如下:
[0033]L(p,u,t
u
,v)=L
cls
(p,u)+λ[u≥1]L
loc
(t
u
,v)
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的X射线图像检测方法,其特征在于,包括以下步骤:S1、在X射线图像中选取标注区域Ground Truth进行标注,将标注完成的X射线图像经过预处理成尺寸为M*N的图像,将尺寸为M*N的图像输入卷积残差网络中,输出得到五个尺寸的特征图;S2、将步骤S1得到的五个尺寸特征图输入RPN网络中,生成若干anchors,将属于前景的anchors作为proposals输出,同时输出proposals的坐标;S3、将步骤S2生成的若干proposals输入用于池化的RoIAlign层,整合成相同尺寸的proposals;S4、将步骤S1得到的五个尺寸的特征图和步骤S3得到的相同尺寸的proposals同步输入检测网络的两个全连接层,一个全连接层输出每个proposal的位置坐标,将得到的坐标定义的框作为检测对象的位置,另一个全连接层通过一个softmax层对proposal进行判断,将每个proposal输出的若干检测类别概率分数最高的类别作为proposal所属的类别,得到检测对象的位置和类别,实现X射线图像检测。2.根据权利要求1所述的基于深度学习的X射线图像检测方法,其特征在于,步骤S1中,将尺寸为M*N的图像输入卷积残差网络中,输出得到五个尺寸的特征图具体为:S101、将尺寸为M*N的图像输入7*7*64的卷积层,然后经过最大池化层输入至stage1、stage2、stage3、stage4、stage5层,分别得到特征图C1、C2、C3、C4、C5;S102、将特征图C5经过1*1*256的卷积层得到特征图P5,将特征图C4经过1*1*256的卷积层和P5经过上采样得到的特征图相加得到特征图P4,将特征图C3经过1*1*256的卷积层和P4经过上采样得到的特征图相加得到特征图P3,将特征图C2经过1*1*256的卷积层和P3经过下采样得到的特征图相加得到特征图P2;S103、将得到的特征图P2、P3、P4和P5分别通过3*3*256的卷积层到得P2

、P3

、P4

、P5

,P5

经过下采样得到P6

,将P2

、P3

、P4

、P5

和P6

作为经过残差网络得到的五个尺寸的特征图。3.根据权利要求1所述的基于深度学习的X射线图像检测方法,其特征在于,步骤S2具体为:S201、在特征图上使用窗口进行滑动,每个位置最大的proposals个数为9个,三个不同的尺寸分别为128*128、256*256和512*512,以及1:2,1:1和2:1三个不同的比例作为anchors;S202、将生成的anchors输入RPN网络的两个1*1的卷积层,一个1*1的卷积层输出anchors属于前景和属于背景的分数,另一个1*1的卷积层输出anchors框的位置坐标;S203、将anchors进行坐标回归操作,实现位置修正,提取前N个经位置修正的代表前景的anchors映射回anchors所属的feature maps,实现边框回归操作,判断anchors的位置是否超过图像范围;再利用前景的分数对没有超出范围的anchors进行非极大值抑制,提取剩余前2000个anchors及其对应的坐标作为proposals的输出。4.根据权利要求3所述的基于深度学习的X射线图像检测方法,其特征在于,步骤S201中,在特征图上用3*3的窗口进行滑动。5.根据权利要求3所述的基于深度学习的X射线图像检测方法,其特征在于,步骤S202中,RPN网络的损失函数L(p
i
,t
i
)为:
其中,N
cls
...

【专利技术属性】
技术研发人员:辛景民马楠武佳懿郑南宁
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1