当前位置: 首页 > 专利查询>江南大学专利>正文

一种基于空间交叉注意力机制特征融合的目标分类方法技术

技术编号:33704329 阅读:22 留言:0更新日期:2022-06-06 08:23
本发明专利技术公开了一种基于空间交叉注意力机制特征融合的目标分类方法,属于计算机辅助检测技术领域。所述方法通过无参注意力机制捕获相似特征图的重要特征,然后以通道注意力机制激励的方法以一个特征图的特征去重标定另一个特征图,达到融合的效果,本申请方法不仅有效地融合了两个特征图的特征,而且不同于特征金字塔的上采样融合相似特征图的方法,本申请方法有效的减少了参数量,减少了特征冗余,提高了识别性能,本申请通过对于肺结节阳性识别的实例验证其有效性。的实例验证其有效性。的实例验证其有效性。

【技术实现步骤摘要】
一种基于空间交叉注意力机制特征融合的目标分类方法


[0001]本专利技术涉及一种基于空间交叉注意力机制特征融合的目标分类方法,属于计算机辅助检测


技术介绍

[0002]随着图像处理技术的发展,基于图像进行目标识别和分类的技术已经广泛应用到生活的各个领域内,其中包括计算机辅助检测领域。比如医学领域内对于肺结节的检测,临床医生根据肺结节的存在与否以及结节的大小、结节密度,再结合有无长期吸烟史、有无肺癌家族史等因素综合判断肺结节是否为早期肺癌。
[0003]低剂量螺旋计算机断层扫描(low

dose spiral computed tomography,LDCT)是目前应用最广泛的肺结节筛查方式,其可以检测到3mm以上的肺结节。但是一次LDCT可以产生几百张轴向图像,在筛查肺结节阶段,专业医生需要检查每张图像,从而需要花费大量的时间,工作强度比较大。为降低医生的工作强度,目前,通常使用肺部肿瘤结节计算机辅助检测 (CAD)系统以辅助放射医师进行肺部肿瘤结节检测。
[0004]使用该系统时,医生将待检测的C本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于空间交叉注意力机制特征融合的目标分类方法,其特征在于,所述方法包括:Step1:获取三维待分类图像,设三维待分类图像中目标区域的长、宽和高分别为L、W和H;Step2:采用3DSeNet主干网络对待分类图像中目标区域进行特征提取得到四个初步特征向量;所述3DSeNet主干网络由若干个SeBlock块组成,SeBlock块为在ResBlock块中增加了SE三维通道注意力模块得到;Step3:将3DSeNet主干网络输出的四个初步特征向量分别进行特征细化处理得到细化后的特征向量;Step4:将细化后的四个特征向量以通道注意力机制激励的方法用一个特征图的特征去重标定另一个特征图,最终得到用于分类的特性向量;Step5:根据最终得到的用于分类的特性向量对三维待分类图像进行分类。2.根据权利要求1所述的方法,其特征在于,所述SE三维通道注意力模块对输入的特征x
C
×
L
×
W
×
H
先进行Squeeze操作以获取特征图基于通道的全局特征图z
C
×1×1×1,再根据全局特征图进行Excitation操作以得到特征图再用Scale操作将特征图与原始输入的特征x
C
×
L
×
W
×
H
相乘,完成特征重标定的作用以对特征进行校正。3.根据权利要求2所述的方法,其特征在于,所述Step2中SE三维通道注意力模块根据输入的特征x
C
×
L
×
W
×
H
得到四个初步特征向量,包括:对于输入特征x
C
×
L
×
W
×
H
进行Squeeze操作,获取特征图基于通道的全局特征,实现方法如下:即采用三维全局自适应平均池化的方法,将一个通道上整个空间特征编码为一个全局特征,输出的是特征图z
C
×1×1×1;其中C代表通道数;通过如下公式实现Excitation操作得到特征图s
c
=σ(w2δ(w1z))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)其中z是Squeeze操作的输出,σ和δ是sigmoid激活函数,w1=C/R,w2=C2/R,R代表缩减系数;用Scale操作将Excitation操作得到的S
c
与输入特征x
C
×
L
×
W
×
H
相乘,Scale操作的公式如下所示:其中为SE三维通道注意力模块的输出,其大小与输入的特征图的大小相同;四个初步特征向量分别记为x1、x2、x3和x4。4.根据权利要求3所述的方法,其特征在于,所述Step3包括:由输入特征x2,经过多尺度特征细化模块后得到输出x
′2,然后将输入特征x1和x...

【专利技术属性】
技术研发人员:李岳阳顾中轩罗海驰
申请(专利权)人:江南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1