【技术实现步骤摘要】
一种基于注意力叠加与特征融合的肺炎X光片图像分析模型及分析方法
[0001]本专利技术涉及图像检测
,特别是涉及一种基于注意力叠加与特征融合的肺炎X光片图像分析模型及分析方法。
技术介绍
[0002]建立图像分析模型是对X光片图像进行分析的主要手段,肺炎检测的主要工作是对输入的肺部医学影像提取特征,从而得到感兴趣区域(ROI,Region of Interest)。提取的特征通常是对CXR的完备描述,而根据提取的特征区分肺炎和非肺炎,是肺炎检测的难点。吴恩达团队提出的CheXNet,由121层的DenSenet网络组成,可以对14种肺部疾病进行分类,但该项工作无法预测病灶的位置信息,只能得到患病的概率;2019年郝冰通过Retinanet和Mask
‑
RCNN,使用单阶段和双阶段模型训练,提高了肺炎的检测性能;Dmytro Poplavskiy等人使用RetineNet SSD网络模型对肺炎进行检测,在模型中加入了全局分类输出,并对数据集进行了大幅度的扩充,虽提高了模型精度,但准确率仅24.781%。Jaiswal等人采用Mask RCNN,通过调整训练中的阈值以及融合预测结果,有效地识别并定位肺炎区域,然而训练阶段需调整阈值,导致训练过程复杂。Eunji等人通过比较输入图像和原型的特征来诊断疾病,并可以对诊断结果提供全局解释、原型和局部解释,但可解释性仍受到了一定的限制。尽管上述方法在肺炎检测中已经取得了一定的效果,但仍存在模型参数量大、训练时间长、检测准确率低等问题。
[0003] ...
【技术保护点】
【技术特征摘要】
1.一种基于注意力叠加与特征融合的肺炎X光片图像分析模型,其特征在于,包括YOLOv5主干网络模型、SasNet空间注意力叠加网络模型、MfcNet多层特征融合网络模型、YOLOv5预测网络模型,其中:所述YOLOv5主干网络模型从肺炎X光片样本数据中抽取目标的特征表示形式,得到主干网络特征;所述SasNet空间注意力叠加网络模型包括注意力引导模块、第一通道特征计算模块、第二通道特征计算模块以及两个注意力引导叠加模块,所述注意力引导模块对所述主干网络特征进行一次空间注意力值的计算,得出初始注意力分数a
i
,第一通道特征计算模块和第二通道特征计算模块分别进行CBL和编码解码操作,得到中间特征图,在所述注意力引导叠加模块中,中间特征图计算得到注意力分数c
i
分别与所述初始注意力分数a
i
相乘,得到注意力值a
′
i
,两组注意力值a
′
i
合并得到特征图Out;所述MfcNet多层特征融合网络模型包括通道注意力模块与特征融合模块,先通过通道注意力模块得到每个通道的权值ω,在特征融合模块中,再根据每个通道的权值ω对最终分类结果的重要性和贡献度,把通道分割为一个积极通道和一个消极通道,消极通道经过取均值后再与积极通道特征融合,最终经过残差输出新的特征图Out
′
;所述YOLOv5预测网络模型分类网络模型和定位回归网络模型,所述分类网络模型对所述新的特征图进行分类,所述定位回归网络模型对所述新的特征图进行定位。2.如权利要求1所述的基于注意力叠加与特征融合的肺炎X光片图像分析模型,其特征在于,注意力引导模块将所述主干网络特征的最大值和平均值合并,得到c
i
,经过卷积和Sigmoid激活后,得到初始注意力分数a
i
,c
i
=[max(x
i
),mean(x
i
)],a
i
=S(C(c
i
)),i为位置索引,代表所有通道在位置i的向量值,max代表取最大值,mean代表取平均值,[]是拼接操作,C表示卷积操作,S代表Sigmoid操作。3.如权利要求2所述的基于注意力叠加与特征融合的肺炎X光片图像分析模型,其特征在于,注意力引导叠加模块获得的注意力值a
′
i
可表示为:a
′
i
=S(C(a
i
×
c
i
))两组注意力值合并得到特征图Out=[a
′
i
×
o
i
,x
i
]其中o
i
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。