【技术实现步骤摘要】
基于注意力机制的X光安检图像危险物品检测方法
[0001]本专利技术属于图像目标检测
,涉及一种基于注意力机制的X光安检图像危险物品检测方法。
技术介绍
[0002]在公众运输管理领域,对行李实施X光安检是保障乘客生命财产安全的重要方式,但安检人员以肉眼观察图像来确认危险物品易受人为因素影响且效率较低。因此,建立实时准确的X光行李安检系统意义十分重大。
[0003]X光图像中的目标识别主要基于视觉词袋(Bag
‑
of
‑
Visual
‑
Words,BoVW)模型,而随着AlexNet的出现,卷积神经网络(Convolutional Neural Network,CNN)等深度神经网络已经在目标检测、图像分类等方面取得了显著成绩。Akcay S等人将CNN引入X光行李图像领域,使用迁移学习的方法优化AlexNet结构进行端到端的特征提取和分类,检测准确率达到98.92%。Akcay S等人探索了CNN在X光行李图像分类和检测任务中的应用,表明CNN比BoVW模型更有效。Mery D等人提出一种基于深度特征和最近邻分类器的策略来处理公开GDXray(Grima X
‑
ray Dataset)上的X光图像识别问题,识别准确率超过95%。为了解决X光图像数据集有限的问题,Bhowmik N等人提出了合成复合(Synthetically Composite,SC)的数据增强方法,分别在Faster R
‑
CNN和Retina ...
【技术保护点】
【技术特征摘要】
1.一种基于注意力机制的X光安检图像危险物品检测方法,其特征在于,在YOLOv3
‑
SPP架构上融合MSE模块和MFGA模块,构建AFN网络;其中MSE是多压缩激活,MFGA是多融合全局注意力,AFN是注意力融合网络;利用所述注意力融合网络进行X光安检图像危险物品检测,具体包括以下步骤:S1:输入待检测行李的X光安检图像,经过YOLOv3
‑
SPP主干网络获得特征图后将其输入MSE模块,得到具备通道全局性的语义特征;S2:利用SPP模块进行多尺度特征融合后再经过MSE模块,使得融合后的局部特征和全局特征精细化,增强获取的多尺度语义信息;其中,SPP是空间金字塔池化;S3:串联通道分支和空间分支构成MFGA模块,并将该模块放在每一个检测分支的分类器之前;每一个检测分支分别针对X光安检图像中的小、中、大目标进行预测。2.根据权利要求1所述的X光安检图像危险物品检测方法,其特征在于,所述MSE模块的具体结构为:首先是将给定的输入映射到特征图X∈R
C
×
H
×
W
上,其中H、W、C分别对应特征图的高度、宽度和通道维度,MSE模块在压缩操作中通过全局平均池化和最大池化,将生成的特征描述符在通道上拼接;其次是激活操作,全连接层通过膨胀率参数对通道进行降维,之后再恢复通道维度;最后是特征重标定,将激活操作后得到的C
×1×
1的向量与输入特征在通道上进行权重的相乘。3.根据权利要求2所述的X光安检图像危险物品检测方法,其特征在于,所述MSE模块的权重w计算公式为:w=σ(g
ex
{w1,w2}([g
avg
(X);g
max
(X)]))令f=[g
avg
(X);g
max
(X)],得到g
ex
{w1,w2}(f)=w2ReLU(w1f),其中,g
avg
(
·
)、g
max
(
...
【专利技术属性】
技术研发人员:李国权,郭豆豆,吴建,林金朝,庞宇,朱宏钰,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。