【技术实现步骤摘要】
基于UNET下采样卷积神经网络的X光违禁物检测方法
[0001]本专利技术属于图像处理
,更进一步涉及计算机视觉
中的一种基于UNET的下采样卷积神经网络X光违禁物品检测方法,可用于对X光图像中的违禁物品进行检测。
技术介绍
[0002]近年来,X光安全检测问题逐渐得到人们的重视,尤其是行李威胁检测已经成为全世界最关注的问题。仅2019年广州高铁站每天就平均检测40万人次,因此,积极寻找自动可靠的行李检查系统,快速、自动和准确地识别X射线扫描图像中的违禁物品也就变的非常关键。X射线图像中被遮挡的违禁物体的识别可以看作是计算机视觉的一个目标检测问题,在行李检测中威胁对象出现的概率较小,被低严重低估,出现了类不平衡问题,这类检测有个统一的名称叫异常检测。
[0003]目前,在x射线行李图像的目标检测主要有两种方法:一种是传统视觉方法,一种是深度学习方法。传统视觉方法利用训练的手工特征,如X光行李图像中的单词(BoW。具有多个特征表示如DoG、DoG+SIFT、DoG+Harris)形成特征描述子进行特征提取,再利用支持向量机(SVM)进行分类和检测。但它的缺点是人工分析图片的特征,主观性较强且只在特定场景下适用,不利于泛化。深度学习方法一般方法为:采集大量图片,标注图片,把图片放进网络训练,查看训练结果,调节参数和网络结构,再次训练,得到最好的结果。
[0004]随着深度学习方法的深入研究,大量的卷积神经网络方法在X光安全检测中应用。Yanlu Wei在其发表的论文“Occluded Proh ...
【技术保护点】
【技术特征摘要】
1.一种基于UNET的下采样卷积神经网络的X光违禁物品检测方法,其特征在于包括如下步骤:(1)获取训练样本集和测试样本集:(1a)获取N幅包含不同类别违禁物品的X光图像M={m
i
|1≤i≤N},并对每幅X光图像m
i
中的违禁物品类别及位置坐标进行标注,得到类别标签集和位置坐标标签集其中,N>8000,m
i
表示第i幅X光图像,和分别表示m
i
所包含的违禁物品的类别标签和位置坐标标签,包含的违禁物品的类别标签和位置坐标标签,表示第s类违禁物品,S表示违禁物品的类别数,S≥2,S≥2,和分别表示所围成的标记框中心的横坐标、标记框中心的纵坐标、标记框的宽和标记框的高;(1b)将随机选取M中半数以上的违禁物品X光图像及其对应的类别标签和位置坐标标签组成训练样本集M
train
={m
j
|1≤j≤N
train
},N/2<N
train
≤N,将其余违禁物品X光图像及其对应的类别标签和位置坐标标签组成测试样本集M
test
={m
l
|1≤l≤N
test
},其中,m
j
表示训练样本集中的第j幅X光图像,m
l
表示训练样本集中的第l幅X光图像,N/2<N
train
≤N,N
test
=N
‑
N
train
;(2)构建基于UNET的下采样卷积神经网络:(2a)构建基于UNET的下采样卷积神经网络的结构:构建包括顺次连接的特征提取网络f
f
‑
e
、基于UNET网络实现的细粒度划分网络f
down
‑
up
、注意力网络f
attention
和输出网络f
output
的下采样卷积神经网络,其中,特征提取网络f
f
‑
e
包括输入层、多个卷积模块和多个残差模块;细粒度划分网络f
down
‑
up
包含多个上采样连接模块、多个下采样连接模块、卷积模块和多个concat拼接层,构成“U”型结构;注意力网络f
attention
包括多个卷积模块和一个融合模块;输出网络f
output
采用包括两个卷积层、一个归一化层和一个激活函数层的神经网络;(2b)定义基于UNET的下采样卷积神经网络的损失函数Loss:Loss=L
GHM
‑
C
+L
lclc
其中,L
GHM
‑
C
表示分类损失函数,L
CE
是交叉熵损失函数,P是构建的卷积神经网络的检测概率,P
*
是X光图像的标签,P
*
的取值为0或1,GD(g)表示单位梯度模长g部分的样本个数,即梯度密度,δ
ε
(g
d
,g)表明了样本1~W中,梯度模长分布在范围内的样本个数,l
ε
(g)代表了区间的长度;L
lc
表示类别和定位损失函数,L
lc
把X光图像划分成不同大小的网格,根据候选框和标记框的中心点坐标、及宽高信息和网格数构建函数,M代表候选框数量,M=3,K代表网格数,表示在q,m处的候选框有目标,表示在q,m处的候选框没有目标,w表示候选框的宽度,h表示候选框的高度,x表示候选框中心的横坐标,y表示候选框中心的纵坐标,C表示候选框内存在违禁物品的置信度,表示候选框内实际是存在违禁物品的,表示违禁物品是属于第c类的概率,λ
coord
为定位平衡参数,λ
noobj
为类别平衡参数;(3)对基于UNET的下采样卷积神经网络进行迭代训练:(3a)初始化特征提取网络f
f
‑
e
的权重参数为细粒度划分网络f
down
‑
up
的权重参数为注意力网络f
attention
的权重参数为输出网络f
output
的权重参数为迭代次数为t,最大迭代次数为T≥50,并令t=0;(3b)将训练样本集M
train
中的每个训练样本包括X光图像及其对应的类别标签和位置坐标标签作为特征提取网络f
f
‑
e
的输入,每幅图像m
j
在特征提取网络中进行前向特征提取,得到图像m
j
的第一高级特征(3c)将图像m
j
的第一高级特征作为细粒度划分网络f
down
‑
up
的输入进行特征提取,在细粒度划分网络f
down
‑
up
中进行特征融合,得到图像m
j
的第二高级特征(3d)将图像m
j
的第二高级特征作为注意力网络f
attention
的输入进行前向特征提取,得到图像m
j
的注意力图(3e)将图像m
j
的注意力图与图像m
j
的第一高级特征在融合模块中相乘,得到图像m
j
的第三高级特征
(3f)将图像m
j
的第三高级特征作为输出网络f
output
的输入进行前向特征提取,得到图像m
j
的所包含违禁物品的预测位置坐标标签置信度信息和预测类别标签概率(3g)基于UNET的下采样卷积神经网络的损失函数Loss=L
GHM
‑
C
+L
lc
,通过计算分类损失函数L
GHM
‑
C
,以及类别和定位损失函数L
lc
的函数值,并将L
GHM
‑
C
与L
lc
相加得到Loss,再采用反向传播方法,通过Loss计算f
f
‑
e
、f
down
‑
up
、f
attention
和f
output
的网络权重参数梯度,然后采用梯度下降算法通过f
f
‑
e
、f
down
‑
up
、f
attention
和f
output
的网络权重参数梯度对f
f
‑
e
、f
down
‑
up
、f
attention
和f
output
的网络权重参数θ
attention
和θ
output
进行更新;(3h)判断t≥T是否成立,若是,得到训练好的基于UNET的下采样...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。