一种基于多分支局部注意力网络的车辆分类方法技术

技术编号:30693597 阅读:12 留言:0更新日期:2021-11-06 09:27
本发明专利技术公开了一种基于多分支局部注意力网络的车辆分类方法,具体步骤包括获取待分类车辆图片并划分为训练集和测试集;将车辆图片的训练集输入构建多分支局部注意力网络的车辆分类模型进行训练,所述多分支局部注意力网络包括基于通道的卷积注意力模块,以及基于空间的局部注意力模块;根据训练好的车辆分类模型对车辆图片的测试集进行分类预测,得到分类结果。本发明专利技术在原始ResNet

【技术实现步骤摘要】
一种基于多分支局部注意力网络的车辆分类方法


[0001]本专利技术涉及深度学习和计算机视觉
,特别涉及一种基于多分支局部注意力网络的车辆分类方法。

技术介绍

[0002]近年来,智能交通系统(ITS)发展快速,随着计算机视觉和深度学习的发展,为智能交通系统更有效的应用提供了契机。计算机视觉是利用计算机来模拟人的视觉能力,从客观事物的图像中提取信息,进行处理并加以理解,最终应用到实际生活中,例如车辆分类。
[0003]传统的基于视觉的车辆分类方法通常是依赖于手工特征,如颜色直方图(CH)、纹理描述符(TD)、GIST)或通过BoVW、IFK、SPM等编码局部特征生成的表示,费时费力,泛化能力差,易受环境变化和遮挡的影响。随着深度学习理论和实践的迅速发展,基于深度学习的目标检测与分类进入了一个新的阶段。不同于传统的特征提取算法,卷积神经网络具有一定的不变性的几何变换、变形和光照,可以克服改变车辆外观的困难,可以解决遮挡问题,能够自适应的训练数据驱动下构建的特征描述,具有更大的灵活性和综合能力。
[0004]现有的卷积神经网络方法依然存在不足之处在于,没有明确区分关键信息和冗余信息,模型的特征识别能力仍然不强不足。期间多层卷积和池化,大量重要信息丢失,导致提取的特征不能很好地表示目标。

技术实现思路

[0005]本专利技术的目的克服现有技术存在的不足,为实现以上目的,采用一种基于多分支局部注意力网络的车辆分类方法,以解决上述
技术介绍
中提出的问题。
[0006]一种基于多分支局部注意力网络的车辆分类方法,具体步骤包括:
[0007]获取待分类车辆图片并划分为训练集和测试集;
[0008]将车辆图片的训练集输入构建多分支局部注意力网络的车辆分类模型进行训练,所述多分支局部注意力网络包括基于通道的卷积注意力模块,以及基于空间的局部注意力模块;
[0009]根据训练好的车辆分类模型对车辆图片的测试集进行分类预测,得到分类结果。
[0010]作为本专利技术的进一步的方案:所述获取待分类车辆图片并划分为训练集和测试集的具体步骤包括:
[0011]获取车辆场景图像,并划分为训练集和测试集,训练集和测试集的比例为4:1;
[0012]所述训练集包括M张训练图片为X={X1,X2,

,X
m
,

,X
M
},所述训练集包括N张训练图片为Y={Y1,Y2,

,Y
n
,

,Y
N
},其中X
m
表示第m张训练图片,Y
n
表示第n张测试图片;
[0013]对所述训练集和测试集的图片进行标签与原图一对一标注。
[0014]作为本专利技术的进一步的方案:所述将车辆图片的训练集输入构建多分支局部注意力网络的车辆分类模型进行训练,所述多分支局部注意力网络包括基于通道的卷积注意力
模块,以及基于空间的局部注意力模块的具体步骤包括:
[0015]基于ResNet

50模型构建多分支局部注意力网络结构;
[0016]利用基于通道的卷积注意力模块引入作为第一个分支;
[0017]利用基于空间的局部注意力模块引入作为第二个分支;
[0018]将两个分支使用并行方法进行分支融合,融合公式为:
[0019]F

=σ(M
C
(F)
×
M
S
(F))
×
F;
[0020]其中,M
c
(F)表示通道注意力,M
s
(F)表示空间注意力,σ(*)是sigmoid激活函数;
[0021]将多分支局部注意力网络结构嵌入ResNet

50每个bottleneck层中,得到基于多分支局部注意力网络的车辆分类模型。
[0022]作为本专利技术的进一步的方案:所述利用基于通道的卷积注意力模块引入作为第一个分支的具体步骤包括:
[0023]使用全局平均池化和全局最大池化操作来聚合特征映射的空间信息,即和
[0024]利用2
×
1卷积方法将和结合起来;
[0025]最后添加一个多层感知器来学习最终的通道注意力特征图M
c
(F),公式为:
[0026][0027]其中,W0∈R
(C/r)
×
C
,W1∈R
C
,W0和W1是多层感知器MLP的权重,f2×1表示滤波器大小为2
×
1的卷积运算。
[0028]作为本专利技术的进一步的方案:所述利用基于空间的局部注意力模块引入作为第二个分支的具体步骤包括:
[0029]对原始特征图的所有通道并行应用局部空间最大池化和平均池化,其中核和步长等于ε;
[0030]通过聚集F的所有ε

邻域内的特征来生成两个压缩的空间注意描述符F
M
和F
A

[0031]F
A
=AvgPool
kernel,stride=ε
(F);
[0032]F
M
=MaxPool
kernel,stride=ε
(F);
[0033]利用全局最大池化和全局平均池化沿着通道方向收紧F
M
和F
A
生成描述符和并连接起来;
[0034]再依次增加3
×
3空洞卷积和最近邻插值操作,得到空间注意力的特征图;
[0035]M
S
(F)=σ(f
nearest
(f([F
max
(F
M
);F
avg
(F
A
)])));
[0036]其中,MaxPool(*)和AvgPool(*)表示空间域中核和步长为ε的局部最大池化和平均池化操作,F
max
(*)和F
avg
(*)是沿通道方向的最大池化和平均池操作,f(*)表示3
×
3空洞卷积,f
nearest
(*)是最近邻插值上采样算子,σ(*)是sigmoid激活函数。
[0037]作为本专利技术的进一步的方案:所述根据训练好的车辆分类模型对车辆图片的测试集进行分类预测,得到分类结果的具体步骤包括:
[0038]设置损失函数,调整训练集中车辆图像的大小后输入基于多分支局部注意力网络进行训练,得到训练好的网络模型;
[0039]利用训练好的网络模型的提取网络全连接层使用Softmax函数对测试集中的车辆
图像进行分类预测,得到分类结果。
[0040]与现有技术相比,本专利技术存在以下技术效果:
...

【技术保护点】

【技术特征摘要】
1.一种基于多分支局部注意力网络的车辆分类方法,其特征在于,具体步骤包括:获取待分类车辆图片并划分为训练集和测试集;将车辆图片的训练集输入构建多分支局部注意力网络的车辆分类模型进行训练,所述多分支局部注意力网络包括基于通道的卷积注意力模块,以及基于空间的局部注意力模块;根据训练好的车辆分类模型对车辆图片的测试集进行分类预测,得到分类结果。2.根据权利要求1所述一种基于多分支局部注意力网络的车辆分类方法,其特征在于,所述获取待分类车辆图片并划分为训练集和测试集的具体步骤包括:获取车辆场景图像,并划分为训练集和测试集,训练集和测试集的比例为4:1;所述训练集包括M张训练图片为X={X1,X2,

,X
m
,

,X
M
},所述训练集包括N张训练图片为Y={Y1,Y2,

,Y
n
,

,Y
N
},其中X
m
表示第m张训练图片,Y
n
表示第n张测试图片;对所述训练集和测试集的图片进行标签与原图一对一标注。3.根据权利要求1所述一种基于多分支局部注意力网络的车辆分类方法,其特征在于,所述将车辆图片的训练集输入构建多分支局部注意力网络的车辆分类模型进行训练,所述多分支局部注意力网络包括基于通道的卷积注意力模块,以及基于空间的局部注意力模块的具体步骤包括:基于ResNet

50模型构建多分支局部注意力网络结构;利用基于通道的卷积注意力模块引入作为第一个分支;利用基于空间的局部注意力模块引入作为第二个分支;将两个分支使用并行方法进行分支融合,融合公式为:F

=σ(M
C
(F)
×
M
S
(F))
×
F;其中,M
c
(F)表示通道注意力,M
s
(F)表示空间注意力,σ(*)是sigmoid激活函数;将多分支局部注意力网络结构嵌入ResNet

50每个bottleneck层中,得到基于多分支局部注意力网络的车辆分类模型。4.根据权利要求3所述一种基于多分支局部注意力网络的车辆分类方法,其特征在于,所述利用基于通道的卷积注...

【专利技术属性】
技术研发人员:周平陈晨闫如根赵吉祥胡昌隆吕强李涛
申请(专利权)人:合肥市正茂科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1