【技术实现步骤摘要】
一种多尺度特征融合的复杂环境实时目标检测方法及装置
[0001]本申请涉及自动驾驶
,尤其是涉及一种多尺度特征融合的复杂环境实时目标检测方法及装置。
技术介绍
[0002]目前,很难有网络在复杂环境中的不同尺度上捕捉空间信息,即对大尺度目标和小尺度目标均能达到较好的检测效果,因而网络具有较低的鲁棒性能且无法对场景信息进行有效地编码。
[0003]为了解决这一问题,现有技术采用动态选择注意力机制,每个神经元根据输入特征图的尺度自适应调节其感受野的大小,虽然该方法可以实现网络在不同尺度上获得信息的能力,但是动态神经元给网络引入了许多新参数,大大增加了网络的复杂度和计算量,难以满足实时目标检测的需求。
技术实现思路
[0004]有鉴于此,本申请提供了一种多尺度特征融合的复杂环境实时目标检测方法及装置,以解决上述技术问题。
[0005]第一方面,本申请实施例提供了一种多尺度特征融合的复杂环境实时目标检测方法,包括:
[0006]获取待检测的目标图像;
[0007]利用预先训练完成的多尺度特征融合模型对目标图像进行处理,得到多尺度融合特征图;
[0008]利用预先训练完成的空间注意力模型对多尺度融合特征图进行处理,得到第一特征图;
[0009]利用预先训练完成的通道注意力模型对多尺度融合特征图进行处理,得到第二特征图;
[0010]将第一特征图和第二特征图相加,得到第三特征图;
[0011]利用检测头对第三特征图进行处理,得到目标检测结果。< ...
【技术保护点】
【技术特征摘要】
1.一种多尺度特征融合的复杂环境实时目标检测方法,其特征在于,包括:获取待检测的目标图像;利用预先训练完成的多尺度特征融合模型对目标图像进行处理,得到多尺度融合特征图;利用预先训练完成的空间注意力模型对多尺度融合特征图进行处理,得到第一特征图;利用预先训练完成的通道注意力模型对多尺度融合特征图进行处理,得到第二特征图;将第一特征图和第二特征图相加,得到第三特征图;利用检测头对第三特征图进行处理,得到目标检测结果。2.根据权利要求1所述的方法,其特征在于,所述多尺度特征融合模型包括三个并行的第一卷积层、第二卷积层和第三卷积层以及加法器;其中,第一卷积层的卷积核为1
×
1,填充值为0,步长为1;第二卷积层的卷积核为3
×
3,填充值为1,步长为1;第一卷积层的卷积核为5
×
5,填充值为2,步长为1;利用预先训练完成的多尺度特征融合模型对目标图像进行处理,得到多尺度融合特征图;包括:利用第一卷积层对目标图像X进行处理,得到特征图X1,目标图像X的高度为H,宽度为W,通道数为C;利用第二卷积层对目标图像X进行处理,得到特征图X2;利用第三卷积层对目标图像X进行处理,得到特征图X3;利用加法器对特征图X1、特征图X2和特征图X3进行相加,得到多尺度融合特征图X
fea
:X
fea
=X1+X2+X3。3.根据权利要求2所述的方法,其特征在于,所述空间注意力模型包括并行第一分支、第二分支、第三分支和第四分分支;所述第一分支包括依次连接的第四卷积层、第一重塑层和第一转置层;所述第二分支包括依次连接的第五卷积层、第二重塑层、第一乘法器和第一归一化层;所述第三分支包括依次连接的第六卷积层、第三重塑层、第二乘法器和第四重塑层;第四分分支包括第二加法器;第一转置层和第一乘法器连接,第一归一化层和第二乘法器连接;第四重塑层和第二加法器连接;利用预先训练完成的空间注意力模型对多尺度融合特征图进行处理,得到第一特征图;包括:利用第四卷积层对多尺度融合特征图X
fea
进行处理,得到特征图Y1,特征图Y1的大小为H
×
W
×
C;利用第一重塑层对特征图Y1进行维度转化,得到二维张量二维张量的大小为N
×
C,N=H
×
W,N为中间参数;利用第一转置层对二维张量进行转置,得到二维张量二维张量的大小为C
×
N;利用第五卷积层对多尺度融合特征图X
fea
进行处理,得到特征图Y2,特征图Y2的大小为H
×
W
×
C;利用第二重塑层对特征图Y2进行维度转化,得到二维张量二维张量的大小为N
×
C;利用第一乘法器对二维张量和二维张量进行矩阵乘积运算,得到大小为C
×
C的
矩阵Y
1,2
;利用第一归一化层对矩阵Y
1,2
进行归一化处理,得到大小为C
×
C的矩阵;利用第六卷积层对多尺度融合特征图X
fea
进行处理,得到特征图Y3,特征图Y1的大小为H
×
W
×
C;利用第三重塑层对特征图Y3进行维度转化,得到二维张量二维张量的大小为N
×
C;利用第二乘法器对二维张量和矩阵进行矩阵乘积运算,得到大小为N
×
...
【专利技术属性】
技术研发人员:张新钰,谢涛,吴新刚,王力,高镜涵,戴崑,
申请(专利权)人:清华大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。