当前位置: 首页 > 专利查询>清华大学专利>正文

一种多尺度特征融合的复杂环境实时目标检测方法及装置制造方法及图纸

技术编号:37711984 阅读:12 留言:0更新日期:2023-06-02 00:05
本申请提供一种多尺度特征融合的复杂环境实时目标检测方法及装置,涉及自动驾驶技术领域,所述方法包括:获取待检测的目标图像;利用预先训练完成的多尺度特征融合模型对目标图像进行处理,得到多尺度融合特征图;利用预先训练完成的空间注意力模型对多尺度融合特征图进行处理,得到第一特征图;利用预先训练完成的通道注意力模型对多尺度融合特征图进行处理,得到第二特征图;将第一特征图和第二特征图相加,得到第三特征图;利用检测头对第三特征图进行处理,得到目标检测结果。本申请通过多尺度特征融合提高了目标检测的精度,具有模型简单和计算量小的优点。有模型简单和计算量小的优点。有模型简单和计算量小的优点。

【技术实现步骤摘要】
一种多尺度特征融合的复杂环境实时目标检测方法及装置


[0001]本申请涉及自动驾驶
,尤其是涉及一种多尺度特征融合的复杂环境实时目标检测方法及装置。

技术介绍

[0002]目前,很难有网络在复杂环境中的不同尺度上捕捉空间信息,即对大尺度目标和小尺度目标均能达到较好的检测效果,因而网络具有较低的鲁棒性能且无法对场景信息进行有效地编码。
[0003]为了解决这一问题,现有技术采用动态选择注意力机制,每个神经元根据输入特征图的尺度自适应调节其感受野的大小,虽然该方法可以实现网络在不同尺度上获得信息的能力,但是动态神经元给网络引入了许多新参数,大大增加了网络的复杂度和计算量,难以满足实时目标检测的需求。

技术实现思路

[0004]有鉴于此,本申请提供了一种多尺度特征融合的复杂环境实时目标检测方法及装置,以解决上述技术问题。
[0005]第一方面,本申请实施例提供了一种多尺度特征融合的复杂环境实时目标检测方法,包括:
[0006]获取待检测的目标图像;
[0007]利用预先训练完成的多尺度特征融合模型对目标图像进行处理,得到多尺度融合特征图;
[0008]利用预先训练完成的空间注意力模型对多尺度融合特征图进行处理,得到第一特征图;
[0009]利用预先训练完成的通道注意力模型对多尺度融合特征图进行处理,得到第二特征图;
[0010]将第一特征图和第二特征图相加,得到第三特征图;
[0011]利用检测头对第三特征图进行处理,得到目标检测结果。<br/>[0012]进一步地,所述多尺度特征融合模型包括三个并行的第一卷积层、第二卷积层和第三卷积层以及加法器;
[0013]其中,第一卷积层的卷积核为1
×
1,填充值为0,步长为1;第二卷积层的卷积核为3
×
3,填充值为1,步长为1;第一卷积层的卷积核为5
×
5,填充值为2,步长为1;
[0014]利用预先训练完成的多尺度特征融合模型对目标图像进行处理,得到多尺度融合特征图;包括:
[0015]利用第一卷积层对目标图像X进行处理,得到特征图X1,目标图像X的高度为H,宽度为W,通道数为C;
[0016]利用第二卷积层对目标图像X进行处理,得到特征图X2;
[0017]利用第三卷积层对目标图像X进行处理,得到特征图X3;
[0018]利用加法器对特征图X1、特征图X2和特征图X3进行相加,得到多尺度融合特征图X
fea
:
[0019]X
fea
=X1+X2+X3。
[0020]进一步地,所述空间注意力模型包括并行第一分支、第二分支、第三分支和第四分分支;所述第一分支包括依次连接的第四卷积层、第一重塑层和第一转置层;所述第二分支包括依次连接的第五卷积层、第二重塑层、第一乘法器和第一归一化层;所述第三分支包括依次连接的第六卷积层、第三重塑层、第二乘法器和第四重塑层;第四分分支包括第二加法器;第一转置层和第一乘法器连接,第一归一化层和第二乘法器连接;第四重塑层和第二加法器连接;
[0021]利用预先训练完成的空间注意力模型对多尺度融合特征图进行处理,得到第一特征图;包括:
[0022]利用第四卷积层对多尺度融合特征图X
fea
进行处理,得到特征图Y1,特征图Y1的大小为H
×
W
×
C;利用第一重塑层对特征图Y1进行维度转化,得到二维张量二维张量的大小为N
×
C,N=H
×
W,N为中间参数;利用第一转置层对二维张量进行转置,得到二维张量二维张量的大小为C
×
N;
[0023]利用第五卷积层对多尺度融合特征图X
fea
进行处理,得到特征图Y2,特征图Y2的大小为H
×
W
×
C;利用第二重塑层对特征图Y2进行维度转化,得到二维张量二维张量的大小为N
×
C;利用第一乘法器对二维张量和二维张量进行矩阵乘积运算,得到大小为C
×
C的矩阵Y
1,2
;利用第一归一化层对矩阵Y
1,2
进行归一化处理,得到大小为C
×
C的矩阵;
[0024]利用第六卷积层对多尺度融合特征图X
fea
进行处理,得到特征图Y3,特征图Y1的大小为H
×
W
×
C;利用第三重塑层对特征图Y3进行维度转化,得到二维张量二维张量的大小为N
×
C;利用第二乘法器对二维张量和矩阵进行矩阵乘积运算,得到大小为N
×
C的矩阵Y
1,2,3
;利用第四重塑层对矩阵Y
1,2,3
进行维度转化,得到三维张量大小为H
×
W
×
C;
[0025]利用第二加法器对三维张量和多尺度融合特征图X
fea
进行加法操作,得到第一特征图Y
spa

[0026]进一步地,所述通道注意力模型包括并行第五分支、第六分支、第七分支和第八分支;所述第五分支包括依次连接的第五重塑层和第二转置层;所述第六分支包括依次连接的第六重塑层、第三乘法器和第二归一化层;所述第七分支包括依次连接的第七重塑层、第四乘法器和第八重塑层;第四分支包括第三加法器;第二转置层和第三乘法器连接,第二归一化层和第四乘法器连接,第八重塑层和第三加法器连接;
[0027]利用预先训练完成的通道注意力模型对多尺度融合特征图进行处理,得到第二特征图;包括:
[0028]利用第五重塑层对多尺度融合特征图X
fea
进行维度转化,得到二维张量Z1,二维张
量Z1的大小为N
×
C;利用第二转置层对二维张量Z1进行转置,得到二维张量二维张量的大小为C
×
N;
[0029]利用第六重塑层对多尺度融合特征图X
fea
进行处理,得到二维张量Z2,二维张量Z2的大小为N
×
C;利用第三乘法器对二维张量Z2和二维张量进行矩阵乘积运算,得到大小为N
×
N的矩阵Z
1,2
;利用第二归一化层对矩阵Z
1,2
进行归一化处理,得到大小为N
×
N的矩阵
[0030]利用第七重塑层对多尺度融合特征图X
fea
进行处理,得到二维张量Z3,Z1=Z2=Z3;利用第四乘法器对矩阵和二维张量Z3进行矩阵乘积运算,得到大小为N
×
C的矩阵Z
1,2,3
;利用第八重塑层对矩阵Z
1,2,3
进行维度转化,得到三维张量大小为H
×
W
×
C;
[0031]利用第三加本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多尺度特征融合的复杂环境实时目标检测方法,其特征在于,包括:获取待检测的目标图像;利用预先训练完成的多尺度特征融合模型对目标图像进行处理,得到多尺度融合特征图;利用预先训练完成的空间注意力模型对多尺度融合特征图进行处理,得到第一特征图;利用预先训练完成的通道注意力模型对多尺度融合特征图进行处理,得到第二特征图;将第一特征图和第二特征图相加,得到第三特征图;利用检测头对第三特征图进行处理,得到目标检测结果。2.根据权利要求1所述的方法,其特征在于,所述多尺度特征融合模型包括三个并行的第一卷积层、第二卷积层和第三卷积层以及加法器;其中,第一卷积层的卷积核为1
×
1,填充值为0,步长为1;第二卷积层的卷积核为3
×
3,填充值为1,步长为1;第一卷积层的卷积核为5
×
5,填充值为2,步长为1;利用预先训练完成的多尺度特征融合模型对目标图像进行处理,得到多尺度融合特征图;包括:利用第一卷积层对目标图像X进行处理,得到特征图X1,目标图像X的高度为H,宽度为W,通道数为C;利用第二卷积层对目标图像X进行处理,得到特征图X2;利用第三卷积层对目标图像X进行处理,得到特征图X3;利用加法器对特征图X1、特征图X2和特征图X3进行相加,得到多尺度融合特征图X
fea
:X
fea
=X1+X2+X3。3.根据权利要求2所述的方法,其特征在于,所述空间注意力模型包括并行第一分支、第二分支、第三分支和第四分分支;所述第一分支包括依次连接的第四卷积层、第一重塑层和第一转置层;所述第二分支包括依次连接的第五卷积层、第二重塑层、第一乘法器和第一归一化层;所述第三分支包括依次连接的第六卷积层、第三重塑层、第二乘法器和第四重塑层;第四分分支包括第二加法器;第一转置层和第一乘法器连接,第一归一化层和第二乘法器连接;第四重塑层和第二加法器连接;利用预先训练完成的空间注意力模型对多尺度融合特征图进行处理,得到第一特征图;包括:利用第四卷积层对多尺度融合特征图X
fea
进行处理,得到特征图Y1,特征图Y1的大小为H
×
W
×
C;利用第一重塑层对特征图Y1进行维度转化,得到二维张量二维张量的大小为N
×
C,N=H
×
W,N为中间参数;利用第一转置层对二维张量进行转置,得到二维张量二维张量的大小为C
×
N;利用第五卷积层对多尺度融合特征图X
fea
进行处理,得到特征图Y2,特征图Y2的大小为H
×
W
×
C;利用第二重塑层对特征图Y2进行维度转化,得到二维张量二维张量的大小为N
×
C;利用第一乘法器对二维张量和二维张量进行矩阵乘积运算,得到大小为C
×
C的
矩阵Y
1,2
;利用第一归一化层对矩阵Y
1,2
进行归一化处理,得到大小为C
×
C的矩阵;利用第六卷积层对多尺度融合特征图X
fea
进行处理,得到特征图Y3,特征图Y1的大小为H
×
W
×
C;利用第三重塑层对特征图Y3进行维度转化,得到二维张量二维张量的大小为N
×
C;利用第二乘法器对二维张量和矩阵进行矩阵乘积运算,得到大小为N
×
...

【专利技术属性】
技术研发人员:张新钰谢涛吴新刚王力高镜涵戴崑
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1