一种用于无人机的车辆检测方法技术

技术编号:39570996 阅读:8 留言:0更新日期:2023-12-03 19:22
本发明专利技术公开了一种用于无人机的车辆检测方法

【技术实现步骤摘要】
一种用于无人机的车辆检测方法、装置及存储介质


[0001]本专利技术涉及一种用于无人机的车辆检测方法

装置及存储介质,属于图像处理

计算机视觉

深度学习



技术介绍

[0002]随着社会经济的发展和国民生活水平的提高,我国的汽车数量与日俱增,随之而来的是交通拥堵

交通事故频发,为了缓解日益增长的交通压力,发展智能交通系统迫在眉睫

相较于传统的固定布局和移动终端,无人机具有灵活性

经济性等优点,利用无人机进行车辆的精确定位和识别,为智能交通系统获得可靠的交通信息提供了有效的解决方案

目前许多目标检测算法都在向着“高精度”的方向发展,导致这类算法参数量

计算量大,需要在大显存

高算力的
GPU
上才能运行

而无人机搭载的嵌入式平台的内存和计算能力有限

因此想要在这类平台上部署车辆检测算法,就需要我们设计一种轻量化的网络并且需要平衡检测算法的准确性和实时性

[0003]另一方面,在过去的几年中,深度学习的快速发展和大规模数据集的出现推动了基于卷积神经网络的检测器的普及

然而,在通用数据集上的检测任务通常涉及更大的目标,这些目标通常具有较大的尺寸和较高的对比度,因此相对容易被检测

然而,在真实的应用场景中,无人机平台通常在高度几十米的空中,其观察到的车辆目标只有几十个像素,只占整个图像非常少的比例

这些小目标的尺寸较小,图像中包含的有效信息也就相对较少,甚至还容易受到噪声和背景的干扰

同时,在卷积网络的下采样过程中,特征图的分辨率将被进一步降低,小目标在特征图的细粒度信息会被过滤甚至消失,进一步增加了物体的区分和定位难度

尽管这些通用物体检测器已经显著提高了精度和效率,但当检测小尺寸目标时,它们仍然表现不佳


技术实现思路

[0004]本专利技术的目的在于提供一种用于无人机的车辆检测方法

装置及存储介质,解决现有技术中存在的算力需求大

小目标检测精度低的问题

[0005]为实现以上目的,本专利技术是采用下述技术方案实现的:
[0006]第一方面,本专利技术提供了一种用于无人机的车辆检测方法,包括:
[0007]获取无人机拍摄的图像;
[0008]将所述图像输入到训练好的目标检测网络中,得到检测结果

[0009]结合第一方面,进一步的,所述目标检测网络包括主干网络

特征金字塔和检测头;
[0010]所述主干网络用于从输入的图像中提取特征表示;
[0011]所述特征金字塔用于融合所述主干网络输出的特征表示中的浅层纹理特征和深层语义信息;
[0012]所述检测头用于根据所述特征金字塔的输出产生检测结果

[0013]结合第一方面,进一步的,所述主干网络的结构通过基于最大熵理论的零样本
NAS
方法确定

[0014]结合第一方面,进一步的,所述主干网络的结构通过基于最大熵理论的零样本
NAS
方法确定,包括:
[0015]使用以下公式搜索出一个
L

、M
级的卷积神经网络作为主干网络:
[0016][0017]s.t.Latency≤budget
[0018][0019][0020]w1≤w2≤

≤w
L
[0021]其中,
s
i
是主干网络第
i
级的预定义残差块优化参数,
i
是主干网络的级数,
α
i

H
i
的权重超参数,
H
i
是主干网络第
i
级所包含的熵,
β

Q
的权重超参数,
Q
是每一级通道数方差的期望,
Latency
是主干网络实际运行时的延迟,
budget
是主干网络时延预算,
w
i
是主干网络第
i
层的宽度,
w1,
w2,


w
L
表示主干网络第1层到第
L
层的宽度,
ρ
是设置好的超参数,表示定义为,
Var
是方差运算符号,
d1,
d2,


d
M
表示主干网络第1级到第
M
级的通道数

[0022]结合第一方面,进一步的,所述主干网络的熵为:
[0023][0024]其中,
H
L
是一个
L
层的主干网络的熵,
r
L+1
是主干网络最后一层的输出尺寸,
c
L+1
是主干网络最后一层的通道数,
c
i
是第
i
层的输入通道数,
k
i
是第
i
层的卷积核大小,
q
i
是第
i
层的分组数

[0025]结合第一方面,进一步的,所述特征金字塔中,采用级联感受野模块代替现有特征金字塔中的上
/
下采样层,所述级联感受野模块通过以下方法构建:
[0026]将3个具有3×3感受野的
Spatial

Channel
卷积块级联起来以获得3×
3、5
×5和7×7三种不同的感受野,得到所述级联感受野;
[0027]每个所述
Spatial

Channel
卷积块内部使用一个3×3卷积和1×1卷积来分别学习空间信息和通道信息

[0028]结合第一方面,进一步的,所述检测头中设有无锚框范式的解耦头结构,所述解耦头结构用于根据所述特征金字塔的输出产生检测结果,所述解耦头结构包括多个分支,所述解耦头结构的每个分支由两个3×3卷积和一个1×1卷积组成

[0029]结合第一方面,进一步的,所述目标检测网络的训练过程中,采用
Cross Entropy Loss
交叉熵损失作为分类损失,采用
Wise

IoU Loss

Distribution Focal Loss
作为预测框损失,训练过程的总损失为:
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种用于无人机的车辆检测方法,其特征在于,包括:获取无人机拍摄的图像;将所述图像输入到训练好的目标检测网络中,得到检测结果
。2.
根据权利要求1所述的用于无人机的车辆检测方法,其特征在于,所述目标检测网络包括主干网络

特征金字塔和检测头;所述主干网络用于从输入的图像中提取特征表示;所述特征金字塔用于融合所述主干网络输出的特征表示中的浅层纹理特征和深层语义信息;所述检测头用于根据所述特征金字塔的输出产生检测结果
。3.
根据权利要求1所述的用于无人机的车辆检测方法,其特征在于,所述主干网络的结构通过基于最大熵理论的零样本
NAS
方法确定
。4.
根据权利要求1所述的用于无人机的车辆检测方法,其特征在于,所述主干网络的结构通过基于最大熵理论的零样本
NAS
方法确定,包括:使用以下公式搜索出一个
L

、M
级的卷积神经网络作为主干网络:
s.t.Latency≤budgets.t.Latency≤budgetw1≤w2≤

≤w
L
其中,
s
i
是主干网络第
i
级的预定义残差块优化参数,
i
是主干网络的级数,
α
i

H
i
的权重超参数,
H
i
是主干网络第
i
级所包含的熵,
β

Q
的权重超参数,
Q
是每一级通道数方差的期望,
Latency
是主干网络实际运行时的延迟,
budget
是主干网络时延预算,
w
i
是主干网络第
i
层的宽度,
w1,w2,

,w
L
表示主干网络第1层到第
L
层的宽度,
ρ
是设置好的超参数,表示定义为,
Var
是方差运算符号,
d1,d2,

,d
M
表示主干网络第1级到第
M
级的通道数
。5.
根据权利要求4所述的用于无人机的车辆检测方法,其特征在于,所述主干网络的熵为:其中,
H
L
是一个
L
层的主干网络的熵,
r
L+1
是主干网络最后一层的输出尺寸,
c
L+1
是主干网络最后一层的通道数,
c
i
是第
i
层的输入...

【专利技术属性】
技术研发人员:孙伟刘轩诚张小瑞赵宇煌
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1