一种复杂背景下无人机运动目标检测方法技术

技术编号:37291772 阅读:23 留言:0更新日期:2023-04-21 03:22
本发明专利技术涉及运动目标检测技术领域,具体涉及一种复杂背景下无人机运动目标检测方法,通过将空间注意模块和通道注意模块结合,再改变空间注意模块和通道注意模块之间的连接结构,提出了一种改进的SCAM注意力机制模块,并将该结构插入YOLOv5的网络模型中,来提高模型对特征图中运动目标与背景聚焦区域的注意,同时将原始YOLOv5的Neck网络中将自底向上特征金字塔改为自适应空间特征融合的方法;强化原模型在复杂场景下的特征提取能力和特征融合效率,从而提高复杂背景干扰下目标的检测精度,最后使用训练后的检测模型进行检测,实现复杂背景干扰下的无人机目标检测。干扰下的无人机目标检测。干扰下的无人机目标检测。

【技术实现步骤摘要】
一种复杂背景下无人机运动目标检测方法


[0001]本专利技术涉及运动目标检测
,具体涉及一种复杂背景下无人机运动目标检测方法。

技术介绍

[0002]各种商用和民用无人机的大量涌现,给人类带来便捷的同时,也出现了许多安全问题,需要对无人机进行管理控制,因此无人机目标检测技术逐渐成为研究的热点。
[0003]随着计算机和人工智能技术的快速发展,利用计算机实现人类的视觉功能成为目前计算机领域中最热门的课题之一。计算机视觉研究的一个重要方面就是运动目标的检测,它在智能视频监控、人机交互、虚拟现实、机器人导航、交通检测等许多领域有着广泛的应用。
[0004]但由于受户外复杂背景环境的影响,目标无人机往往与目标周围的背景存在相似性的特点(颜色、纹理、角点、边)等,这通常会导致目标特征表达不准确,检测不到目标物体或检测困难等问题。

技术实现思路

[0005]本专利技术的目的在于提供一种复杂背景下无人机运动目标检测方法,旨在解决现有的无人机运动目标检测方法在复杂背景下无人机目标特征表达不准确,难以检测问题技术问题。
[0006]为实现上述目的,本专利技术提供了一种复杂背景下无人机运动目标检测方法,包括下列步骤:
[0007]获取图像数据集并进行标注,得到带标注的数据集;
[0008]基于YOLOv5模型改进,在Backbone骨干网络中增加改进的SCAM注意力机制模块;
[0009]在Neck网络中将自底向上特征金字塔改为自适应空间特征融合的方法;
[0010]获得改进后的YOLOv5模型;
[0011]将所述带标注的数据集送入改进后的YOLOv5模型进行训练,获得检测模型;
[0012]将待测复杂背景无人机视频输入至所述检测模型进行检测,得到检测结果。
[0013]其中,所述改进的SCAM注意力机制模块通过结合空间注意模块和通道注意模块并改变所述空间注意模块和所述通道注意模块之间的连接结构后获得。
[0014]其中,所述通道注意模块使用平均池化来聚合空间信息,使用最大池化来在特征图F的空间维数上收集更详细的目标特征,输入大小为C
×
H
×
W。
[0015]其中,所述空间注意模块关注特征的位置信息,重点关注特征图中特征更有效的区域。
[0016]其中,所述改进的SCAM注意力机制模块的关键思想是从输入特征图Y中分别得到沿空间和通道的注意权值矩阵Z
c
和Z
s
,从而对输入特征图中的区域特征赋值。
[0017]其中,在Neck网络中将自底向上特征金字塔改为自适应空间特征融合的方法,具
体为在Neck网络部分引入自适应空间特征融合模块,采用FPN结合PAN结构的多尺度特征融合方法。
[0018]其中,所述自适应空间特征融合模块利用空间过滤冲突信息以抑制不一致的方法,从而提高了特征的尺度不变性。
[0019]本专利技术提供了一种复杂背景下无人机运动目标检测方法,通过将空间注意模块和通道注意模块结合,再改变空间注意模块和通道注意模块之间的连接结构,提出了一种改进的SCAM注意力机制模块,并将该结构插入YOLOv5的网络模型中,来提高模型对特征图中运动目标与背景聚焦区域的注意,同时将原始YOLOv5的Neck网络中将自底向上特征金字塔改为自适应空间特征融合的方法;强化原模型在复杂场景下的特征提取能力和特征融合效率,从而提高复杂背景干扰下目标的检测精度,最后使用训练后的检测模型进行检测,实现复杂背景干扰下的无人机目标检测。
附图说明
[0020]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1是本专利技术的一种复杂背景下无人机运动目标检测方法的流程示意图。
[0022]图2是本专利技术的一种复杂背景下无人机运动目标检测方法的SCAM模块结构示意图。
[0023]图3是本专利技术的一种复杂背景下无人机运动目标检测方法的自适应特征融合模块的结构示意图。
[0024]图4是本专利技术的具体实施例的整个复杂背景下无人机检测过程示意图。
[0025]图5是本专利技术的具体实施例的数据集图片实例。
[0026]图6是本专利技术的具体实施例的图像标注实例。
具体实施方式
[0027]下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。
[0028]请参阅图1,本专利技术提供了一种复杂背景下无人机运动目标检测方法,包括下列步骤:
[0029]S1:获取图像数据集并进行标注,得到带标注的数据集;
[0030]S2:基于YOLOv5模型改进,在Backbone骨干网络中增加改进的SCAM注意力机制模块;
[0031]S3:在Neck网络中将自底向上特征金字塔改为自适应空间特征融合的方法;
[0032]S4:获得改进后的YOLOv5模型;
[0033]S5:将所述带标注的数据集送入改进后的YOLOv5模型进行训练,获得检测模型;
[0034]S6:将待测复杂背景无人机视频输入至所述检测模型进行检测,得到检测结果。
[0035]以下结合实施步骤,通过对相应术语的解释对本专利技术作进一步说明(为方便描述,部分术语会混用英文简写):
[0036](一)SCAM空间通道注意模块;
[0037]具体请参阅图2,通道注意模块(CAM)使用平均池化(AvgPool)来聚合空间信息,使用最大池化(MaxPool)来在特征图F的空间维数上收集更详细的目标特征,输入大小为C
×
H
×
W。同时使用这两种池化操作可以减少特征图的大小和计算量,提高网络的表达能力。合并后的两个一维向量被发送到整个连接层进行操作。这里使用1x1的卷积核来实现特征向量之间的权值共享(MLP)。
[0038]最后,通过Sigmoid激活函数得到通道注意的输出结果Z
c

[0039][0040]空间注意模块(SAM)更加关注特征的位置信息,重点关注特征图中特征更有效的区域。利用平均池化(AvgPool)和最大池化(MaxPool)对信道维数上的特征图Y
c
进行压缩,得到两个1
×
H
×
W特征图,然后通过Concat操作对两个特征图进行拼接。为了保证最终特征在空间维数上与输入的Y
c
一致,对拼接后的特征图进行卷积,最后,通过Sigmoid激活函数得到空间注意的输出结果Z
s...

【技术保护点】

【技术特征摘要】
1.一种复杂背景下无人机运动目标检测方法,其特征在于,包括下列步骤:获取图像数据集并进行标注,得到带标注的数据集;基于YOLOv5模型改进,在Backbone骨干网络中增加改进的SCAM注意力机制模块;在Neck网络中将自底向上特征金字塔改为自适应空间特征融合的方法;获得改进后的YOLOv5模型;将所述带标注的数据集送入改进后的YOLOv5模型进行训练,获得检测模型;将待测复杂背景无人机视频输入至所述检测模型进行检测,得到检测结果。2.如权利要求1所述的复杂背景下无人机运动目标检测方法,其特征在于,所述改进的SCAM注意力机制模块通过结合空间注意模块和通道注意模块并改变所述空间注意模块和所述通道注意模块之间的连接结构后获得。3.如权利要求2所述的复杂背景下无人机运动目标检测方法,其特征在于,所述通道注意模块使用平均池化来聚合空间信息,使用最大池化来在特征图F的空间维数上收集更详细的目标特征,输入大小为C
×
...

【专利技术属性】
技术研发人员:马峻周雅倩
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1