一种基于改进YOLOX算法的无人机检测方法技术

技术编号:38243674 阅读:9 留言:0更新日期:2023-07-25 18:05
本发明专利技术公开了一种基于改进YOLOX算法的无人机检测方法,其特征在于,包括:将待检测图像输入改进的YOLOX网络,以确定待检测图像中是否存在无人机;Backbone将待检测图像转化为三层不同尺度的特征图,并将三个不同尺度的特征图分别送入坐标注意力机制模块中的三个坐标注意力机制中,坐标注意力机制模块使YOLOX网络通过自适应的方式挖掘像素之间的依赖关系,输出三个经过坐标注意力机制加权后的特征图;具有双向特征金字塔的Neck双向交叉链接加权后的特征图中不同尺度的特征和加权特征融合;本发明专利技术提高了网络对不同尺寸特征图之间的交互能力,提升网络局部和全局的检测能力。提升网络局部和全局的检测能力。提升网络局部和全局的检测能力。

【技术实现步骤摘要】
一种基于改进YOLOX算法的无人机检测方法


[0001]本专利技术涉及目标检测
,特别是一种基于改进YOLOX算法的无人机检测方法。

技术介绍

[0002]近些年,无人机领域的相关技术在及其自动化浪潮下蓬勃发展,不断创新,使得无人机能够胜任越来越多、越来越复杂的任务。如今,在民用领域,无人机在提高人民生活效率上表现出巨大的能力,它能够高效地完成土壤播种、畜牧检测、桥梁隧道检测等任务;在航空测绘领域,无人机可以帮助进行国土资源测绘和城市土地资源测绘,从而实现自然资源调查和土地确权管理;在国防军事领域,无人机在边界巡检、空中侦察、训练靶机等军事任务中表现出成本低、效率高的优势,在空中打击等危险任务中避免了人员伤亡的风险;在物流运输领域,无人机在空中的运行路径近乎直线且几乎无视地形限制,没有传统物流的运输路线局限性,将极大减少地面交通压力。可见无人机在未来可以应用到的场景是十分广泛的。在无人机作业的过程中,对其精确的检测可以辅助其完成更加复杂的任务。
[0003]现有的YOLOX检测算法缺乏注意力机制,无法有效的联系上下文信息,检测的过程中对图像的各个部分都有相同的注意力,导致检测效果不足。同时,YOLOX的特征金字塔依然采用YOLOv3的特征金字塔,无法较好的融合不同尺度的特征图,导致其在检测小目标的情况下效果不佳。

技术实现思路

[0004]鉴于此,本专利技术提供一种基于改进YOLOX算法的无人机检测方法,以解决上述技术问题。
[0005]本专利技术公开了一种基于改进YOLOX算法的无人机检测方法,其包括以下步骤:
[0006]将待检测图像输入改进的YOLOX网络,以确定待检测图像中是否存在无人机;
[0007]改进的YOLOX网络包括依次连接的Backbone、坐标注意力机制模块、具有双向特征金字塔的Neck、Head;
[0008]Backbone将待检测图像转化为三层不同尺度的特征图,并将三个不同尺度的特征图分别送入坐标注意力机制模块中的三个坐标注意力机制中,坐标注意力机制模块使YOLOX网络通过自适应的方式挖掘像素之间的依赖关系,输出三个经过坐标注意力机制加权后的特征图;
[0009]具有双向特征金字塔的Neck双向交叉链接加权后的特征图中不同尺度的特征和加权特征融合;
[0010]Head将具有双向特征金字塔的Neck处理后的特征图进行目标判别和分类,最终输出检测结果;若待检测图像中存在无人机,则所述检测结果包括无人机的位置、类别以及置信度。
[0011]进一步地,在任一坐标注意力机制中,首先分别使用尺寸为(H,1)和(1,W)的卷积
核沿着水平坐标和垂直坐标对每一个通道进行平均池化,得到高度为h的c通道输出和宽度为w的c通道输出;
[0012]把高度为h的c通道输出和宽度为w的c通道输出进行卷积和联结操作,得到联合特征图;
[0013]然后对联合特征图进行切分,生成一对方向感知和位置敏感的特征图;
[0014]对一对方向感知和位置敏感的特征图进行扩展,作为最终的注意力权重大小,最终加权后的特征图。
[0015]进一步地,所述高度为h的c通道输出表示为:
[0016][0017]同理,宽度为w的c通道输出表示为:
[0018][0019]其中,W和H为输入特征图的宽和高,x
c
(h,i)为输入特征图在(h,i)位置的值,x
c
(j,w)为输入特征图在(j,w)位置的值,为一对水平和垂直方向感知的特征图;
[0020]联合特征图的计算公式如下:
[0021][0022]其中,F为1x1卷积,cat为联结操作,f为联合特征图;
[0023]一对方向感知和位置敏感的特征图的计算公式如下:
[0024]g
h
=F(f
h
)
[0025]g
w
=F(f
w
)
[0026]最后,对g
h
和g
w
进行拓展,作为最终的注意力权重大小,最终的输出表达式如下:
[0027][0028]其中,y
c
(i,j)为加权后的特征图,x
c
(i,j)为输入图像数据(i,j)位置的像素,为方向敏感特征图,为位置敏感特征图。
[0029]进一步地,所述双向特征金字塔在原始YOLOX特征金字塔网络的基础上,删除只有一条输入边的节点。
[0030]进一步地,在原始YOLOX特征金字塔的中间层的输入节点和输出节点之间的添加一条额外的边。
[0031]进一步地,所述双向特征金字网络在不同尺度的特征间添加横向连接,并引入了加权策略,使得网络在学习的过程中不断调整权重来确定不同尺度特征的重要性,最终输出的特征图结合了当前层与上下两层的特征。
[0032]进一步地,所述双向特征金字塔的三个输入节点的输入为坐标注意力机制输出的三个不同大小的特征图,分别记为所述双向特征金字塔中与
一一对应的输出分别为
[0033][0034][0035][0036]其中,ω1至ω9分别是双向特征金字塔中每个节点的特征图融合时的权重,Conv代表卷积操作,Resiz代表上采样或下采样操作。
[0037]进一步地,若输入节点p4与其位于同一层的输出节点之前增加另外一个节点,该另外一个节点的输出为:
[0038][0039]其中,为该另外一个节点的输出。
[0040]由于采用了上述技术方案,本专利技术具有如下的优点:
[0041]本专利技术提高了网络对不同尺寸特征图之间的交互能力,提升网络局部和全局的检测能力。
附图说明
[0042]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
[0043]图1为传统目标检测算法流程示意图;
[0044]图2为现有技术中卷积神经网络YOLOX原始网络结构示意图;
[0045]图3为本专利技术实施例的坐标注意力机制结构示意图;
[0046]图4为本专利技术实施例的BiFPN结构示意图;
[0047]图5为本专利技术实施例的改进BiFPN结构示意图;
[0048]图6为本专利技术实施例的改进YOLOX网络结构示意图。
具体实施方式
[0049]结合附图和实施例对本专利技术作进一步说明,显然,所描述的实施例仅是本专利技术实施例一部分实施例,而不是全部的实施例。本领域普通技术人员所获得的所有其他实施例,都应当属于本专利技术实施例保护的范围。
[0050]如图1所示,传统的目标检测算法在生成候选框特征提取部分采用了没有方向性的传统方法,导致算法时间复杂度较高,窗口冗余度增加,而且由于特征算子都是人工设计,不适应目标特征多样性的变本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOX算法的无人机检测方法,其特征在于,包括以下步骤:将待检测图像输入改进的YOLOX网络,以确定待检测图像中是否存在无人机;改进的YOLOX网络包括依次连接的Backbone、坐标注意力机制模块、具有双向特征金字塔的Neck、Head;Backbone将待检测图像转化为三层不同尺度的特征图,并将三个不同尺度的特征图分别送入坐标注意力机制模块中的三个坐标注意力机制中,坐标注意力机制模块使YOLOX网络通过自适应的方式挖掘像素之间的依赖关系,输出三个经过坐标注意力机制加权后的特征图;具有双向特征金字塔的Neck双向交叉链接加权后的特征图中不同尺度的特征和加权特征融合;Head将具有双向特征金字塔的Neck处理后的特征图进行目标判别和分类,最终输出检测结果;若待检测图像中存在无人机,则所述检测结果包括无人机的位置、类别以及置信度。2.根据权利要求1所述的方法,其特征在于,在任一坐标注意力机制中,首先分别使用尺寸为(H,1)和(1,W)的卷积核沿着水平坐标和垂直坐标对每一个通道进行平均池化,得到高度为h的c通道输出和宽度为w的c通道输出;把高度为h的c通道输出和宽度为w的c通道输出进行卷积和联结操作,得到联合特征图;然后对联合特征图进行切分,生成一对方向感知和位置敏感的特征图;对一对方向感知和位置敏感的特征图进行扩展,作为最终的注意力权重大小,最终加权后的特征图。3.根据权利要求2所述的方法,其特征在于,所述高度为h的c通道输出表示为:同理,宽度为w的c通道输出表示为:其中,W和H为输入特征图的宽和高,x
c
(h,i)为输入特征图在(h,i)位置的值,x
c
(j,w)为输入特征图在(j,w)位置的值,为一对水平和垂直方向感知的特征图;联合特征图的计算公式如下:其中,F...

【专利技术属性】
技术研发人员:宋锐刘子凡李娇娇于鸿博吴承搏苏烈超周智毅
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1