当前位置: 首页 > 专利查询>同济大学专利>正文

一种基于像素和通道注意力的检测空中小型无人机的方法技术

技术编号:38904974 阅读:23 留言:0更新日期:2023-09-22 14:23
本发明专利技术提供一种基于像素和通道注意力的检测空中小型无人机的方法,属于图像检测领域,用于监控空中小型无人机。该方法包含如下步骤:待检测的高分辨率无人机图像分割为9块带有重叠的图像块,将分割后的图像输入到调整后的ResNet特征提取网络模块中,得到图像的抽象后的特征。之后特征经过特征金字塔池化操作得到不同大小的图像特征,图像特征输入到注意力机制模块网络中,使用标注的Ground Truth和最终网络输出来计算训练损失,之后依次更新网络权重,完成网络训练。小型无人机具有尺寸小、形状多变和易被遮挡等特点,而本发明专利技术提出的方法不同于常规的图像检测方法,其能够有效地从复杂的背景中检测到目标无人机。复杂的背景中检测到目标无人机。复杂的背景中检测到目标无人机。

【技术实现步骤摘要】
一种基于像素和通道注意力的检测空中小型无人机的方法


[0001]本专利技术属于图像目标检测
,尤其涉及一种基于像素和通道注意力的检测空中小型无人机的方法。

技术介绍

[0002]无人机目前正处于快速发展和应用阶段,在生活、生产应用中能看到无人机发挥了很好的作用,例如农业、空中摄影、监控和军事应用等。从预防无人机军事攻击、无人机碰撞等情况来说,研究图像、视频中的无人机检测以及进一步跟踪的技术是非常有必要的。
[0003]在图像检测领域,由于图像中存在的镜头移动、视角改变、遮挡等情况,更关键的是无人机的尺寸小,在图像中的像素占比也很小,因此无人机图像检测是十分具有挑战性的。尽管视频检测在计算机算法研究领域是一个十分热门的研究问题,但对无人机图像检测领域的探索还是比较不足的。

技术实现思路

[0004]本专利技术的目的在于提供一种基于像素和通道注意力的检测空中小型无人机的方法,其特征在于,包括如下步骤:
[0005]S1:将待检测的高分辨率图像分割为合理的子图像块数量,并根据图像中无人机的大小设置合理的重叠像素值;
[0006]S2:将分割后的多个子图像块输入值经过调整后的Resent50特征提取网络内,并经过特征金字塔池化操作得到不同大小的多个图像特征;
[0007]S3:将多个不同大小的图像特征输入至注意力机制模块网络内;
[0008]S4:基于注意力机制模块的输出结果完成神经网络训练和检测。
[0009]进一步地,S1中,选用公开的无人机数据集作为神经网络训练集,待检测的高分辨率图像通过神经网络训练集中的视频采集得到,采集的频率为:每五帧取一帧。
[0010]进一步地,S1中,将待检测的高分辨率图像分割为9块带有重叠的子图像块,9块带有重叠的子图像块中,重叠区域的重叠像素值为20像素。
[0011]进一步地,S2中,通过设置Resent50特征提取网络和特征金字塔为4层特征提取,实现保留更多的图像的特征,具体为:针对每个子图像块,通过Resent50的四个特征输出块的特征进行拼接,再通过1*1的卷积核将拼接后的4个特征输出块还原至原始大小,然后经过特征金字塔进行拼接和还原,得到最终的不同大小的多个图像特征。
[0012]进一步地,S3中,注意力机制网络包括通道注意力机制模块和像素注意力机制模块,通道注意力机制模块用于给图像特征部分通道赋予更大的权重,通过卷积特征图的多维通道向量实现;
[0013]像素注意力机制模块表现为:对于目标无人机出现的位置增加权重,对于没有无人机出现的位置减少权重。
[0014]进一步地,S4中,针对每个子图像块,将注意力机制模块的输出通过MLP输出即为
每个子图像块的检测结果,而将原图像的多个子图像块的检测结果进行合并,即完成一次完整的检测过程。
[0015]进一步地,S4中,检测结果为每个子图像块的分界框和相应的分类置信度,将检测结果与地面实况相比,通过focal loss和Distance

IOU loss计算得到本次网络迭代的loss,依据loss最小化原则进行梯度的反向传播,并更新网络参数,实现完整的一次神经网络训练过程。
[0016]与现有技术相比,本专利技术的有益效果主要体现在:本专利技术提出的像素和通道注意力机制的检测空中小型无人机的方法能够有效地避免存在的在图像质量不佳的情况下难以检测小目标的问题,本专利技术方法具有一定的实用性。
附图说明
[0017]图1为本专利技术中的检测空中小型无人机的方法流程示意图;
[0018]图2为本专利技术中像素和注意力机制模块神经网络结构示意图。
具体实施方式
[0019]下面将结合示意图对本专利技术一种基于像素和通道注意力的检测空中小型无人机的方法进行更详细的描述,其中表示了本专利技术的优选实施例,应该理解本领域技术人员可以修改在此描述的本专利技术,而仍然实现本专利技术的有利效果,因此,下列描述应当被理解为对于本领域技术人员的广泛知道,而并不作为对本专利技术的限制。
[0020]如图1所示,一种基于像素和通道注意力的检测空中小型无人机的方法主要步骤包括:
[0021]步骤1:选用公开的无人机数据集NpsDrone作为神经网络训练集,其视频像素为1920*1080,先从视频中采样出图像,频率为每5帧取1帧。将采样出的图像均分为9份图像块,重叠区域为20像素。
[0022]步骤2:将分割后的图像输入到调整后的Resnet50特征提取网络模块中,再经过特征金字塔池化操作得到不同大小的图像特征。
[0023]对于步骤2中的调整后的Resnet50特征提取网络和特征金字塔网络,与FPN+PAN的特征提取网络相似,由于步骤3中使用了通道和像素注意力的方法。为了在特征提取过程中尽可能地保有局部信息,在本实施例中使用的是4层特征提取。将Resnet50的四个特征输出块的特征拼接在一起,最后通过1*1的卷积核将特征还原到原始大小。再经过特征金字塔对特征进行拼接和还原,得到了最终的图像特征。
[0024]由于特征提取是对图像进行逐步抽象的过程,在特征提取过程尽可能地保留图像的局部信息,对于无人机这样的小目标检测具有十分明显的提升作用。为了在特征提取过程中尽可能地保有局部信息,将Resnet50的四个特征输出块的特征拼接在一起,最后通过1*1的卷积核将特征还原到原始大小。再经过特征金字塔对特征进行拼接和还原,得到了最终的图像特征。
[0025]步骤3:将步骤3中的图像特征输入到注意力机制模块网络中。
[0026]对于步骤3中使用的通道注意力和像素注意力机制模块,使用通道注意力机制来给图像特征某些通道赋予更加大的权重,此方法通过卷积特征图的多维通道向量来实现。
像素注意力机制表现为,赋予目标无人机出现的位置更大的权重,而没有无人机出现的位置则反之。该模块具体结构如图2所示。
[0027]步骤4:网络训练阶段,使用标注的GroundTruth和最终网络输出来计算训练损失,之后依次更新网络权重;如果是检测阶段,则直接输出无人机检测结果。
[0028]对于步骤4中的神经网络训练过程或检测过程,有如下执行细节。在训练过程中,将注意力模块的输出经过MLP输出检测结果,即边界框(bounding box)和相应的分类置信度,通过与地面实况(ground truth)比较计算本次网络迭代的loss(loss计算为focal loss和Distance

IOU loss加权求和)。得到loss后,通过梯度反向传播,更新网络参数,完成一次神经网络的迭代。而在检测过程中,MLP的输出结果bounding box和分类置信度即对子图像的检测结果。之后将属于原图像的9张子图像的检测结果合并,完成一次完整的检测过程。
[0029]上述仅为本专利技术的优选实施例而已,并不对本专利技术起到任何限制作用。任何所属
的技术人员,在不脱离本专利技术的技术方案的范围内,对本专利技术揭露的技术方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于像素和通道注意力的检测空中小型无人机的方法,其特征在于,包括如下步骤:S1:将待检测的高分辨率图像分割为合理的子图像块数量,并根据图像中无人机的大小设置合理的重叠像素值;S2:将分割后的多个子图像块输入值经过调整后的Resent50特征提取网络内,并经过特征金字塔池化操作得到不同大小的多个图像特征;S3:将多个不同大小的图像特征输入至注意力机制模块网络内;S4:基于所述注意力机制模块的输出结果完成神经网络训练和检测。2.根据权利要求1所述的基于像素和通道注意力的检测空中小型无人机的方法,其特征在于,所述S1中,选用公开的无人机数据集作为神经网络训练集,所述待检测的高分辨率图像通过所述神经网络训练集中的视频采集得到,采集的频率为:每五帧取一帧。3.根据权利要求1所述的基于像素和通道注意力的检测空中小型无人机的方法,其特征在于,所述S1中,将待检测的高分辨率图像分割为9块带有重叠的子图像块,9块带有重叠的子图像块中,重叠区域的重叠像素值为20像素。4.根据权利要求1所述的基于像素和通道注意力的检测空中小型无人机的方法,其特征在于,所述S2中,通过设置Resent50特征提取网络和特征金字塔为4层特征提取,实现保留更多的图像的特征,具体为:针对每个子图像块,通过Resent50的四个特征输出块的特征进行拼接...

【专利技术属性】
技术研发人员:尤鸣宇熊攀周洪钧
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1