一种基于改进YOLOv5s网络的防鸟撞事故目标检测方法技术

技术编号:34947200 阅读:38 留言:0更新日期:2022-09-17 12:23
本发明专利技术公开了一种基于改进YOLOv5s网络的防鸟撞事故目标检测方法,首先引入通道注意力机制SE模块,并选择SE后置的YOLOv5s_SEA嵌入方式作为改进Backbone方案,然后在Head中引入混合域注意力机制CBAM模块,并选用先通过通道域再通过空间域的YOLOv5s_CBAMA方案作为改进方案;接着在Head的输出端加入解耦头,改进后使用IOU损失函数训练reg分支,BCE损失函数训练cls分支;同时在Head的输出端引入趋势感知损失TAL和趋势因子w

【技术实现步骤摘要】
一种基于改进YOLOv5s网络的防鸟撞事故目标检测方法


[0001]本专利技术涉及目标检测
,主要涉及一种基于改进YOLOv5s网络的防鸟撞事故目标检测方法。

技术介绍

[0002]近年来,民用客机存在风险渐渐成为了各国学者的研究新热点,其中鸟撞事故是近年来对民用客机威胁较大的事故之一。在飞机场等场景下,提前利用超声波来驱走鸟类是防止鸟撞事故发生的基础。目标检测是计算机视觉领域中一个重要而热门的话题。随着深度卷积神经网络在目标检测领域上获得了重大突破,利用红外监控拍摄多个飞机场场景,利用监控视频获取鸟类和飞机的飞行途径,具有实际研究意义和场景应用价值。

技术实现思路

[0003]专利技术目的:本专利技术提供了一种基于改进YOLOv5s网络的防鸟撞事故目标检测方法,帮助网络检测图像小目标及解决延迟带来的问题。以红外监控视频为研究对象,以鸟类和飞机的飞行流量为研究任务,通过初步设计、优化改进、整合功能三步实现提前预防鸟撞事故的目的。
[0004]技术方案:为实现上述目的,本专利技术采用的技术方案为:
[0005]一种基于改进YOLOv5s网络的防鸟撞事故目标检测方法,包括以下步骤:
[0006]步骤S1、对红外监控视频进行python切片处理,然后进行数据清洗,并对不同类型的图片进行labelImg标注;选取YOLOv5s网络结构进行初始模型训练;
[0007]步骤S2、将通道注意力机制SE模块分别引入YOLOv5s网络中Backbone、Neck和Head三大模块特征融合区域;选用SE后置的YOLOv5s_SEA嵌入方式作为改进Backbone方案;
[0008]步骤S3、在Head中引入混合域注意力机制CBAM模块,并选用先通过通道域再通过空间域的YOLOv5s_CBAMA方案作为改进方案;
[0009]步骤S4、在Head的输出端加入解耦头,改进后使用IOU损失函数训练reg分支,BCE损失函数训练cls分支;
[0010]步骤S5、在Head的输出端引入趋势感知损失TAL和趋势因子w
i
,根据每个物体的移动趋势生成自适应权重,解决预测框的漂移问题;
[0011]步骤S6、将YOLOv5s训练权重best.pt文件部署在Jetson Nano上,并对实际的飞机场应用场景进行识别与检测,以及测试使用嵌入式设备Jetson Nano的运行效果,使该系统可以在其他场合使用。
[0012]进一步地,所述步骤S2中进入SE模块具体操作步骤包括:
[0013]步骤S2.1、普通卷积操作:
[0014]U
c
=F
tr
(X
i
)
[0015]其中,F
tr
表示为Transformation各个网络模型原有的卷积操作;
[0016]步骤S2.2、在各个通道上的空间维度上进行Squeeze压缩过程;采用全局平均池
化,将信息压缩到相应的通道中,从而扩展全局的感受野,得到1个统计量,此时1个统计量表示一个通道,最终将维度H
×
W
×
C的特征图压成一个1
×1×
C的向量,变换公式如下所示:
[0017][0018]其中,F
sq
表示为Squeeze压缩;H表示为Height;W表示为Width;X
i
表示为输入;X
C
表示为输出;
[0019]步骤S2.3、将得到的特征信息经过两个全连接层,通过w来生成相对应的通道权重,进行Excitation激活过程,通过δ激活函数Relu,然后经过σ激活函数sigmoid,最终得到权重值,变换公式如下所示:
[0020]S=F
ex
(z,W)=σ(g(z,W))=σ(W2δ(W1z))
[0021]其中,F
ex
表示为激活过程;
[0022]步骤S2.4、利用上一步得到的权重值,进行Scale标准化步骤;将得到的权重采用乘法加权的方式分配到每个通道中,完成在通道维度上的重标定,得到新的特征图;变换公式如下
[0023][0024]其中,F
scale
表示为Scale标准化。
[0025]进一步地,所述步骤S3中CBAM模块包括通道注意力和空间注意力两个模块,通过通道注意力模块,将输入网络的特征图分别从宽高进行全局最大池化过程和全局平均池化过程,然后再通过两层神经网络,最后进行sigmoid激活,得到通道注意力特征M
c
;具体如下:
[0026][0027]其中,AvgPool表示为全局平均池化;MaxPool表示为全局最大池化;σ表示为sigmoid激活函数;M0为R
C/r
×
C
;r为降维因子且r=16;M1为R
C
×
C/r
;Mc表示通道注意力特征;
[0028]将输出M
c
作为空间注意力模块的输入,进行池化操作,然后通过一个7
×
7卷积过程,最后通过sigmoid激活函数生成空间注意力特征,即M
s
,具体表示如下:
[0029][0030]其中,f7×7表示为7
×
7卷积;M
c
表示空间注意力特征。
[0031]进一步地,所述步骤S5中引入趋势感知损失TAL和趋势因子w
i
的具体方法如下:
[0032]步骤S5.1、将YOLOv5s网络作为Baseline,构造成一个三元组的GT框进行训练,即使用上一帧F
t
‑1、当前帧F
t
和下一帧G
t+1
,即(F
t
‑1,F
t
,G
t+1
);取两个相邻的帧(F
t
‑1,F
t
)作为输入训练模型,预测下一帧的GT框;由F
t
帧的真实GT框监督G
t+1
的GT框,基于输入和监督的三元组,将训练数据集重建为的形式;
[0033]步骤S5.2、通过计算两帧GT之间的IoU矩阵,对帧的维度求最大值,得到两帧之间
检测对象的匹配IoU;匹配的IoU值大小与物体移动速度成反比;当有新对象出现在帧中时,没有与之匹配的框,此时设置阈值τ,具体计算公式如下所示:
[0034][0035][0036]其中,max
j
表示为F
t
中方框间的最大操作值t,v表示为新对象的恒定权重;w
i
通过调节τ和v两个参数,缓解了时延问题。
[0037]有益效果:
[0038]本专利技术在YOLOv5s的网络基础上,在Backbone中引入了通道域注意力机制SE模块,并进行了实验确定了后置YOLOv5s_S本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv5s网络的防鸟撞事故目标检测方法,其特征在于,包括以下步骤:步骤S1、对红外监控视频进行python切片处理,然后进行数据清洗,并对不同类型的图片进行labelImg标注;选取YOLOv5s网络结构进行初始模型训练;步骤S2、将通道注意力机制SE模块分别引入YOLOv5s网络中Backbone、Neck和Head三大模块特征融合区域;选用SE后置的YOLOv5s_SEA嵌入方式作为改进Backbone方案;步骤S3、在Head中引入混合域注意力机制CBAM模块,并选用先通过通道域再通过空间域的YOLOv5s_CBAMA方案作为改进方案;步骤S4、在Head的输出端加入解耦头,改进后使用IOU损失函数训练reg分支,BCE损失函数训练cls分支;步骤S5、在Head的输出端引入趋势感知损失TAL和趋势因子w
i
,根据每个物体的移动趋势生成自适应权重,解决预测框的漂移问题;步骤S6、将YOLOv5s训练权重best.pt文件部署在Jetson Nano上,并对实际的飞机场应用场景进行识别与检测,以及测试使用嵌入式设备Jetson Nano的运行效果,使该系统可以在其他场合使用。2.根据权利要求1所述的一种基于改进YOLOv5s网络的防鸟撞事故目标检测方法,其特征在于,所述步骤S2中进入SE模块具体操作步骤包括:步骤S2.1、普通卷积操作:U
c
=F
tr
(X
i
)其中,F
tr
表示为Transformation各个网络模型原有的卷积操作;步骤S2.2、在各个通道上的空间维度上进行Squeeze压缩过程;采用全局平均池化,将信息压缩到相应的通道中,从而扩展全局的感受野,得到1个统计量,此时1个统计量表示一个通道,最终将维度H
×
W
×
C的特征图压成一个1
×1×
C的向量,变换公式如下所示:其中,F
sq
表示为Squeeze压缩;H表示为Height;W表示为Width;X
i
表示为输入;X
C
表示为输出;步骤S2.3、将得到的特征信息经过两个全连接层,通过w来生成相对应的通道权重,进行Excitation激活过程,通过δ激活函数Relu,然后经过σ激活函数sigmoid,最终得到权重值,变换公式如下所示:S=F
ex
(z,W)=σ(g(z,W))=σ(W2δ(W1z))其中,F
ex
表示为激活过程;步骤S2.4、利用上一步得到的权重值,进行Scale标准化步骤;将得到的权重采用乘法加权的方式分配到每个通道中,完成在通道维度上的...

【专利技术属性】
技术研发人员:郁佳佳李玄锋
申请(专利权)人:东南大学成贤学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1