一种基于注意力机制与多尺度融合的目标检测方法技术

技术编号:34467819 阅读:58 留言:0更新日期:2022-08-10 08:41
本发明专利技术公开了一种基于注意力机制与多尺度融合的目标检测方法,包括步骤Step1.改进YOLOv5s网络,得到算法模型PE

【技术实现步骤摘要】
一种基于注意力机制与多尺度融合的目标检测方法


[0001]本专利技术涉及目标检测
,具体涉及一种基于注意力机制与多尺度融合的目标检测方法。

技术介绍

[0002]桥式起重机是一种横架于车间、仓库和料场上空进行物料吊运的起重设备,具有不受地面设备影响的特点,广泛应用到各行各业,但其运行过程中存在一些安全问题,如发生小车倾覆或吊重碰撞等安全问题,造成人员伤亡和起重机设备的损坏,造成人身损失和经济损失;
[0003]在科技快速发展的今天,机械设备呈现出信息化、智能化的发展方向,使得机械工业设备面临更多挑战;为了提高产品竞争力,国内起重机制造企业也都纷纷对起重机设备进行升级改进;对于安全性、快速性及平稳运行有特殊要求的场所,智能化程度高的起重机更容易满足使用需求;智能化起重机可以在保证工作效率的同时,进行高精度重复动作,避免人工操作存在的随机性,减少操作人员;智能化起重机可以进行安全辅助功能,提高安全性,减少起重机事故带来的人员伤亡和财产损失;
[0004]桥式起重机工作环境较为复杂,进行转载时容易发生碰撞剐蹭等事故,影响了人员和装备安全,严重制约了吊重转载效率及装备保障水平;对桥式起重机工作环境安全进行监测,是避免事故产生的有效途径;动态目标检测算法是对吊装场景进行实时安全监控的有效方法;但由于传统目标检测算法在安全监控的过程中,不能满足光照频繁变化的复杂背景下的目标检测需求,导致其检测精度降低,严重影响桥式起重机工作过程中的安全性;
[0005]因此,亟需设计一种能能够进行多尺度特征融合的目标检测方法,来对实现复杂环境下的动态目标进行精确检测,以解决上述现有技术存在的问题。

技术实现思路

[0006]针对上述存在的问题,本专利技术旨在提供一种基于注意力机制与多尺度融合的目标检测方法,本方法通过对YOLOv5s的网络基础上进行改进,有效解决了复杂环境下的动态目标进行精确检测低的问题,具有检测速度快、精度高、鲁棒性和表达能力好的特点。
[0007]为了实现上述目的,本专利技术所采用的技术方案如下:
[0008]一种基于注意力机制与多尺度融合的目标检测方法,包括步骤
[0009]Step1.在起重机监控系统的YOLOv5s算法Neck网络中,引入PSConv特征重构模块和ECA注意力机制模块,对YOLOv5s网络进行改进,得到改进后的算法模型PE

YOLOv5s;
[0010]Step2.将传感器采集得到的数据集图像输入到算法模型PE

YOLOv5s内,进行特征提取,得到多尺度的特征图集;
[0011]Step3.将步骤Step2得到的多尺度的特征图进行特征重建融合;
[0012]Step4.将步骤Step3得到的重建后的特征利用ECA注意力机制模块进行基于注意
力机制的特征筛选;
[0013]Step5.对步骤Step4筛选后得到的特征进行分类和回归操作,得到基于注意力机制与多尺度融合的YOLOv5目标检测模型;
[0014]Step6.将测试数据带入基于注意力机制与多尺度融合的YOLOv5目标检测模型中,进行目标检测。
[0015]优选的,步骤Step1所述的PE

YOLOv5s算法包括输入端、基准网络、特征融合和预测部分;
[0016]所述输入端包含图像的预处理阶段,在输入端沿用YOLOv4的Mosaic数据增强,提升模型的训练速度和网络精度;
[0017]所述基准网络网络是检测网络的主干,用于提取出图像的高中低层的特征;
[0018]所述特征融合部分主要用于生成特征金字塔,增强模型对于不同缩放尺度对象的检测;
[0019]所述预测部分用于进行卷积,得到预测结果。
[0020]优选的,步骤Step1所述的PE

YOLOv5s算法还包括A框、B框、C框、D框、E框和F框;其中
[0021]A框是CBL结构,由Conv+Bn+Leaky_relu激活函数三者组成;
[0022]B框为Res unint模块,是由两个CBL模块组成的残差组件;
[0023]C框和D框是CSP1_X、CSP2_X的结构;
[0024]E框是SPP结构;
[0025]F框是Focus结构。
[0026]优选的,步骤Step2所述的特征提取过程为利用PSConv将扩张因子沿输入输出通道周期循环,提取图像中的不同尺度特征,得到多尺度的特征图集;
[0027]其中所述PSConv的卷积定义为:
[0028][0029]上式中,是由两个正交维度的通道膨胀率和滤子膨胀率组成的矩阵;表示输入特征,表示卷积核,表示输出特征。
[0030]优选的,步骤Step3所述的多尺度的特征图的融合的过程为利用PSConv通过按照通道对不同尺度卷积交替计算,通过将多尺度卷积融入一个计算过程中,完成对多尺度的特征图进行特征重建融合。
[0031]优选的,步骤Step4所述的特征筛选过程包括
[0032]Step401.考虑每个通道与其相邻通道的相互影响,通过矩阵W
k
学习通道注意力:
[0033][0034]在上式中,W
k
中有k
×
C参数,k为1D卷积的内核,C为通道维度;
[0035]Step402.由于ECA只考虑通道y
i
与其相邻通道的相互作用计算y
i
的权重,即:
[0036][0037]在上式中,为y
i
相邻通道的集合,σ为Sigmoid函数;
[0038]Step403.采用共享学习参数的方式降低计算中参数数量:
[0039][0040]Step404.取ECA模块的通道数为2,最终的映射关系和k的计算公式为:
[0041]C=Φ(k)=2

×
k

b)
[0042][0043]上式中,γ=2,b=1,|*ood表示最邻近奇数,C为通道维数。
[0044]优选的,步骤Step5所述的对步骤Step4得到的特征进行分类的具体过程包括
[0045]Step501.将步骤Step4得到的输入图像划分成N*N的网格,然后对网格的每个格子都预测矩形框、置信度、分类概率三个指标;
[0046]其中,矩形框表征目标的大小以及精确位置;置信度表征所预测矩形框的可信程度,取值范围0~1,值越大说明该矩形框中越可能存在目标;分类概率表征目标的类别;
[0047]Step502.首先判断每个预测框的预测置信度是否超过设定阈值,若超过则认为该预测框内存在目标,从而得到目标的大致位置;
[0048]Step503.接着根据非极大值抑制算法对存在目标的预测框进行筛选,剔除对应同一目标的重复矩形框;
[0049]Step504.最后根据筛选后预测框的分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制与多尺度融合的目标检测方法,其特征在于:包括步骤Step1.在起重机监控系统的YOLOv5s算法Neck网络中,引入PSConv特征重构模块和ECA注意力机制模块,对YOLOv5s网络进行改进,得到改进后的算法模型PE

YOLOv5s;Step2.将传感器采集得到的数据集图像输入到算法模型PE

YOLOv5s内,进行特征提取,得到多尺度的特征图集;Step3.将步骤Step2得到的多尺度的特征图进行特征重建融合;Step4.将步骤Step3得到的重建后的特征利用ECA注意力机制模块进行基于注意力机制的特征筛选;Step5.对步骤Step4筛选后得到的特征进行分类和回归操作,得到基于注意力机制与多尺度融合的YOLOv5目标检测模型;Step6.将测试数据带入基于注意力机制与多尺度融合的YOLOv5目标检测模型中,进行目标检测。2.根据权利要求1所述的一种基于注意力机制与多尺度融合的目标检测方法,其特征在于:步骤Step1所述的PE

YOLOv5s算法包括输入端、基准网络、特征融合和预测部分;所述输入端包含图像的预处理阶段,在输入端沿用YOLOv4的Mosaic数据增强,提升模型的训练速度和网络精度;所述基准网络网络是检测网络的主干,用于提取出图像的高中低层的特征;所述特征融合部分主要用于生成特征金字塔,增强模型对于不同缩放尺度对象的检测;所述预测部分用于进行卷积,得到预测结果。3.根据权利要求2所述的一种基于注意力机制与多尺度融合的目标检测方法,其特征在于:步骤Step1所述的PE

YOLOv5s算法还包括A框、B框、C框、D框、E框和F框;其中A框是CBL结构,由Conv+Bn+Leaky_relu激活函数三者组成;B框为Res unint模块,是由两个CBL模块组成的残差组件;C框和D框是CSP1_X、CSP2_X的结构;E框是SPP结构;F框是Focus结构。4.根据权利要求1所述的一种基于注意力机制与多尺度融合的目标检测方法,其特征在于:步骤Step2所述的特征提取过程为利用PSConv将扩张因子沿输入输出通道周期循环,提取图像中的不同尺度特征,得到多尺度的特征图集;其中所述PSConv的卷积定义为:上式中,是由两个正交维度的通道膨胀率和滤子膨胀率组成的矩阵;表示输入特征,表示卷积核,表示输出特征。5.根据权利要求4所述的一种基于注意力机制与多尺度融合的目标检测方法,其特征在于:步骤Step3所述的多尺度的特征图的融合的过程为利用PSConv通过按照通道对不同
尺度卷积交替计算,通过将...

【专利技术属性】
技术研发人员:何祯鑫刘春桐刘忠业冯永保于传强李良王欣
申请(专利权)人:中国人民解放军火箭军工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1