当前位置: 首页 > 专利查询>南通大学专利>正文

一种基于改进YOLOv2的电力安全标志牌检测方法技术

技术编号:38736950 阅读:10 留言:0更新日期:2023-09-08 23:23
本发明专利技术属于智能识别技术领域,具体涉及一种基于改进YOLOv2的电力安全标志牌检测方法。本发明专利技术包括以下步骤:S1:采集电力安全标志牌图片,对于长宽比不同的样本,按照图片最长边以零像素值将分辨率补齐,输入尺寸为416

【技术实现步骤摘要】
一种基于改进YOLOv2的电力安全标志牌检测方法


[0001]本专利技术属于智能识别
,具体涉及一种基于改进YOLOv2的电力安全标志牌检测方法。

技术介绍

[0002]电力安全标志牌检测可以识别监控区域内的警示信息,是智能电力安全作业管控系统的重要组成部分。在电力安全标志牌检测方法中,基于深度卷积神经网络的目标检测算法具有较强的鲁棒性,其研究方向之一便是一阶段目标检测网络。一阶段目标检测网络主要有YOLO系列,YOLOv2使用Darknet

19作为基础网络,同时引入锚框机制。其中,每一个网格中锚框的类别相互独立,实现了每个网格的多类别输出。且相对于YOLO系列而言,YOLOv2耗费计算资源较少,容易保证算法实时性。
[0003]然而,现有YOLOv2的电力安全标志牌检测方法存在如下问题:
[0004](1)在YOLOv2网络结构中,输入的图片经过一系列卷积后得到32倍下采样的特征图。将下采样后的特征图映射到输入图像,不同映射单元的特征用来预测此单元内的目标。尽管每个特征点都设置了一系列长宽比不同的锚框以适应不同尺度形状的目标,但下采样步长过大会导致锚框尺度难以覆盖到小目标。
[0005](2)当提高YOLOv2输出层特征图分辨率时,直接使用浅层高分辨率的特征图的方法会丢失网络深层的语义信息,而直接通过对深层特征进行插值上采样方法增加特征图尺寸会无差别地将特征复制到邻近位置,容易引入误差。

技术实现思路

[0006]为解决上述现有技术存在的技术问题,本专利技术提出了一种基于改进YOLOv2的电力安全标志牌检测方法。
[0007]本专利技术为实现上述专利技术目的,采取的技术方案如下:
[0008]一种基于改进YOLOv2的电力安全标志牌检测方法,包括以下步骤:
[0009]S1:采集电力安全标志牌图片,对于长宽比不同的样本,按照图片最长边以零像素值将分辨率补齐,输入尺寸为416
×
416的图片样本;
[0010]S2:将输入图片经Darknet

19基础网络的卷积层后进行16倍下采样,得到分辨率为26
×
26的特征图;
[0011]S3:基于16倍下采样后的特征图,对深层特征进行索引池化,并将原特征图结合池化掩码进行上采样;
[0012]S4:将上采样后的特征图与相同大小的浅层特征进行拼接融合,并对拼接融合后的高分辨率特征图进行预测;
[0013]S5:根据特征图中不同映射单元的特征,预测此单元内的目标,最终输出电力安全标志牌检测图。
[0014]进一步的作为本专利技术的优选技术方案,所述S3中,采用索引池化技术恢复深层特
征分辨率,索引池化技术可以恢复特征图的编码信息,在解码阶段根据编码阶段记录的索引恢复相应位置的值;特征图经过索引池化,得到一半大小的特征图,同时保存了最大值对应的位置掩码信息;另外,对一半大小的特征图进行上采样,结合最大值位置将特征图结果从一半大小恢复到原特征图大小。
[0015]进一步的作为本专利技术的优选技术方案,采用最大池化层的池化索引进行上采样时,上采样的过程不需要学习,上采样得到的稀疏特征图通过滤波器卷积获得稠密的特征图。
[0016]进一步的作为本专利技术的优选技术方案,所述S4中,对高分辨率特征图进行预测时,需要增加预测层特征图尺寸,增大锚框密度,减少目标框位置与锚框之间的偏移距离;
[0017]选择锚框密度时,需要对电力安全标志牌数据集进行尺度聚类,得到三种锚框尺寸,三种锚框分别对应特征图尺寸、输入尺寸与原图尺寸,需要选择最小尺寸的锚框密度进行增大。
[0018]进一步的作为本专利技术的优选技术方案,所述S4中,上采样后的特征图与相同大小的浅层特征融合后,对于目标位置的预测公式如下:
[0019][0020]式中,t
x
、t
y
为网络预测值对应输出特征网格中心点的偏移,t
w
、t
h
为网络预测值对应输出特征网格中心点的宽与高,c
x
、c
y
为对应特征网格的索引坐标,b
x
、b
y
、b
w
、b
h
为检测目标对应于输出特征的坐标,p
w
、p
h
为锚框相对于输出特征的宽高。
[0021]进一步的作为本专利技术的优选技术方案,所述S4中,对拼接融合后的高分辨率特征图进行预测时,所使用的损失函数如下:
[0022][0023]其中,K为预测层特征图的尺寸,M为先验框的个数,C为类别数;使用sigmoid交叉熵损失函数计算预测层网格前景物体与背景的二分类损失,的表达式如下:
[0024][0025]其中,y为网络的预测值,为标签,当对应网格预测框与真实标注框的交并比大于一定阈值,其标签为前景,反之为背景;
[0026]式(2)中在真实标注对应的网格处计算预测框的坐标损失,其表达式如下:
[0027][0028]其中diff
x
、diff
y
为真实标注中心与其所在网格中心之间的偏移量,pred
x
、pred
y
为网格处预测得到的预测框中心与该网格中心之间的偏移量,pred
w
、pred
h
分别为锚框宽和高处的预测值,anchor
w
、anchor
h
为先验框的宽和高,w、h为真实标注的宽和高;
[0029]式(2)中l
ijc
使用sigmoid交叉熵损失计算真实标注的网格处的类别损失,其表达式为:
[0030][0031]其中,为类别标签,c为网络预测值;
[0032]式(3)、(4)、(5)中scale
iou
、scale
coord
、scale
class
为控制损失各组成部分的权重,其值均设置为1。
[0033]本专利技术所述的一种基于改进YOLOv2的电力安全标志牌检测方法,采用以上技术方案与现有技术相比,具有以下技术效果:
[0034]本申请对原始YOLOv2的电力安全标志牌检测方法进行改进,在YOLOv2的网络结构中,通过提升特征图分辨率和增加输入图像对应的锚框密度,提高对小目标的覆盖率;在YOLOv2的基础上引入索引池化机制,恢复深层特征分辨率,精准地恢复深层语义信息在高分辨率特征图中的位置,限制无用信息的引入,提高网络分类识别的精确度。
附图说明
[0035]图1为本专利技术一实施例——基于改进YOLOv2的电力安全标志牌检测方法流程图;
[0036]图2(a)为本专利技术一实施例——13
×
13分辨率特征图对应的输入图像锚框密度分布示意图;
[0037]图2(b)为本专利技术一实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进YOLOv2的电力安全标志牌检测方法,其特征在于,包括以下步骤:S1:采集电力安全标志牌图片,对于长宽比不同的样本,按照图片最长边以零像素值将分辨率补齐,输入尺寸为416
×
416的图片样本;S2:将输入图片经Darknet

19基础网络的卷积层后进行16倍下采样,得到分辨率为26
×
26的特征图;S3:基于16倍下采样后的特征图,对深层特征进行索引池化,并将原特征图结合池化掩码进行上采样;S4:将上采样后的特征图与相同大小的浅层特征进行拼接融合,并对拼接融合后的高分辨率特征图进行预测;S5:根据特征图中不同映射单元的特征,预测此单元内的目标,最终输出电力安全标志牌检测图。2.根据权利要求1所述的一种基于改进YOLOv2的电力安全标志牌检测方法,其特征在于,所述S3中,采用索引池化技术恢复深层特征分辨率,索引池化技术可以恢复特征图的编码信息,在解码阶段根据编码阶段记录的索引恢复相应位置的值;特征图经过索引池化,得到一半大小的特征图,同时保存了最大值对应的位置掩码信息;另外,对一半大小的特征图进行上采样,结合最大值位置将特征图结果从一半大小恢复到原特征图大小。3.根据权利要求2所述的一种基于改进YOLOv2的电力安全标志牌检测方法,其特征在于,采用最大池化层的池化索引进行上采样时,上采样的过程不需要学习,上采样得到的稀疏特征图通过滤波器卷积获得稠密的特征图。4.根据权利要求1所述的一种基于改进YOLOv2的电力安全标志牌检测方法,其特征在于,所述S4中,对高分辨率特征图进行预测时,需要增加预测层特征图尺寸,增大锚框密度,减少目标框位置与锚框之间的偏移距离;选择锚框密度时,需要对电力安全标志牌数据集进行尺度聚类,得到三种锚框尺寸,三种锚框分别对应特征图尺寸、输入尺寸与原图尺寸,需要选择最小尺寸的锚框密度进行增大。5.根据权利要求4所述的一种基于改进YOLOv2的电力安全标志牌检测方法,其特征在于,所述S4中,上采样后的特征图与相同大小的浅层特征融合后,对于目标位置的预测公式如下:式中,t
x
、t
y
为...

【专利技术属性】
技术研发人员:黄杰杰王向群朱悦薛晓岑刀承毅桑顺
申请(专利权)人:南通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1