基于改进YOLOv5+ByteTrack的变电站设备缺陷检测与追踪方法技术

技术编号:38317791 阅读:11 留言:0更新日期:2023-07-29 08:59
本发明专利技术是关于一种基于改进YOLOv5+ByteTrack的变电站设备缺陷检测与追踪方法。该方法包括:构建变电站设备缺陷检测专用数据集;对原YOLOv5检测算法进行改进:将YOLOv5网络模型中的常规卷积替换为可变型卷积,对YOLOv5网络模型增加上下文增强模块;训练基于改进YOLOv5检测算法的变电站设备缺陷检测模型;利用变电站设备缺陷检测模型对变电站进行目标检测,利用ByteTrack对变电站设备缺陷进行追踪。本发明专利技术通过对将YOLOv5网络模型中的常规卷积替换为可变型卷积,对YOLOv5网络模型增加上下文增强模块,对原YOLOv5检测算法进行了改进,在不降低检测精度的前提下,显著降低了模型训练过程中的计算量,使得改进后的YOLOv5网络模型更加轻量化,有效实现变电站智能巡检的经济性和工程实用性。的经济性和工程实用性。的经济性和工程实用性。

【技术实现步骤摘要】
基于改进YOLOv5+ByteTrack的变电站设备缺陷检测与追踪方法


[0001]本公开实施例涉及计算机视觉
,尤其涉及一种基于改进YOLOv5+ByteTrack的变电站设备缺陷检测与追踪方法。

技术介绍

[0002]变电站是联系主干网与配电网的重要节点,是智能电网的核心枢纽、电力系统稳定运行的关键。随着工程用电设备的不断增加,变电站在整个电力系统中发挥这日益重要的作用。然而,随着电压等级的上升与传输容量的增大,变电站的规模不断扩大、变电设备不断增多,传统的人工现场巡检的危险系数越来越大、误检漏检率越来越高。
[0003]随着计算机视觉技术和智能机器人技术的发展,电力设备维护逐渐由传统的人工排查、远程“四遥”监控发展成为智能巡检新方式,高精度无人机应用到变电站巡检中能实现高效自主精确巡检。R

CNN系列算法检测精度高,但由于网络采用双阶段结构,使得其检测速度不能满足实际工程应用的需求,饱受诟病。为了打破这一僵局,设计一种速度更快的目标检测器是大势所趋。2016年,Joseph Redmon等人提出了一种名为You Only Look Once的目标检测算法,这便是日后被各个领域学者广泛关注的YOLO系列算法。YOLO系列算法采用单阶段网络结构,因而检测速度能够满足变电站智能巡检的需求,且随着YOLO系列的不断更新,其检测精度不断提高,是时下最热门的目标检测算法。
[0004]YOLOv5算法在训练模型过程中需要大量的数据集、算力资源和时间,然而目前有关变电站内设备缺陷图像公开数据集十分稀少,且目前变电站投运的用于智能巡检的无人机、机器人机载算力低下,而大部分变电站内缺乏大型计算机,以上种种原因都严重阻碍了变电站乃至电力系统的智能巡检的发展。因此,在不影响变电站设备缺陷检测精度的前提下,如何优化YOLOv5,使其网络尽可能轻量化,降低变电站智能巡检改造成本成为一个亟需解决的问题。
[0005]因此,有必要改善上述相关技术方案中存在的一个或者多个问题。
[0006]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0007]本公开实施例的目的在于提供一种基于改进YOLOv5+ByteTrack的变电站设备缺陷检测与追踪方法,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。
[0008]本专利技术提供了一种基于改进YOLOv5+ByteTrack的变电站设备缺陷检测与追踪方法,所述方法包括以下步骤:
[0009]构建变电站设备缺陷检测专用数据集;
[0010]对原YOLOv5检测算法进行改进:将YOLOv5网络模型中的常规卷积替换为可变型卷
积,对所述YOLOv5网络模型增加上下文增强模块;
[0011]训练基于改进YOLOv5检测算法的变电站设备缺陷检测模型;
[0012]利用所述变电站设备缺陷检测模型对变电站进行目标检测,利用ByteTrack对变电站设备缺陷进行追踪。
[0013]本专利技术中,所述构建变电站设备缺陷检测专用数据集,包括:
[0014]采集变电站设备缺陷图片,并将采集到的所述缺陷图片存放在第一文件夹中;
[0015]在所述第一文件夹中创建文本文件,用于存放对所述缺陷图片进行标注的类别名称;
[0016]在所述第一文件夹中创建第二文件夹,用于存放对所述缺陷图片进行标注的标签文件,所述标签文件与所述第一文件夹中存放的所述缺陷图片相对应;
[0017]将所述标签文件的格式转换为文本格式,并将所述第一文件夹中的所述缺陷图片和所述第二文件夹中的所述标签文件按照预设比例划分为训练集和测试集。
[0018]本专利技术中,对原YOLOv5检测算法进行改进,包括:
[0019]将原YOLOv5网络模型中的第8层的C3模块中常规卷积替换为可变型卷积DCN,得到C3_DCN模块;
[0020]将原YOLOv5网络模型中的13层、20层和23层的C3替换为上下文感知跨级融合网络C2F模块;
[0021]在原YOLOv5网络模型中的22层与23层之间增加上下文增强CAM模块;
[0022]将原YOLOv5网络模型中的损失函数L
CIou
改进为L
Sigmiod

Focal

CIoU

[0023]得到改进的YOLOv5检测算法。
[0024]本专利技术中,所述可变型卷积DCN的计算公式为:
[0025][0026]其中,x是特征图,w是卷积核参数,p0是卷积核中心相对于输入特征图左上角的坐标,p
n
是卷积核R元素相互对于卷积核中心的偏移量,Δp
n
是位置偏移向量,Δp
n
的表达式为:
[0027]{Δp
n
|n=1,2,

N},N=|R|
[0028]|R|={(

1,

1),(

1,0),

,(0,1),(1,1)}。
[0029]本专利技术中,所述上下文感知跨级融合网络C2F模块包括卷积1、Split模块、N个Bottleneck和Concatl模块相连,其中N≥2;
[0030]所述卷积1的输入端作为上下文感知跨级融合网络C2F模块的输入端,卷积1的输出端与Split模块的输入端相连,Split模块的输出端与第一个Bottleneck的输入端相连,N个Bottleneck首尾相连,第N个Bottleneck的输出端与Concat1模块的输入端相连;Concat1模块的输出端作为上下文感知跨级融合网络C2F模块的输出端。
[0031]本专利技术中,所述上下文增强CAM模块包括卷积a、卷积b、卷积c、卷积d、卷积e、卷积f和Concat2模块;
[0032]所述卷积a、卷积b和卷积c的输入端为上下文增强CAM模块的输入端,卷积a的输出端与卷积d的输入端相连,卷积b的输出端与卷积e的输入端,卷积c的输出端与卷积f的输入端相连;卷积d、卷积e和卷积f的输出端作为Concat2模块的输入端相连;Concat2模块的输
出端作为上下文增强CAM模块的输出端。
[0033]本专利技术中,所述卷积a、卷积b和卷积c分别是扩张卷积率为1、3和5、核大小为3
×
3的卷积;所述卷积d、卷积e和卷积f是核大小为1
×
1的卷积。
[0034]本专利技术中,所述损失函数改进内容如下:
[0035]原YOLOv5网络损失函数L
total
的表达式为:
[0036]L
total
=L
box
+L
obj
+L
cls...

【技术保护点】

【技术特征摘要】
1.基于改进YOLOv5+ByteTrack的变电站设备缺陷检测与追踪方法,其特征在于,所述方法包括以下步骤:构建变电站设备缺陷检测专用数据集;对原YOLOv5检测算法进行改进:将YOLOv5网络模型中的常规卷积替换为可变型卷积,对所述YOLOv5网络模型增加上下文增强模块;训练基于改进YOLOv5检测算法的变电站设备缺陷检测模型;利用所述变电站设备缺陷检测模型对变电站进行目标检测,利用ByteTrack对变电站设备缺陷进行追踪。2.根据权利要求1所述的方法,其特征在于,所述构建变电站设备缺陷检测专用数据集,包括:采集变电站设备缺陷图片,并将采集到的所述缺陷图片存放在第一文件夹中;在所述第一文件夹中创建文本文件,用于存放对所述缺陷图片进行标注的类别名称;在所述第一文件夹中创建第二文件夹,用于存放对所述缺陷图片进行标注的标签文件,所述标签文件与所述第一文件夹中存放的所述缺陷图片相对应;将所述标签文件的格式转换为文本格式,并将所述第一文件夹中的所述缺陷图片和所述第二文件夹中的所述标签文件按照预设比例划分为训练集和测试集。3.根据权利要求1所述的方法,其特征在于,所述对原YOLOv5检测算法进行改进,包括:将原YOLOv5网络模型中的第8层的C3模块中常规卷积替换为可变型卷积DCN,得到C3_DCN模块;将原YOLOv5网络模型中的13层、20层和23层的C3替换为上下文感知跨级融合网络C2F模块;在原YOLOv5网络模型中的22层与23层之间增加上下文增强CAM模块;将原YOLOv5网络模型中的损失函数L
CIoU
改进为L
Sigmiod

Focal

CIoU
;得到改进的YOLOv5检测算法。4.根据权利要求3所述的方法,其特征在于,所述可变型卷积DCN的计算公式为:其中,x是特征图,w是卷积核参数,p0是卷积核中心相对于输入特征图左上角的坐标,p
n
是卷积核R元素相互对于卷积核中心的偏移量,Δp
n
是位置偏移向量,Δp
n
的表达式为:{Δp
n
|n=1,2,

N},N=|R||R|={(

1,

1),(

1,0),

,(0,1),(1,1)}。5.根据权利要求3所述的方法,其特征在于,所述上下文感知跨级融合网络C2F模块包括卷积1、Split模块、N个Bottleneck和Concat1模块相连,其中N≥2;所述卷积1的输入端作为上下文感知跨级融合网络C2F模块的输入端,卷积1的输出端与Split模块的输入端相连,Split模块的输出端与第一个Bottleneck的输入端相连,N个Bottleneck首尾相连,第N个Bottleneck的输出端与Concat1模块的输入端相连;Concat1模块的输出端作为上下文感知跨级融合网络C2F模块的输出端。6.根据权利要求3所述的方法,其特征在于,所述上下文增强CAM模块包括卷积a、卷积
b、卷积c、卷积d、卷积e、卷积f和Concat2模块;所述卷积a、卷积b和卷积c的输入端为上下文增强CAM模块的输入端,卷积a的输出端与卷积d的输入端相连,卷积b的输出端与卷积e的输入端,卷积c的输出端与卷积f的输入端相连;卷积d、卷积e和卷积f的输出端作为Concat2模块的输入端相连;Concat2模块的输出端作为上下文增强CAM模块的输出端。7.根据权利要求6所述的方法,其特征在于,所述卷积a、卷积b和卷积c分别是扩张卷积率为1、3和5、核大小为3
×
3的卷积;所述卷积d、卷积e和卷积f是核大小为1
×
1的卷积。8.根据权利要求3所述的方法,其特征在于,所述损失函数改进内容如下:原YOLOv5网络损失函数L
total
的表达式为:L
total
=L
box
+L
obj
+L
cls
其中,L
box
为定位损失,L
obj
为置信度损失,L
cls
为分类损失;其中,λ
IoU
为所述定位损失L
box
的权重系数,L
CIoU
是为原YOLOv5网络模型在训练过程中默认采用定位损失函数,其表达式为:其中,B为预测边框,B
gt
为真实边框,ρ表示预测边框B中心点与中心...

【专利技术属性】
技术研发人员:王倩蒲佳伟谢飞栾智荣秦司晨张嘉伟
申请(专利权)人:西安理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1