基于改进yolox算法的复杂环境下输电线路鸟巢检测方法技术

技术编号:37068771 阅读:23 留言:0更新日期:2023-03-29 19:46
本发明专利技术公开了一种基于改进yolox算法的复杂环境下输电线路鸟巢检测方法,具体按照以下步骤实施:步骤1、采集鸟巢图像数据,标注并划分数据集为训练集、验证集和测试集;步骤2、建立改进yolox算法网络模型,采用深度通道注意力模块和损失函数对yolox目标检测算法进行改进;步骤3、将训练集中图像输入改进yolox算法网络模型进行训练,通过训练得到优化的yolox算法网络模型;步骤4、将测试集中图像输入优化的yolox模型进行检测,获得鸟巢检测结果图。本发明专利技术解决了现有技术中存在的复杂环境下鸟巢检测精度低的问题。检测精度低的问题。检测精度低的问题。

【技术实现步骤摘要】
基于改进yolox算法的复杂环境下输电线路鸟巢检测方法


[0001]本专利技术属于图像处理
,具体涉及一种基于改进yolox算法的复杂环境下输电线路鸟巢检测方法。

技术介绍

[0002]为了确保国家电力能源供给的稳定可靠,以特高压技术为代表的新一代高能效、远距离、智能化电网新型基础设施建设,已成为未来我国发展的重要方向。由于我国幅员辽阔,在目前电力的远距离传输过程中,由鸟类活动引起的重大电力故障时有发生。常见鸟害导致的典型故障包括鸟类直接触电短路、鸟类筑巢活动导致的短路以及鸟粪覆盖绝缘器件引起的闪络等。分析故障原因,鸟类的筑巢习性导致大量鸟类长期活动在电力塔架及线路附近,这给长距离输电埋下了重大隐患。同时由于各种复杂环境下,更加难以通过传统的算法检测到因鸟巢而引起的故障。
[0003]为避免此类故障,输电的运行与维护规范要求电力检修部门指派巡检员定期对固定线路进行人工巡线检查。由于输电线路常架设于地形复杂且位置偏僻的森林及山区,而鸟类筑巢又常位于塔顶及塔架等不易观测的角落位置,这导致人工巡线对鸟巢检测的成本高且效率低。近年来,输电线路的常规巡检已逐步摆脱人工方式,基于无人机视频的巡检方式极大地改善了电力巡检作业的难度。日前,基于无人机巡检视频的智能故障检测与识别技术已成为推动智能电网应用的研究热点。受光照条件、拍照角度、拍摄距离、巡线飞行速度以及复杂地形背景的影响,基于无人机巡检视频的相关自动检测仍面临检测算法精度与鲁棒性的挑战。
[0004]由于无人机巡检过程中成像端与目标物的距离随拍摄机位变化而变化,故鸟巢部分细节特征随距离变化表现出不同的尺度特征。为了对输电线路鸟巢进行准确检测,本文提出一种基于改进yolox算法的复杂环境下输电线路鸟巢检测方法,实现了对输电线路鸟巢的准确检测。该算法的特点在于,首先利用航拍获得输电线路鸟巢图像,再利用图像预处理方法对图像进行处理,将处理后的图像分为训练集、验证集和测试集,最后利用深度学习网络(yolox算法模型)提取鸟巢的特征信息,利用所提取的特征信息进行准确预测,实现在复杂环境下对输电线路鸟巢的高效检测。

技术实现思路

[0005]本专利技术的目的是提供一种基于改进yolox算法的复杂环境下输电线路鸟巢检测方法,解决了现有技术中存在的复杂环境下鸟巢检测精度低的问题。
[0006]本专利技术所采用的技术方案是,基于改进yolox算法的复杂环境下输电线路鸟巢检测方法,具体按照以下步骤实施:
[0007]步骤1、采集鸟巢图像数据,标注并划分数据集为训练集、验证集和测试集;
[0008]步骤2、建立改进yolox算法网络模型,采用深度通道注意力模块和损失函数对yolox目标检测算法进行改进;
[0009]步骤3、将训练集中图像输入改进yolox算法网络模型进行训练,通过训练得到优化的yolox算法网络模型;
[0010]步骤4、将测试集中图像输入优化的yolox模型进行检测,获得鸟巢检测结果图。
[0011]本专利技术的特点还在于,
[0012]步骤1具体按照以下步骤实施:
[0013]步骤1.1、通过无人机搭载的高清摄像头拍摄大量的巡检视频,包括各种复杂背景下的输电线路鸟巢图像,以及远景、近景和特写的输电线路鸟巢图像,并保持每个类型的输电线路鸟巢图像数量一致;
[0014]步骤1.2、将步骤1.1中获得的鸟巢图像进行旋转、翻转、缩放、任意裁剪,从而得到扩充鸟巢图像;
[0015]步骤1.3、将步骤1.1中获得的鸟巢图像和步骤1.2中获得的扩充鸟巢图像总和作为鸟巢样本图像库,对鸟巢样本图像库中的每一图像样本制作对应的标签文件,对应的标签文件中含有鸟巢的类别标签,鸟巢的类别标签为nest,标签文件满足PascalVOC格式的xml标签文件标准,xml标签文件包括图像ID、图像路径、图像名称、图像的像素高度及宽度,其中图像的像素高度和宽度通过一个矩形框的四个坐标表示,包括x
min
,y
min
,x
max
,y
max
,其中(x
min
,y
min
)是矩形框的左上顶点的坐标,(x
max
,y
max
)是矩形框右下顶点的坐标。
[0016]步骤1.4、按照8:1:1的比例将鸟巢样本图像库划分为训练集、验证集和测试集;
[0017]步骤2具体按照以下步骤实施:
[0018]步骤2.1、改进yolox算法网络模型保持原yolox网络的Focus层、SPP层、CBS层、Neck层和prediction层的组合网络不变;主干网络Backbone中CSP1_X层添加深度通道注意力模块,;
[0019]步骤2.2、深度通道注意力模块结构如下:
[0020]对于输入的特征图X(X
1in
、X
2in
、X
3in
),X∈R
CxWxH
,C为通道数,W和H为特征图的高和宽;
[0021]首先,利用最大池化和平均池化从两个角度提取第一分支输入特征图X
1in
的特征:
[0022]X
max1
=f
maxpool
(X
1in
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0023]X
avg1
=f
avgpool
(X
1in
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0024]其中,X
1in
表示第一分支输入特征图,f
maxpool
表示进行最大池化,f
avgpool
表示进行平均池化,X
max1
表示最大池化的结果并且X
max1
∈R
C
×
H/2
×
W/2
,X
avg1
表示平均的结果并且X
avg1
∈R
C
×
H/2
×
W/2
;采用最大池提取输入特征图的重要信息,采用平均池提取输入特征图全局信息,将最大池化与平均池化的结果进行堆叠,通过Sigmoid函数输出:
[0025]A
c
=σ[Z
concat
(X
max1
+X
avg1
)]ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0026]其中,σ表示Sigmoid函数,Z
concat
表示将最大池化与平均池化的结果进行堆叠,A
c
表示经过Sigmoid函数的输出结果并且A
c
∈R
C
×1×1,A
c
中的每个元素都表示其对应通道的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于改进yolox算法的复杂环境下输电线路鸟巢检测方法,其特征在于,具体按照以下步骤实施:步骤1、采集鸟巢图像数据,标注并划分数据集为训练集、验证集和测试集;步骤2、建立改进yolox算法网络模型,采用深度通道注意力模块和损失函数对yolox目标检测算法进行改进;步骤3、将训练集中图像输入改进yolox算法网络模型进行训练,通过训练得到优化的yolox算法网络模型;步骤4、将测试集中图像输入优化的yolox模型进行检测,获得鸟巢检测结果图。2.根据权利要求1所述的基于改进yolox算法的复杂环境下输电线路鸟巢检测方法,其特征在于,所述步骤1具体按照以下步骤实施:步骤1.1、通过无人机搭载的高清摄像头拍摄大量的巡检视频,包括各种复杂背景下的输电线路鸟巢图像,以及远景、近景和特写的输电线路鸟巢图像,并保持每个类型的输电线路鸟巢图像数量一致;步骤1.2、将步骤1.1中获得的鸟巢图像进行旋转、翻转、缩放、任意裁剪,从而得到扩充鸟巢图像;步骤1.3、将步骤1.1中获得的鸟巢图像和步骤1.2中获得的扩充鸟巢图像总和作为鸟巢样本图像库,对鸟巢样本图像库中的每一图像样本制作对应的标签文件,对应的标签文件中含有鸟巢的类别标签,鸟巢的类别标签为nest,标签文件满足Pascal VOC格式的xml标签文件标准,xml标签文件包括图像ID、图像路径、图像名称、图像的像素高度及宽度,其中图像的像素高度和宽度通过一个矩形框的四个坐标表示,包括x
min
,y
min
,x
max
,y
max
,其中(x
min
,y
min
)是矩形框的左上顶点的坐标,(x
max
,y
max
)是矩形框右下顶点的坐标;步骤1.4、按照8:1:1的比例将鸟巢样本图像库划分为训练集、验证集和测试集。3.根据权利要求2所述的基于改进yolox算法的复杂环境下输电线路鸟巢检测方法,其特征在于,所述步骤2具体按照以下步骤实施:步骤2.1、改进yolox算法网络模型保持原yolox网络的Focus层、SPP层、CBS层、Neck层和prediction层的组合网络不变;主干网络Backbone中CSP1_X层添加深度通道注意力模块,;步骤2.2、深度通道注意力模块结构如下:对于输入的特征图X(X
1in、
X
2in
、X
3in
),X∈R
CxWxH
,C为通道数,W和H为特征图的高和宽;首先,利用最大池化和平均池化从两个角度提取第一分支输入特征图X
1in
的特征:X
max1
=f
maxpool
(X
1in
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)X
avg1
=f
avgpool
(X
1in
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)其中,X
1in
表示第一分支输入特征图,f
maxpool
表示进行最大池化,f
avgpool
表示进行平均池化,X
max1
表示最大池化的结果并且X
max1
∈R
C
×
H/2
×
W/2
,X
avg1
表示平均的结果并且X
avg1
∈R
C
×
H/2
×
W/2
;采用最大池提取输入特征图的重要信息,采用平均池提取输入特征图全局信息,将最大池化与平均池化的结果进行堆叠,通过Sigmoid函数输出:A
c
=σ[Z
concot
(X
max1
+X
avg1
)]
ꢀꢀꢀꢀꢀꢀꢀ
(3)其中,σ表示Sigmoid函数,Z
concot
表示将最大池化与平均池化的结果进行堆叠,A
c
表示经过Sigmoid函数的输出结果并且A
c
∈R
C
×1×1,A
c
中的每个元素都表示其对应通道的重要性级
别;其次,将输入特征图X
lin
分为两个路径,一个路径与Sigmoid函数输出进行融合;另一个路径先进行3x3的卷积后,通过深度可分离卷积之后经过Relu函数输出:X1‑1=A
c
*X
lin
X1‑2=f
conv3
(X
lin
)X1‑3=Relu[f
conv3
×3(X1‑2)+f
convl
×1(X1‑2)]
ꢀꢀꢀꢀꢀ
(4)其中X1‑1表示输入特征图X
lin
与Sigmoid函数输出A
c
融合的结果,f
conv3
表示进行3x3的卷积运算,X1‑2表示3x3的卷积运算的结果,f
conv3x3
表示逐通道卷积,f
convlx1
表示逐点卷积,逐通道卷积f
conv3x3
和逐点卷积f
convlxl
合称为深度可分离卷积,Relu表示进行Relu激活运算,X1‑3表示进行Relu激活运算的结果;最后,将X1‑1与X1‑3进行堆叠输出:X1‑
out
=X1‑1+X1‑3ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)其中,X
l

out
表示X1‑1和X1‑3进行堆叠的结果,以上提取特征过程即为深度提取,深度通道注意力模块的第二分支输入特征图X
2in
的宽和高进行2倍上采样和第三分支输入特征图X
3in
...

【专利技术属性】
技术研发人员:纪超陈国燕黄新波王东旭王博雅王亮侯威宋智伟
申请(专利权)人:西安工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1