一种基于强化学习和Transformer的电力缺陷检测方法技术

技术编号:34333826 阅读:78 留言:0更新日期:2022-07-31 02:35
本发明专利技术公开了一种基于强化学习和Transformer的电力缺陷识别方法,其步骤包括:1无人机航拍采集原始数据集,并通过深度卷积生成对抗网络增广数据集合;2使用强化学习模块提取图像特征搜索出前景区域;3通过Transformer模块对背景区域特征向量压缩并进一步进行特征提取,并最终经过全连接层获得最终预测结果。本发明专利技术利用深度学习实现了对电力缺陷区域的检测,从而减少了人力成本,且不受天气、背景等外部因素的影响,并提高了检测效率和检测精度。率和检测精度。率和检测精度。

A power defect detection method based on reinforcement learning and transformer

【技术实现步骤摘要】
一种基于强化学习和Transformer的电力缺陷检测方法


[0001]本专利技术涉及深度学习领域,具体的说是一种基于强化学习和Transformer的电力缺陷检测方法。

技术介绍

[0002]随着我国电力需求不断增长,输电线路规模的迅速扩大,输电线路长期暴露在复杂自然环境中,受雨水腐蚀、雷击等自然条件干扰,容易出现各种故障,影响电网安全稳定运行。因此,输电线路的高效率巡检对于确保生产生活正常运行至关重要。
[0003]许多输电线路架设在人迹罕至的地区,地形复杂,传统的人工巡检所花费成本和难度都较高。故此,很多地区采用无人机搭载图像采集装置的方式,快速采集输电线路的图像和视频数据,从而大大减少巡检工作量。然而由于航拍图像数量大、背景复杂,工作人员采用人工判断时,效率较低且容易发生判断错误,难以满足巡检要求。因此,基于无人机航拍图像的输电线路检测故障检测方法的研究具有重要的理论和实用价值。
[0004]目前伴随着无人机技术和计算机技术的不断发展,国内外在输电线路方面检测方面的研究已经取得了一定的进展,根据识别算法原理可以分为传统图本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习和Transformer的电力缺陷识别方法,其特征在于,包括以下步骤:步骤1、采集电力巡检航拍图像集并使用深度卷积生成对抗网络进行数据增强,得到扩充后的图像数据集,再对扩充后的图像数据集进行标准化处理后,再对每张标准化后的图像标注目标检测框,从而得到训练数据集;步骤2、构建用于筛选前景区域和背景区域的强化学习模块,并将所述训练数据集输入所述强化学习模块中进行训练,得到所述训练数据集中第i幅图像的前景区域特征向量集合F
i,f
和背景区域向量集合F
i,b
;步骤3、根据所述第i幅图像的前景特征向量集合F
i,f
和背景区域向量集合F
i,b
,使用双线性池化层对所述背景区域向量集合F
i,b
中的非关键区域进行信息压缩,得到数量为M的特征向量集合F
i,c
,再与所述前景特征向量集合F
i,f
进行连接后,得到新向量组合F
i*
;步骤4、将所述第i幅图像的新向量组合F
i*
输入Transformer模块中进行特征提取,得到特征图T
i
后再使用全连接层对所述特征图进行处理,并输出预测结果,从而根据预测结果与真实结果构建损失函数,用于训练Transformer模块的参数,并最终得到训练好的Transformer模块用于对电力缺陷进行识别。2.根据权利要求1所述的电力缺陷识别方法,其特征在于,所述步骤2包括:步骤2.1、构建强化学习模块,包括:DetNet特征提取的主干网络、DQN网络;并随机初始化强化学习模块的参数;所述主干网络是基于空洞卷积构建的卷积神经网络,并包含X个卷积块;其中,第x级卷积块依次由卷积核大小为c1的普通卷积层、卷积核大小为c2的空洞卷积层和卷积核大小为c2的普通卷积层组成,其中,每一个卷积块后连接有一个批量归一化层和一个ReLu激活函数;所述DQN网络组成由全连接网络组成;步骤2.2、根据训练数据集中的图片数量设定经验池D的空间,并初始化经验池D;步骤2.3、所述训练数据集中第i幅带有目标检测框的图像输入所述提取主干网络中进行特征提取,得到尺寸为C
×
n
×
n的特征图F
i
;C表示特征图F
i
的通道数,n表示特征图F
i
的长或宽;步骤2.4、将所述特征图F
i
分为大小相等的n
×
n块单位区域,每块单位区域代表一个动作选择,从而得到动作空间记为A
i
={a
i,1
,a
i,2
,,...,a
i,t
,...,a
i,n
×
n
},a
i,t
表示在第i幅图像中选择第t个单位区域的动作;步骤2.5、利用式(1)计算在第i幅图像中第t个动作所选择的单元区域的奖励分数r
i,t
,从而得到所述特征图F
i
的奖励函数J
i
={j
i,1
,j
i,2
,,...,j
i,t
,...,j
i,n
×
n
};式(1)中,Δ
i,t
表示在第i幅图像中第t个单位区域中所包含目标物体像素数量;Δ
i,all
表示在第i幅图像中第t个单位区域的总像素数量;步骤2.6、设置所述特征图F
i
的状态空间s
i
;步骤2.7、将状态空间输入所述DQN网络中,并获得动作空间中每个动作的评分,使用贪
婪策略选取其中得分最高的K个动作,并由状态空间s
i
及其K个动作组成Q值表Q(s
i
,a
i
);并根据奖励函数R计算当前K个动作下所获得的K个奖励值,从而K个奖励值和Q值表Q(s
i
,a
i
)所组成的第i个元组存入经验...

【专利技术属性】
技术研发人员:李帷韬侯建平胡平路管树志杨盛世张雪松李奇越孙伟刘鑫常文婧李卫国王刘芳董翔宇黄杰
申请(专利权)人:国网安徽省电力有限公司超高压分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1