一种电力设备状态评价方法技术

技术编号:21455108 阅读:20 留言:0更新日期:2019-06-26 05:09
本发明专利技术涉及电力系统中电力设备的状态评价方法,更具体地,涉及基于深度深林的电力设备状态评价方法。本发明专利技术提供基于概率权重深度森林的电力设备状态评价方法可以较好地处理训练样本及预测样本中的缺失项,概率权重的缺失项处理方法相比于均值填充可以实现更高的准确率,本发明专利技术方法在处理高比例含缺失项的数据方面表现出了优势。

【技术实现步骤摘要】
一种电力设备状态评价方法
本专利技术涉及电力系统中电力设备的状态评价方法,更具体地,涉及基于深度深林的电力设备状态评价方法。
技术介绍
电力设备及时有效的检修维护是保障电力系统安全稳定运行的重要手段。为追求经济性和可靠性的平衡,电力设备检修策略从原始的事故检修、定期检修,发展到依据各设备健康情况按需要安排检修计划的状态检修,较大提高了设备维护效率。状态检修依赖于频繁的状态评价信息,特别是配网设备由于数量多、分布广,对其进行状态评价需要消耗大量的人力物力,故有些单位每年只对配电设备进行1次状态评价,难以及时根据设备健康状况调整检修安排,使得状态检修策略难以应用。但随着传感技术和无线通信技术的发展与成本的下降,各类监测手段也逐渐应用到配电设备上,丰富的监测数据给配电设备的在线状态评价提供了可能。由于电力设备的状态评价需要综合多方面的信息数据,其间联系非常复杂,目前主要方法是基于层次分析法和D-S证据理论确定设备各项指标权重并对各项指标进行综合,如文献“梁永亮,李可军,牛林,等.变压器状态评估多层次不确定模型[J].电力系统自动化,2013,37(22):73-78.”和“翟章良,周力行.基于状态量权重的变压器状态评价系统研制[J].智慧电力,2018,46(9):88-94.”。然而,层次分析法依赖大量的专家经验,随着电力设备监测信息种类的不断增加其应用难度也不断提高。利用机器学习方法发掘设备状态与各监测量之间的关系可以解决这个问题。目前,kNN、SVM和神经网络等机器学习已经在电力系统相关研究中得到了广泛的应用。然而,电力设备监测渐进式的发展过程使得新的监测量在某一时刻增加进来,而在此前的数据记录中这个监测量是缺失的,这给机器学习方法带来了问题。由于这种情况下含缺失项的样本占比较大,将这些样本直接剔除显然是不合适的,而常用的均值填充的数据预处理方法效果也不理想。
技术实现思路
本专利技术为解决电力设备在线监测技术渐进式发展过程中传统的状态评价方法应用困难,以及渐进式发展自然形成的大量历史样本数据缺失的问题,提高基于机器学习的配电设备状态评价方法处理缺失数据的效果,以采用概率权重处理含缺失项样本的决策树作为基本分类器,构成深度森林对包含电力设备监测信息和状态评价结果的训练样本进行学习并用训练好的深度森林模型基于新样本的电力设备监测信息给出相应的状态评价结果。本专利技术允许训练样本和新样本中的电力设备监测信息部分项目缺失,适应电力设备监测技术的不断发展。本专利技术的技术方案是:一种电力设备状态评价方法,用于实现基于数据驱动的电力设备状态评价,并提高样本中存在缺失值时的算法效果,该方法包括以下步骤:步骤1:获取训练样本,每条训练样本由电力设备监测数据和电力设备状态评价结果组成;步骤2:采用深度森林算法对包含电力设备监测信息和状态评价结果的训练样本进行学习;步骤3:用训练好的深度森林模型对要进行状态评价的电力设备的电力设备监测信息给出相应的状态评价结果。进一步,本专利技术提出的基于深度森林的电力设备状态评价方法以含概率权重的决策树为基本分类器,将若干决策树并联组成随机森林作为深度森林每一层的分类器,并将随机森林逐级串联组成深度森林。进一步,本专利技术以采用概率权重处理含缺失项样本的决策树作为基本分类器,其原理如下:设样本集D如下;其中,元素xm,n代表第m个样本的第n个属性,ym为样本数据的分类标签,ym∈{c1,c2,...,cK};对于一个节点包含的样本集,要选择一个最佳的划分方法将其划分成两个样本类别一致性更高的子集形成两个子节点,由于样本属性为连续值,要同时确定最佳的划分属性和划分值,所以采用信息熵作为描述样本集合纯度的指标,如下所示;其中,式中Pk为第k类样本所占的比重,Wm为样本m的权重。进一步,决策树训练过程如下:步骤A:初始化设置树的最大深度为DPmax,创建树根节点root并使其包含所有的学习样本,初始化各样本的权重均为1,如下所示:[w1,w2,K,wM]=[1,1,K,1]设置当前待划分节点node=root;步骤B:确定划分属性和划分点设当前待划分节点中包含的样本集为D,对属性n进行遍历,寻找最大信息增益的划分属性ns和划分点vs,其中Dn为D中属性n不为空的样本集,为D中属性n缺失的样本集,ρ为属性n未缺失的样本在D中占的比重,α=1或2,分别代表左分枝和右分枝,Dn,1代表左分枝样本集合,Dn,2代表右分枝样本集合,r1和r2分别代表左分枝样本和右分枝样本在Dn中占的比重,则:Dn,1={dm|xm,n≤vn},Dn,2={dm|xm,n>vn}连续属性划分点的选取:设样本集中待划分属性共有K个不同取值,从小到大排序为{X1,X2,…,Xk},则划分点候选集合为:步骤C:创建分支节点设当前待划分节点为node,记录其划分属性和划分点:node.ns=ns,node.vs=vs创建左右分枝节点node1和node2,设置两个节点的样本集D如下式;设置新节点中的样本权重和深度,其中α=1,2;nodeα.depth=node.depth+1检查树的深度,若nodeα.depth=DPmax,设置nodeα为叶子节点,不再进行划分;若nodeα.depth<DPmax,检查新节点的纯度,若节点样本全部为同一类则设为叶子节点;对于nodeα,若为叶子节点,计算各分类概率向量prob;nodeα.prob=[p1,p2,...,pk]若非叶子节点,对该节点应用上述方法进行划分。进一步,含概率权重决策树对新样本的预测方法为:在训练完成后,对于输入的新样本则从树的根节点开始,通过对比样本在节点划分属性的值与节点划分点之间的关系,将样本划分到子节点中,直到样本被划分到叶子节点中为止;以node.prob作为决策树的预测输出prob,若预测样本在节点划分属性上缺失,则将其同时划分到两个分枝节点中,并将两个节点的prob取均值作为输出,如此递归直至叶子节点。进一步,本专利技术以各决策树给出的分类概率向量的平均值作为随机深林的最终输出,随机森林的随机性体现在两个方面,设随机深林中包含NT棵决策树:第一方面:随机深林采用Bootstrap重采样法从原始样本集D中有放回地进行随机采样,生成每棵树的输入样本集D1,D2,…,DNT;第二方面:在树的生成过程中,划分属性并不从所有属性中选取,而是先随机选出NP个候选属性,然后再从中选取信息增益最大的属性对样本进行划分;对于预测样本,随机深林的输出如下:其中probi为随机深林中第i棵决策权输出的概率向量;当设置随机候选属性个数NP=1时,树的划分就是完全随机的,此时随机深林变成完全随机树森林或极端随机森林。本专利技术以深度森林为最终的模型实现电力设备状态评价的学习和分类。进一步,深度森林是一种基于决策树的深度学习算法,原始的深度森林包含多粒度扫描和级联森林两个阶段,本方法的深度深林只采用级联森林部分:级联森林的每一层都是由若干决策树森林组合而成的,采用1个随机森林和1个极度随机森林作为级联森林的一层,设样本标签类别共有k个,每个样本包含n个属性,对任一样本,将其所有属性构成的n维向量输入到第1层级联森林中,层中的随机森林和极度随机森林分别输出样本属于所有标签类别的k维概率向本文档来自技高网
...

【技术保护点】
1.一种电力设备状态评价方法,其特征在于,用于实现基于数据驱动的电力设备状态评价,并提高样本中存在缺失值时的算法效果,该方法包括以下步骤:步骤1:获取训练样本,每条训练样本由电力设备监测数据和电力设备状态评价结果组成;步骤2:采用深度森林算法对包含电力设备监测信息和状态评价结果的训练样本进行学习;步骤3:用训练好的深度森林模型对要进行状态评价的电力设备的电力设备监测信息给出相应的状态评价结果。

【技术特征摘要】
1.一种电力设备状态评价方法,其特征在于,用于实现基于数据驱动的电力设备状态评价,并提高样本中存在缺失值时的算法效果,该方法包括以下步骤:步骤1:获取训练样本,每条训练样本由电力设备监测数据和电力设备状态评价结果组成;步骤2:采用深度森林算法对包含电力设备监测信息和状态评价结果的训练样本进行学习;步骤3:用训练好的深度森林模型对要进行状态评价的电力设备的电力设备监测信息给出相应的状态评价结果。2.根据权利要求1所述的一种电力设备状态评价方法,其特征在于,电力设备状态评价方法以含概率权重的决策树为基本分类器,将若干决策树并联组成随机森林作为深度森林每一层的分类器,并将随机森林逐级串联组成深度森林。3.根据权利要求2所述的一种电力设备状态评价方法,其特征在于,以采用概率权重处理含缺失项样本的决策树作为基本分类器,其原理如下:设样本集D如下;其中,元素xm,n代表第m个样本的第n个属性,ym为样本数据的分类标签,ym∈{c1,c2,...,cK};对于一个节点包含的样本集,要选择一个最佳的划分方法将其划分成两个样本类别一致性更高的子集形成两个子节点,由于样本属性为连续值,要同时确定最佳的划分属性和划分值,所以采用信息熵作为描述样本集合纯度的指标,如下所示;其中,式中Pk为第k类样本所占的比重,Wm为样本m的权重。4.根据权利要求3所述的一种电力设备状态评价方法,其特征在于,决策树训练过程如下:步骤A:初始化设置树的最大深度为DPmax,创建树根节点root并使其包含所有的学习样本,初始化各样本的权重均为1,如下所示:[w1,w2,K,wM]=[1,1,K,1]设置当前待划分节点node=root;步骤B:确定划分属性和划分点设当前待划分节点中包含的样本集为D,对属性n进行遍历,寻找最大信息增益的划分属性ns和划分点vs,其中Dn为D中属性n不为空的样本集,为D中属性n缺失的样本集,ρ为属性n未缺失的样本在D中占的比重,α=1或2,分别代表左分枝和右分枝,Dn,1代表左分枝样本集合,Dn,2代表右分枝样本集合,r1和r2分别代表左分枝样本和右分枝样本在Dn中占的比重,则:Dn,1={dm|xm,n≤vn},Dn,2={dm|xm,n>vn}连续属性划分点的选取:设样本集中待划分属性共有K个不同取值,从小到大排序为{X1,X2,…,Xk},则划分点候选集合为:步骤C:创建分支节点设当前待划分节点为node,记录其划分属性和划分点:node.ns=ns,node.vs=vs创建左右分枝节点node1和node2,设置两个节点的样本集D如下式;设置新节点中的样本权重和深度,其中α=1,2;nodeα.depth=node.depth+1检查树的深度,若nodeα.depth=DPmax,设置nodeα为叶子节点,不再进行划分;若nodeα.depth<DPmax,检查新节点的纯度,若...

【专利技术属性】
技术研发人员:路军黄达文孙仝史守圆余涛
申请(专利权)人:广东电网有限责任公司广东电网有限责任公司肇庆供电局华南理工大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1