一种基于决策树算法的电能表功能异常评估方法及系统技术方案

技术编号:28980546 阅读:9 留言:0更新日期:2021-06-23 09:27
本发明专利技术提供一种基于决策树算法的电能表功能异常评估方法及系统,其中方法包括:对获取到的原始测量数据进行预处理得到样本数据,以剔除原始测量数据中的噪声数据;根据历史工单对第一异常判定规则进行改进,得到第二异常判定规则并提取特征项数据;通过所述训练集数据,利用C4.5算法搭建决策树模型,并由所述测试集数据对所述决策树模型进行剪枝优化处理,生成基于决策树算法的计量设备功能异常评估模型;将所述特征项数据输入所述计量设备功能异常评估模型,得到异常的判定结果。本发明专利技术利用功能异常的历史反馈工单提出了异常判定规则的修改建议,合理考虑了电表实际运行中的不同因素的影响,避免了几种较为普遍的误判情形,降低了运维成本。

【技术实现步骤摘要】
一种基于决策树算法的电能表功能异常评估方法及系统
本专利技术涉及智能电表仪器检测
,特别是涉及一种基于决策树算法的电能表功能异常评估方法及系统。
技术介绍
由于国民经济的快速发展,日渐庞大的用电需求为电网运营管理提出了更高的要求,为保证向用户提供精准服务,信息化技术手段在电力系统得到越来越多的应用。然而,计量设备智能水平的不断提升也带来了新的问题,设备复杂性的持续增加使得计量装置异常表现的持续更加。各种类型的电能计量装置异常问题很大程度上影响着电网和用户之间的利益。对电能表进行运行监测和状态评估,及时发现计量设备功能异常情况并采取措施处理,保证设备的稳定运行,实现计量的可靠、准确,不仅有利于电网公司的经济效益和用户的切身利益,更有利于社会的和谐稳定。随着“互联网+”时代的来临,电力公司信息化工作日渐完善,用电信息采集数据的广度和深度也逐步提高,大数据特征愈专利技术显,如何通过上述海量的数据及时的判知各类异常,及早发现设备隐患并完成现场处置,已成为智能化运维工作的迫切需求。目前国内研究电能计量设备功能异常主要方法是基于用户用电信息采集系统,包括智能电表在内地各种采集终端都可以自主地诊断自身运行状态,及时发现运行过程中自身出现的各种异常并实时上报到采集系统主站。这些采集信息如用户用电电量、电压、电流、频率等电能状态量为计量设备的远程监测提供了数据基础。但是,现有技术存在以下问题:(1)现行的功能异常诊断方法准确度还有提升空间,对现场故障存在较多误判情形,易将电参量的偶然波动判断为功能异常,造成时间和人力的耗费,给用户带来不便,导致电能表运行的维护成本过高;(2)模型适应性较差,基于某些实验地区的数据特征得到的诊断方案对数据的依赖性较强,对于用户用电特征有差异的地区不适用,对电网的实际情况缺乏考虑;(3)对异常产生的原因缺乏机理分析和实际数据验证,异常特征建模还需要考虑其与异常产生原因之间的关系,并通过现场反馈从而不断的完善。(4)决策树分类算法还不够完善,需要搜集大量现场实例完善运维反馈信息,对算法进行优化。
技术实现思路
为解决以上现有技术的问题,本专利技术提供一种基于决策树算法的电能表功能异常评估方法及系统,对计量装置在线功能异常评估模型进行完善,提升功能异常分析的准确度,提高功能异常的诊断效率,为智能化运维提供支撑。本专利技术一个实施例提供一种基于决策树算法的电能表功能异常评估方法,包括:对获取到的原始测量数据进行预处理得到样本数据,以剔除原始测量数据中的噪声数据;其中,所述样本数据包括:训练集数据及测试集数据;根据历史工单对第一异常判定规则进行改进,得到第二异常判定规则并提取特征项数据;通过所述训练集数据,利用C4.5算法搭建决策树模型,并由所述测试集数据对所述决策树模型进行剪枝优化处理,生成基于决策树算法的计量设备功能异常评估模型;将所述特征项数据输入所述计量设备功能异常评估模型,得到异常的判定结果。进一步地,所述对获取到的原始测量数据进行预处理得到样本数据,具体地:根据局部异常因子算法检测所述原始测量数据,将异常数据及缺失数据进行填充或过滤。进一步地,所述将所述特征项数据输入所述计量设备功能异常评估模型,包括:基于所述C4.5算法,计算所述特征项数据的信息增益;将所述信息增益最大值所对应的特征项数据作为决策树根节点;根据所述根节点的不同取值对应的子集递归生成决策树子节点,直至满足决策树生成条件。进一步地,所述通过所述训练集数据,利用C4.5算法搭建决策树模型,包括:获取目标样本个数占训练总样本的比例;通过所述目标样本个数占训练总样本的比例计算训练集的类别信息熵;所述训练集的类别信息熵通过以下公式进行计算:其中,Info(S)为训练集的类别信息熵,pi为目标样本个数占训练总样本的比例;通过目标样本概率计算以特征项数据划分的条件信息熵;所述以特征项数据划分的条件信息熵通过以下公式进行计算:其中,Info(Sj)为Sj以特征项数据A划分的条件信息熵,pij为Sj种目标样本概率;将所述训练集以预设规则进行划分,得到若干子训练集;通过所述训练集的类别信息熵、所述子训练集,计算特征项数据的条件信息熵;所述特征项数据的条件信息熵通过以下公式进行计算:其中,InfoA(S)为特征项数据A的条件信息熵,Sj表示按照特征项数据A为分裂特征,若特征项数据A由K个不相关的值,则训练集集S被划分为{S1,...,SK}训练子集,Info(Sj)为Sj以特征项数据A划分的训练集的类别信息熵;根据所述训练集的类别信息熵及所述特征项数据的条件信息熵计算条件特征项数据的信息增益;通过以下公式进行计算:Gain(A,S)=Info(S)-InfoA(S);其中,Gain(A,S)为条件特征项数据的信息增益,Info(S)为训练集的类别信息熵,InfoA(S)为特征项数据A的条件信息熵;通过当前样本个数占训练总样本的比例计算特征项数据在样本中的信息熵;所述特征项数据在样本中的信息熵通过以下公式计算:其中,Info(A)为特征项数据在样本中的信息熵,pj为当前样本个数占训练总样本的比例;通过所述条件特征项数据的信息增益及所述特征项数据在样本中的信息熵计算特征量项数据的信息增益;所述特征量项数据的信息增益通过以下公式进行计算:其中,Gain(A,S)为条件特征项数据的信息增益,Info(A)为特征项数据在样本中的信息熵。进一步地,所述由所述测试集数据对所述决策树模型进行剪枝优化处理,包括:根据叶子节点的误差率及叶子节点归类的数据占所有数据的比例计算叶子节点的误差代价;所述叶子节点的误差代价通过以下公式计算:C(t)=e(t)p(t);其中,C(t)是叶子节点t的误差代价,e(t)为叶子节点的误差率,p(t)为叶子节点归类的数据占所有数据的比例;根据所述叶子节点的误差代价、子树生长的叶子节点数、子树的误差代价计算树中每一个子树的表面误差率增益,所述树中每一个子树的表面误差率增益通过以下公式进行计算:其中,α为每一个子树Tt的表面误差率增益,C(t)是叶子节点t的误差代价,C(Tt)是子树Tt的误差代价,其值为子树Tt所包含的所有叶子节点的误差代价之和,是子树生长的叶子节点数;选取子树的表面误差率增益最小的子树,将其生成的分支进行剪枝;当多个子树的表面误差率增益同时到达最小时,取子树生长的叶子节点数最大的进行剪枝,直至到达模型的评估要求为止。本专利技术一实施例提供一种基于决策树算法的电能表功能异常评估系统,包括:预处理模块,用于对获取到的原始测量数据进行预处理得到样本数据,以剔除原始测量数据中的噪声数据;其中,所述样本数据包括:训练集数据及测试集数据;异常判定规则改进模块,用于根据历史工单对第一异常判定规则进行改进,得本文档来自技高网
...

【技术保护点】
1.一种基于决策树算法的电能表功能异常评估方法,其特征在于,包括:/n对获取到的原始测量数据进行预处理得到样本数据,以剔除原始测量数据中的噪声数据;其中,所述样本数据包括:训练集数据及测试集数据;/n根据历史工单对第一异常判定规则进行改进,得到第二异常判定规则并提取特征项数据;/n通过所述训练集数据,利用C4.5算法搭建决策树模型,并由所述测试集数据对所述决策树模型进行剪枝优化处理,生成基于决策树算法的计量设备功能异常评估模型;/n将所述特征项数据输入所述计量设备功能异常评估模型,得到异常的判定结果。/n

【技术特征摘要】
1.一种基于决策树算法的电能表功能异常评估方法,其特征在于,包括:
对获取到的原始测量数据进行预处理得到样本数据,以剔除原始测量数据中的噪声数据;其中,所述样本数据包括:训练集数据及测试集数据;
根据历史工单对第一异常判定规则进行改进,得到第二异常判定规则并提取特征项数据;
通过所述训练集数据,利用C4.5算法搭建决策树模型,并由所述测试集数据对所述决策树模型进行剪枝优化处理,生成基于决策树算法的计量设备功能异常评估模型;
将所述特征项数据输入所述计量设备功能异常评估模型,得到异常的判定结果。


2.如权利要求1所述的一种基于决策树算法的电能表功能异常评估方法,其特征在于,所述对获取到的原始测量数据进行预处理得到样本数据,具体地:
根据局部异常因子算法检测所述原始测量数据,将异常数据及缺失数据进行填充或过滤。


3.如权利要求1所述的一种基于决策树算法的电能表功能异常评估方法,其特征在于,所述将所述特征项数据输入所述计量设备功能异常评估模型,包括:
基于所述C4.5算法,计算所述特征项数据的信息增益;
将所述信息增益最大值所对应的特征项数据作为决策树根节点;
根据所述根节点的不同取值对应的子集递归生成决策树子节点,直至满足决策树生成条件。


4.如权利要求3所述的一种基于决策树算法的电能表功能异常评估方法,其特征在于,所述通过所述训练集数据,利用C4.5算法搭建决策树模型,包括:
获取目标样本个数占训练总样本的比例;
通过所述目标样本个数占训练总样本的比例计算训练集的类别信息熵;所述训练集的类别信息熵通过以下公式进行计算:



其中,Info(S)为训练集的类别信息熵,pi为目标样本个数占训练总样本的比例;
通过目标样本概率计算以特征项数据划分的条件信息熵;所述以特征项数据划分的条件信息熵通过以下公式进行计算:



其中,Info(Sj)为Sj以特征项数据A划分的条件信息熵,pij为Sj种目标样本概率;
将所述训练集以预设规则进行划分,得到若干子训练集;
通过所述训练集的类别信息熵、所述子训练集,计算特征项数据的条件信息熵;所述特征项数据的条件信息熵通过以下公式进行计算:



其中,InfoA(S)为特征项数据A的条件信息熵,Sj表示按照特征项数据A为分裂特征,若特征项数据A由K个不相关的值,则训练集集S被划分为{S1,...,SK}训练子集,Info(Sj)为Sj以特征项数据A划分的训练集的类别信息熵;
根据所述训练集的类别信息熵及所述特征项数据的条件信息熵计算条件特征项数据的信息增益;通过以下公式进行计算:
Gain(A,S)=Info(S)-InfoA(S);
其中,Gain(A,S)为条件特征项数据的信息增益,Info(S)为训练集的类别信息熵,InfoA(S)为特征项数据A的条件信息熵;
通过当前样本个数占训练总样本的比例计算特征项数据在样本中的信息熵;所述特征项数据在样本中的信息熵通过以下公式计算:



其中,Info(A)为特征项数据在样本中的信息熵,pj为当前样本个数占训练总样本的比例;
通过所述条件特征项数据的信息增益及所述特征项数据在样本中的信息熵计算特征量项数据的信息增益;所述特征量项数据的信息增益通过以下公式进行计算:



其中,Gain(A,S)为条件特征项数据的信息增益,Info(A)为特征项数据在样本中的信息熵。


5.如权利要求1所述的一种基于决策树算法的电能表功能异常评估方法,其特征在于,所述由所述测试集数据对所述决策树模型进行剪枝优化处理,包括:
根据叶子节点的误差率及叶子节点归类的数据占所有数据的比例计算叶子节点的误差代价;所述叶子节点的误差代价通过以下公式计算:
C(t)=e(t)p(t);
其中,C(t)是叶子节点t的误差代价,e(t)为叶子节点的误差率,p(t)为叶子节点归类的数据占所有数据的比例;
根据所述叶子节点的误差代价、子树生长的叶子节点数、子树的误差代价计算树中每一个子树的表面误差率增益,所述树中每一个子树的表面误差率增益通过以下公式进行计算:



其中,α为每一个子树Tt的表面误差率增益,C(t)是叶子节点t的误差代价,C(Tt)是子树Tt的误差代价,其值为子树Tt所包含的所有叶子节点的误差代价之和,是子树生长的叶子节点数;
选取子树的表面误差率增益最小的子树,将其生成的分支进行剪枝;当多个子树的表面误差率增益同时到达最小时,取子树生长的叶子节点数最大的进行剪枝,直至到达模型的评估要求为止。


6.一种...

【专利技术属性】
技术研发人员:黄友朋路韬化振谦唐捷招景明纪伊琳
申请(专利权)人:广东电网有限责任公司计量中心
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1