一种用于配电网故障预测的改进随机森林算法制造技术

技术编号:26731683 阅读:45 留言:0更新日期:2020-12-15 14:34
一种用于配电网故障预测的改进随机森林算法,属电力数据分析处理领域。其根据相关的电网运行数据源,随机森林在计算两个样本之间的相似度时,用生成的每一棵树对所有样本进行判别,每个样本都会落于该树的同一节点或不同个叶子节点;如果两个样本落在该树的同一个叶子节点上,则在相似度矩阵的相应位置加1;如果落在不同的叶子节点,根据叶子节点之间的路径距离与样本之间相似程度高低关系,确定相似度矩阵。其通过改进随机森林样本相似度的计算方法,充分考虑了叶子节点路径距离的度量,并且将改进的样本相似度用于馈线的月故障等级分类问题,能取得相比原有方法更好的分类效果,从而增加配电网馈线的月故障等级预测准确率。

【技术实现步骤摘要】
一种用于配电网故障预测的改进随机森林算法
本专利技术属于电力数据分析处理领域,尤其涉及一种利用大数据通过改进的随机森林算法构建馈线故障预测模型进行馈线月故障等级的预测方法。
技术介绍
目前,已应用于配电网故障预测的各类数据挖掘算法繁多。算法的适用范围和优势不同,如何在配电网故障预测中充分发挥算法的优势同时避免算法的缺点是关键。近年来,数据挖掘技术中以机器学习理论为基础的数据挖掘预测建模算法开始崭露头角。其中典型代表有三种,分别为;人工神经网络(ANN)、支持向量机(SVM)和决策树算法。ANN是基于经验风险最小化原则的学习算法,但本身存在过拟合、泛化误差大、隐单元数难确定等问题。相对于ANN算法,SVM能够获得较好的泛化性能,但也存在核函数只能凭经验选取、核参数及惩罚参数难确定的问题。决策树算法具有较高的精确度、抗噪能力,而将多个决策树通过集成学习方法聚集起来的随机森林算法相对传统的决策树算法具有更强的泛化能力和分类效果,并且具有可避免过拟合、泛化误差有上限和调节参数少等优点。然而,随机森林分类算法的分类精度虽然相对较高,但是在不同数据本文档来自技高网...

【技术保护点】
1.一种用于配电网故障预测的改进随机森林算法,其特征是:/n根据相关的电网运行数据源,随机森林在计算两个样本之间的相似度时,用生成的每一棵树对所有样本进行判别,每个样本都会落于该树的同一节点或不同个叶子节点;如果两个样本落在该树的同一个叶子节点上,则在相似度矩阵的相应位置加1;如果落在不同的叶子节点,根据叶子节点之间的路径距离与样本之间相似程度高低关系,确定相似度矩阵。/n

【技术特征摘要】
1.一种用于配电网故障预测的改进随机森林算法,其特征是:
根据相关的电网运行数据源,随机森林在计算两个样本之间的相似度时,用生成的每一棵树对所有样本进行判别,每个样本都会落于该树的同一节点或不同个叶子节点;如果两个样本落在该树的同一个叶子节点上,则在相似度矩阵的相应位置加1;如果落在不同的叶子节点,根据叶子节点之间的路径距离与样本之间相似程度高低关系,确定相似度矩阵。


2.按照权利要求1所述的用于配电网故障预测的改进随机森林算法,其特征是两个所述节点的路径距离,为这两个节点的最近公共祖先分别到这两个结点的路径长度之和;两个节点之间路径距离越近,表示它们从同一分支分裂而来的概率越大,叶子节点上样本在某些属性值上的分布就越相近,样本相似度也就越髙。


3.按照权利要求1所述的用于配电网故障预测的改进随机森林算法,其特征是所述的改进随机森林算法,增加考虑叶子节点不同时的情况,叶子之间的路径距离越大,则它们之间的相似性越低,反之则越高;
其样本之间相似性的计算公式为:



其中,i,j是样本编号,l为样本所在叶子节点之间...

【专利技术属性】
技术研发人员:陆黎明贝翔飚徐姗姗朱佳佳余捷钱晓军张萌亮忻葆宏李帆
申请(专利权)人:国网上海市电力公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1