基于大数据的配电网故障预测方法及系统技术方案

技术编号:20566203 阅读:16 留言:0更新日期:2019-03-14 09:05
本发明专利技术公开了一种基于大数据的配电网故障预测方法及系统,属于电网安全维护技术领域,上述基于大数据的配电网故障预测方法包括:S1、获取原始数据;S2、利用Tableau软件对原始数据处理进而得到可以分析的样本数据,上述处理包括数据清洗、数据变换和数据集成;S3、分析配电网故障影响因素关联性;S4、基于改进的随机森林算法的故障预测模型的搭建;改进的随机森林算法生成多个分类树,上述分类树通过投票法或算术平均值决策的方式进行组合。本发明专利技术实现对地区配电网线路的故障预测。及时的发布故障预警信息,为配电网运维部门提供针对性的线路运维指导。提前消除线路故障隐患,降低配电网的故障率,提高配电网的供电可靠性。

Fault Prediction Method and System of Distribution Network Based on Large Data

The invention discloses a method and system for fault prediction of distribution network based on large data, which belongs to the technical field of power network security maintenance. The above-mentioned method for fault prediction of distribution network based on large data includes: S1, acquiring original data; S2, using Tableau software to process original data and then obtain analyzable sample data. The above-mentioned processing includes data cleaning, data transformation and data. Integration; S3, analysis of distribution network fault factors correlation; S4, fault prediction model based on Improved Stochastic Forest algorithm; improved stochastic forest algorithm generates multiple classification trees, which are combined by voting or arithmetic mean decision-making. The invention realizes fault prediction of regional distribution network lines. Publish fault early warning information in time to provide targeted line operation and maintenance guidance for distribution network operation and maintenance departments. Eliminate the hidden trouble of line fault in advance, reduce the failure rate of distribution network, and improve the reliability of distribution network.

【技术实现步骤摘要】
基于大数据的配电网故障预测方法及系统
本专利技术属于电网安全维护
,尤其涉及一种基于大数据的配电网故障预测方法及系统。
技术介绍
众所周知,电力系统中各种电压的变电所及输配电线路组成的整体,称为电力网,简称电网。它包含变电、输电、配电三个单元。电力网的任务是输送与分配电能,改变电压。电网的安全正常运营是保证人力正常生产生活的关键因素,为了保证电网的正常安全运营,需要配置一些抢修驻点。配电网直接给城市、农村的各类用电负荷供电,是国民经济和社会发展的重要公共设施。随着经济社会的发展,配电网也变得日益的复杂,配电网的运维也变得越来越重要。但是,由于配网线路的庞大,在配电网运行维护的过程中,配网线路和设备难免会发生各种各样的故障,直接影响着线路用户的供电可靠性。有必要针对配电网线路设备的特性,形成一套行之有效的方法,对线路设备进行精准运维。从而,降低线路设备的故障率。
技术实现思路
针对现有技术存在的问题,本专利技术借助于大数据手段,对线路历史故障、设备运行年限、气候天气等数据进行挖掘,利用Apriori算法和改进的随机森林算法等大数据算法搭建一个分析模型,实现对地区配电网线路的故障预测。及时的发布故障预警信息,为配电网运维部门提供针对性的线路运维指导。提前消除线路故障隐患,降低配电网的故障率,提高配电网的供电可靠性。本专利技术的目的在于提供一种基于大数据的配电网故障预测方法,包括如下步骤:S1、获取原始数据,上述原始数据包括设备数据、天气因素和外力因素;其中:上述设备数据包括设备类型、设备运行时间和设备位置;上述天气因素包括气温数据、降水量和风速;上述外力因素包括故障记录内容、故障类型和时间;S2、利用Tableau软件对原始数据处理进而得到可以分析的样本数据,上述处理包括数据清洗、数据变换和数据集成;S3、分析配电网故障影响因素关联性;具体为利用Apriori算法对样本数据进行挖掘分析,得到影响线路运行因素的故障特征值;其中:针对于设备因素,故障特征值包括设备年限和设备类型;针对于天气因素,故障特征值包括降水量、天气类型和风速;针对于外力因素,故障特征值包括故障类型和月份;S4、基于改进的随机森林算法的故障预测模型的搭建;改进的随机森林算法生成多个分类树,上述分类树通过投票法或算术平均值决策的方式进行组合。进一步:上述训练样本数据集的随机抽样采用Bagging方法。更进一步:上述S4具体为:S4.1、训练样本数据集的随机抽样;S4.2、特征子空间的随机抽样;采用Breiman提出的方法,在构建分类树的每个节点处从特征空间随机抽取同等数量的特征变量进行训练;S4.3、选择C4.5决策树算法作为随机森林内分类树的构建方法;S4.4随机森林实现过程,随机森林中的每一棵分类树为二叉树,生成遵循自顶向下的递归分裂原则,即从根节点开始依次对训练集进行划分;在二叉树中,根节点包含全部训练数据,按照节点纯度最小原则,分裂为左节点和右节点,它们分别包含训练数据的一个子集,按照同样的规则节点继续分裂,直到满足分支停止规则而停止生长,若节点n上的分类数据全部来自于同一类别,则此节点的纯度I(n)=0,纯度度量方法是Gini准则,即假设P(Xj)是节点n上属于Xj类样本个数占训练,具体实现过程如下:A、原始训练集为N,应用bootstrap法有放回地随机抽取k个新的自助样本集,并由此构建k棵分类树,每次未被抽到的样本组成了k个袋外数据;B、设有mall个变量,则在每一棵树的每个节点处随机抽取mtry个变量(mtrynmall),然后在mtry中选择一个最具有分类能力的变量,变量分类的阈值通过检查每一个分类点确定;C、每棵树最大限度地生长,不做任何修剪;D、将生成的多棵分类树组成随机森林,用随机森林分类器对新的数据进行判别与分类,分类结果按树分类器的投票多少而定;S4.5系统模型的构建与预测。本专利技术的目的在于提供一种基于大数据的配电网故障预测方法的系统,包括:原始数据获取模块,上述原始数据包括设备数据、天气因素和外力因素;其中:上述设备数据包括设备类型、设备运行时间和设备位置;上述天气因素包括气温数据、降水量和风速;上述外力因素包括故障记录内容、故障类型和时间;原始数据处理模块,利用Tableau软件对原始数据处理进而得到可以分析的样本数据,上述处理包括数据清洗、数据变换和数据集成;分析模块,分析配电网故障影响因素关联性;具体为利用Apriori算法对样本数据进行挖掘分析,得到影响线路运行因素的故障特征值;其中:针对于设备因素,故障特征值包括设备年限和设备类型;针对于天气因素,故障特征值包括降水量、天气类型和风速;针对于外力因素,故障特征值包括故障类型和月份;模型搭建模块,基于改进的随机森林算法的故障预测模型的搭建;改进的随机森林算法生成多个分类树,上述分类树通过投票法或算术平均值决策的方式进行组合。本专利技术的目的在于提供一种实现上述基于大数据的配电网故障预测方法的计算机程序。本专利技术的目的在于提供一种实现上述基于大数据的配电网故障预测方法的信息数据处理终端。本专利技术的目的在于提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行上述的基于大数据的配电网故障预测方法。综上所述,本专利技术的优点及积极效果为:本专利在于克服现有技术不足之处,本专利技术借助于大数据手段,对线路历史故障、设备运行年限、气候天气等数据进行挖掘,利用Apriori算法和改进的随机森林算法等大数据算法搭建一个分析模型,实现对地区配电网线路的故障预测。及时的发布故障预警信息,为配电网运维部门提供针对性的线路运维指导。提前消除线路故障隐患,降低配电网的故障率,提高配电网的供电可靠性。附图说明图1为本专利技术优选实施例的流程图;图2为基于随机森林算法的配电网线路故障预测模型流程图;图3为形成月度线路故障运维建议流程图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。请参阅图1,一种基于大数据的配电网故障预测方法,包括如下步骤:1、配电网故障主要影响因素分析。导致配电网故障的因素众多,本专利技术中对主要影响因素进行归纳分析。(1)设备自身因素。配电网线路上的刀闸、开关、电缆、架空线随着运行年限的增加,发生故障的概率都会有不同程度的变化,是配电网线路故障的一个重要因素。(2)天气因素。季节性气候的变化以及雨雪天气的影响也是配电网线路故障掉闸的一个重要因素。(3)外力影响。主要是人为的因素或者环境因素破坏了配网线路导致故障。2、配电网核心数据的提取。对配网故障预测需要的数据如下表表1、配网故障预测数据表3.原始数据的处理。利用Tableau软件对原始数据处理,主要包括数据清洗、数据变换和数据集成三个步骤。得到可以分析的样本数据。4、配电网故障影响因素关联性分析。利用Apriori算法对样本数据分别挖掘分析得到影响线路运行因素的故障特征值。表2、故障特征值表5.基于改进的随机森林算法的故障预测模型的搭建改进的随机森林算法生成多个分类树,这些分类树通过投票法或算术平均值决策的方式进行组合,以求得相对合理的策略结果来解决问题。5.1构建随机森林模型的本文档来自技高网...

【技术保护点】
1.一种基于大数据的配电网故障预测方法,其特征在于,包括如下步骤:S1、获取原始数据,上述原始数据包括设备数据、天气因素和外力因素;其中:上述设备数据包括设备类型、设备运行时间和设备位置;上述天气因素包括气温数据、降水量和风速;上述外力因素包括故障记录内容、故障类型和时间;S2、利用Tableau软件对原始数据处理进而得到可以分析的样本数据,上述处理包括数据清洗、数据变换和数据集成;S3、分析配电网故障影响因素关联性;具体为利用Apriori算法对样本数据进行挖掘分析,得到影响线路运行因素的故障特征值;其中:针对于设备因素,故障特征值包括设备年限和设备类型;针对于天气因素,故障特征值包括降水量、天气类型和风速;针对于外力因素,故障特征值包括故障类型和月份;S4、基于改进的随机森林算法的故障预测模型的搭建;改进的随机森林算法生成多个分类树,上述分类树通过投票法或算术平均值决策的方式进行组合。

【技术特征摘要】
1.一种基于大数据的配电网故障预测方法,其特征在于,包括如下步骤:S1、获取原始数据,上述原始数据包括设备数据、天气因素和外力因素;其中:上述设备数据包括设备类型、设备运行时间和设备位置;上述天气因素包括气温数据、降水量和风速;上述外力因素包括故障记录内容、故障类型和时间;S2、利用Tableau软件对原始数据处理进而得到可以分析的样本数据,上述处理包括数据清洗、数据变换和数据集成;S3、分析配电网故障影响因素关联性;具体为利用Apriori算法对样本数据进行挖掘分析,得到影响线路运行因素的故障特征值;其中:针对于设备因素,故障特征值包括设备年限和设备类型;针对于天气因素,故障特征值包括降水量、天气类型和风速;针对于外力因素,故障特征值包括故障类型和月份;S4、基于改进的随机森林算法的故障预测模型的搭建;改进的随机森林算法生成多个分类树,上述分类树通过投票法或算术平均值决策的方式进行组合。2.根据权利要求1所述的基于大数据的配电网故障预测方法,其特征在于:上述训练样本数据集的随机抽样采用Bagging方法。3.根据权利要求2所述的基于大数据的配电网故障预测方法,其特征在于:上述S4具体为:S4.1、训练样本数据集的随机抽样;S4.2、特征子空间的随机抽样;采用Breiman提出的方法,在构建分类树的每个节点处从特征空间随机抽取同等数量的特征变量进行训练;S4.3、选择C4.5决策树算法作为随机森林内分类树的构建方法;S4.4随机森林实现过程,随机森林中的每一棵分类树为二叉树,生成遵循自顶向下的递归分裂原则,即从根节点开始依次对训练集进行划分;在二叉树中,根节点包含全部训练数据,按照节点纯度最小原则,分裂为左节点和右节点,它们分别包含训练数据的一个子集,按照同样的规则节点继续分裂,直到满足分支停止规则而停止生长,若节点n上的分类数据全部来自于同一类别,则此节点的纯度I(n)=0,纯度度量方法是Gini准则,即假设P(Xj)是节点n上属于Xj类样本...

【专利技术属性】
技术研发人员:王钰梁刚李海科马占军田圳任肖久梁伟戚艳陈文福韩晨曦杨要中赵玲玲郭丰瑞王梓维梁程潘海泉王琳张超雄田中亮蔚鑫栋党旭鑫徐坤虎挺昊
申请(专利权)人:国网天津市电力公司国家电网有限公司
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1