The invention discloses a method and system for fault prediction of distribution network based on large data, which belongs to the technical field of power network security maintenance. The above-mentioned method for fault prediction of distribution network based on large data includes: S1, acquiring original data; S2, using Tableau software to process original data and then obtain analyzable sample data. The above-mentioned processing includes data cleaning, data transformation and data. Integration; S3, analysis of distribution network fault factors correlation; S4, fault prediction model based on Improved Stochastic Forest algorithm; improved stochastic forest algorithm generates multiple classification trees, which are combined by voting or arithmetic mean decision-making. The invention realizes fault prediction of regional distribution network lines. Publish fault early warning information in time to provide targeted line operation and maintenance guidance for distribution network operation and maintenance departments. Eliminate the hidden trouble of line fault in advance, reduce the failure rate of distribution network, and improve the reliability of distribution network.
【技术实现步骤摘要】
基于大数据的配电网故障预测方法及系统
本专利技术属于电网安全维护
,尤其涉及一种基于大数据的配电网故障预测方法及系统。
技术介绍
众所周知,电力系统中各种电压的变电所及输配电线路组成的整体,称为电力网,简称电网。它包含变电、输电、配电三个单元。电力网的任务是输送与分配电能,改变电压。电网的安全正常运营是保证人力正常生产生活的关键因素,为了保证电网的正常安全运营,需要配置一些抢修驻点。配电网直接给城市、农村的各类用电负荷供电,是国民经济和社会发展的重要公共设施。随着经济社会的发展,配电网也变得日益的复杂,配电网的运维也变得越来越重要。但是,由于配网线路的庞大,在配电网运行维护的过程中,配网线路和设备难免会发生各种各样的故障,直接影响着线路用户的供电可靠性。有必要针对配电网线路设备的特性,形成一套行之有效的方法,对线路设备进行精准运维。从而,降低线路设备的故障率。
技术实现思路
针对现有技术存在的问题,本专利技术借助于大数据手段,对线路历史故障、设备运行年限、气候天气等数据进行挖掘,利用Apriori算法和改进的随机森林算法等大数据算法搭建一个分析模型,实现对地区配电网线路的故障预测。及时的发布故障预警信息,为配电网运维部门提供针对性的线路运维指导。提前消除线路故障隐患,降低配电网的故障率,提高配电网的供电可靠性。本专利技术的目的在于提供一种基于大数据的配电网故障预测方法,包括如下步骤:S1、获取原始数据,上述原始数据包括设备数据、天气因素和外力因素;其中:上述设备数据包括设备类型、设备运行时间和设备位置;上述天气因素包括气温数据、降水量和风速;上述外力因素 ...
【技术保护点】
1.一种基于大数据的配电网故障预测方法,其特征在于,包括如下步骤:S1、获取原始数据,上述原始数据包括设备数据、天气因素和外力因素;其中:上述设备数据包括设备类型、设备运行时间和设备位置;上述天气因素包括气温数据、降水量和风速;上述外力因素包括故障记录内容、故障类型和时间;S2、利用Tableau软件对原始数据处理进而得到可以分析的样本数据,上述处理包括数据清洗、数据变换和数据集成;S3、分析配电网故障影响因素关联性;具体为利用Apriori算法对样本数据进行挖掘分析,得到影响线路运行因素的故障特征值;其中:针对于设备因素,故障特征值包括设备年限和设备类型;针对于天气因素,故障特征值包括降水量、天气类型和风速;针对于外力因素,故障特征值包括故障类型和月份;S4、基于改进的随机森林算法的故障预测模型的搭建;改进的随机森林算法生成多个分类树,上述分类树通过投票法或算术平均值决策的方式进行组合。
【技术特征摘要】
1.一种基于大数据的配电网故障预测方法,其特征在于,包括如下步骤:S1、获取原始数据,上述原始数据包括设备数据、天气因素和外力因素;其中:上述设备数据包括设备类型、设备运行时间和设备位置;上述天气因素包括气温数据、降水量和风速;上述外力因素包括故障记录内容、故障类型和时间;S2、利用Tableau软件对原始数据处理进而得到可以分析的样本数据,上述处理包括数据清洗、数据变换和数据集成;S3、分析配电网故障影响因素关联性;具体为利用Apriori算法对样本数据进行挖掘分析,得到影响线路运行因素的故障特征值;其中:针对于设备因素,故障特征值包括设备年限和设备类型;针对于天气因素,故障特征值包括降水量、天气类型和风速;针对于外力因素,故障特征值包括故障类型和月份;S4、基于改进的随机森林算法的故障预测模型的搭建;改进的随机森林算法生成多个分类树,上述分类树通过投票法或算术平均值决策的方式进行组合。2.根据权利要求1所述的基于大数据的配电网故障预测方法,其特征在于:上述训练样本数据集的随机抽样采用Bagging方法。3.根据权利要求2所述的基于大数据的配电网故障预测方法,其特征在于:上述S4具体为:S4.1、训练样本数据集的随机抽样;S4.2、特征子空间的随机抽样;采用Breiman提出的方法,在构建分类树的每个节点处从特征空间随机抽取同等数量的特征变量进行训练;S4.3、选择C4.5决策树算法作为随机森林内分类树的构建方法;S4.4随机森林实现过程,随机森林中的每一棵分类树为二叉树,生成遵循自顶向下的递归分裂原则,即从根节点开始依次对训练集进行划分;在二叉树中,根节点包含全部训练数据,按照节点纯度最小原则,分裂为左节点和右节点,它们分别包含训练数据的一个子集,按照同样的规则节点继续分裂,直到满足分支停止规则而停止生长,若节点n上的分类数据全部来自于同一类别,则此节点的纯度I(n)=0,纯度度量方法是Gini准则,即假设P(Xj)是节点n上属于Xj类样本...
【专利技术属性】
技术研发人员:王钰,梁刚,李海科,马占军,田圳,任肖久,梁伟,戚艳,陈文福,韩晨曦,杨要中,赵玲玲,郭丰瑞,王梓维,梁程,潘海泉,王琳,张超雄,田中亮,蔚鑫栋,党旭鑫,徐坤,虎挺昊,
申请(专利权)人:国网天津市电力公司,国家电网有限公司,
类型:发明
国别省市:天津,12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。