基于贝叶斯模型的输电线路运行状态关联规则挖掘及预测方法技术

技术编号:16380390 阅读:219 留言:0更新日期:2017-10-15 15:11
本发明专利技术公开了一种基于贝叶斯模型的输电线路运行状态关联规则挖掘及预测方法,其特征在于,包括以下步骤:(1)基于与输电线路运行状态相关的项集I生成频繁1‑项集L1,两两连接频繁1‑项集L1以生成候选2‑项集C2,基于该候选2‑项集C2生成频繁2‑项集L2;(2)基于频繁2‑项集L2构造贝叶斯网络;(3)根据贝叶斯网络生成关联规则R;(4)计算所述关联规则R对应的支持度和置信度,得到关联规则R的强关联规则;(5)结合关联规则R的强关联规则及其对应的置信度预测输电线路运行状态。本发明专利技术方法可以将与输电线路运行状态相关的各参量之间的关联规则应用到输电线路状态预测中,从而提高预测的精度和准确性。

Association rule mining and prediction method of transmission line running state based on Bayesian model

The invention discloses a method for mining transmission line running state of the Bayesian model based on association rules and forecasting methods, characterized by comprising the following steps: (1) and the operation state of the transmission line based on the relevant item sets to generate frequent itemsets I 1 L1, 22 L1 1 connected frequent itemsets to generate candidate 2 a set of C2, based on the 2 candidate itemsets to generate frequent itemsets C2 2 L2; (2) 2 frequent itemsets L2 structure based on the Bayesian network; (3) according to the association rules generated Bayesian network R; (4) to calculate the R association rules corresponding to the support and confidence, be strong association rules R; (5) combined with the strong association rule R and the corresponding confidence prediction of transmission line running state. The method can apply the association rules between the parameters related to the operation state of transmission lines to the state prediction of transmission lines, so as to improve the prediction accuracy and accuracy.

【技术实现步骤摘要】
基于贝叶斯模型的输电线路运行状态关联规则挖掘及预测方法
本专利技术涉及一种输电线路运行状态关联规则挖掘及预测方法,尤其涉及一种基于贝叶斯模型的输电线路运行状态关联规则挖掘及预测方法。
技术介绍
随着国民经济的高速发展,社会用电需求日益增大,电力短缺已经成为了一个经济发展的限制因素,在经济发达的长三角、珠三角地区尤为突出。目前,电网的发展明显落后于经济的发展,落后于电源的建设,使得电网输电能力的不足显得更为突出。加之电网建设受到环境、成本等因素的制约,使得建设周期长、发展速度有限,往往不能满足输电的需求。因此,在加快电网规划建设之外,通过技术改造和升级,挖掘电网输送能力潜力、提高输电效率成为了一个研究的方向。输电线路的运行状态受到气象条件、负载情况以及导线规格等多方面条件的影响。通过选取合适的预测模型,并对关键影响因素进行分析和预测,可以对输电线路运行状态进行更加合理的评估,对实际生产运行中提升效率有很大的意义。利用大量历史数据进行分析,挖掘并预测某参量的变化趋势是大数据分析的一个关键内容。现有的输电线运行状态预测方法大多局限于对单一参量的分析,并没有考虑到多参量之间的相关性。此外,由于输电线路运行环境的复杂性和动态性,对连续时间段上的系统参数分析预测并不能准确反应出线路的状态变化。因此,期望得到一种输电线路运行状态关联规则挖掘及预测方法,该方法可以将与输电线路运行状态相关的各参量之间的关联规则应用到输电线路状态预测分析评估中,从而有利于提高预测的精度。此外,该方法可以对多系统参数、环境参数的关联规则挖掘,从而提高对输电线路状态预测的准确性。
技术实现思路
本专利技术的目的是提供一种基于贝叶斯模型的输电线路运行状态关联规则挖掘及预测方法,该方法可以将与输电线路运行状态相关的各参量之间的关联规则应用到输电线路状态预测中,从而有利于提高预测的精度和准确性。根据上述专利技术目的,本专利技术提出了一种基于贝叶斯模型的输电线路运行状态关联规则挖掘及预测方法,其特征在于,包括以下步骤:(1)基于与输电线路运行状态相关的项集I生成频繁1-项集L1,两两连接频繁1-项集L1以生成候选2-项集C2,基于该候选2-项集C2生成频繁2-项集L2;(2)基于频繁2-项集L2构造贝叶斯网络;(3)根据所述贝叶斯网络生成关联规则R;(4)计算所述关联规则R对应的支持度和置信度,得到关联规则R的强关联规则;(5)结合所述关联规则R的强关联规则及其对应的置信度预测输电线路运行状态。为便于理解,首先对本专利技术涉及的原理进行阐述:贝叶斯网络(BayesianNetwork,BN)为关联规则挖掘提供了一个对不确定性知识表示和推理的框架,具备以任意结点出发推理其余各结点状态的能力。贝叶斯网络是概率统计和图论结合的模型,表示随机变量间依赖性和独立性的网络模型,为不确定问题和复杂问题提供了直观的表示方法。贝叶斯网络是有向无环图,用弧来表示各变量之间的依赖关系,概率分布表表示变量之间依赖关系的强弱,且基于后验概率的贝叶斯定理,能够进行严密的推理计算。本专利技术应用贝叶斯网络对输电线路与输电线路运行状态相关的各参量之间关联关系的挖掘。贝叶斯网络主要由两部分构成,分别为描述依赖关系结构的有向无环图与描述依赖关系强弱的条件概率表,有向无环图由节点与向边构成。每一个节点对应于一个随机变量,在本专利技术中用于描述与输电线路运行状态相关的各参量;每一条向边对应随机变量间的依赖关系,箭头体现出因果的方向性,条件概率表则描述了节点之间的依赖关系强弱。贝叶斯网络的链式规则依据条件概率给出,以随机变量集X={X1,X2,…,Xn}为例,联合概率为:贝叶斯网络具有一条重要性质,节点在其父节点确定时,该节点条件独立于所有非父节点。基于此性质。联合概率可以化简为:其中,Parents(Xi)表示节点Xi的父节点联合,概率值从条件概率表中可以查出。关联规则挖掘可以发现数据库中数据之间的联系,而这些联系是预先未知的,不能通过逻辑操作和统计方法得到,不是数据本身的自有属性,而是基于数据间同时出现的特征。关联规则挖掘问题可以形式化描述如下:事务:设I={i1,i2,…,im}是m个不同项目组成的集合,ik(k=1,2,…,m)称为项目(Item)。DB为针对I的事务数据库,每个事务T是I中一组属性的集合,即并有一个唯一的标识符TID。项集X的支持度Support(X):项集X的支持度表示X的重要性,X可以为已知的频繁项集。事务数据库中支持项集X的事务数称作项集X的支持数,记为X.Count。设|DB|为事务数据库的总数,则项集X的支持度记为:Support(X)=X.Count/|DB|(3)最小支持度:发现任务的最小支持度,满足最小支持度的项集才会在关联规则中出现,称为频繁项集,否则称为弱项集。规则置信度:规则置信度表示规则的可靠性程度。对于关联规则:记X为前项,Y为后项,则R关联规则的置信度为:Confidence(R)=Support(X∪Y)/Support(X)(5)若R的置信度大于最小置信度,则称为强关联规则,若小于最小置信度,则称为弱关联规则。目前常用的关联规则挖掘算法有Apriori、AprioriTid和AprioriHybrid算法。其中Apriori算法通过扫描数据库寻找频繁项集,循环计算直至没有新的频繁项集产生,但由于数据库通常规模庞大,每一次迭代计算支持度消耗大量资源。AprioriTid法使用逐渐减少的候选数据库来计算候选强项集的支持数,提升了计算效率。AprioriHybrid算法是前两者的结合,在候选数据库能够装入内存时使用AprioriTid算法,否则采用Apriori算法。Apriori关联规则挖掘的步骤主要分为两部分:1)识别目标数据集中的所有频繁项集,即支持度不低于设定最小支持度的项集;2)从上述频繁项集中构造所有置信度不低于设定最小置信度的关联规则。Apriori算法在产生维度更高的频繁项集(例如频繁2-项集)之后,需要再次扫描数据库以计算支持度,而基于贝叶斯网络的关联规则挖掘方法可以避免该再次扫描,以贝叶斯网络的形式表示一次扫描数据库产生的频繁2-项集,并据此找出关联规则。基于贝叶斯网络的关联规则挖掘方法假设得到的贝叶斯网络由n个节点与l条边构成,遍历该有向无环图复杂度为O(n+n2+l)。由于数据量远远大于节点数,因此,通过该方法生成关联规则的方法效率高于由Apriori算法直接得到关联规则的方法。将关联规则引入预测输电线路运行状态的神经网络,使得更加关注数据间的关联性,从而提升预测精度和准确度。本专利技术所述的基于贝叶斯模型的输电线路运行状态关联规则挖掘及预测方法中,所述项集I的项目包括与输电线路运行状态相关的各参量。从以上原理可知,频繁1-项集L1表征重要的参量。频繁2-项集L2表征重要的参量两两间的重要的联系,因此可以基于频繁2-项集L2构造贝叶斯网络。本专利技术采用挖掘算法挖掘所有频繁项集,利用贝叶斯网络找到所有关联规则,并计算每条关联规则的支持度和置信度,从而避免了频繁项集维数增加后仍需要扫描数据库带来的巨大计算量。本专利技术在传统关联规则挖掘方法的基础上引入贝叶斯网络,将与输电线路运行状态相关的各参量之间的关联规则应用到输电线路状态预测中,从而有利于提本文档来自技高网...
基于贝叶斯模型的输电线路运行状态关联规则挖掘及预测方法

【技术保护点】
一种基于贝叶斯模型的输电线路运行状态关联规则挖掘及预测方法,其特征在于,包括以下步骤:(1)基于与输电线路运行状态相关的项集I生成频繁1‑项集L1,两两连接频繁1‑项集L1以生成候选2‑项集C2,基于该候选2‑项集C2生成频繁2‑项集L2;(2)基于频繁2‑项集L2构造贝叶斯网络;(3)根据所述贝叶斯网络生成关联规则R;(4)计算所述关联规则R对应的支持度和置信度,得到关联规则R的强关联规则;(5)结合所述关联规则R的强关联规则及其对应的置信度预测输电线路运行状态。

【技术特征摘要】
1.一种基于贝叶斯模型的输电线路运行状态关联规则挖掘及预测方法,其特征在于,包括以下步骤:(1)基于与输电线路运行状态相关的项集I生成频繁1-项集L1,两两连接频繁1-项集L1以生成候选2-项集C2,基于该候选2-项集C2生成频繁2-项集L2;(2)基于频繁2-项集L2构造贝叶斯网络;(3)根据所述贝叶斯网络生成关联规则R;(4)计算所述关联规则R对应的支持度和置信度,得到关联规则R的强关联规则;(5)结合所述关联规则R的强关联规则及其对应的置信度预测输电线路运行状态。2.如权利要求1所述的基于贝叶斯模型的输电线路运行状态关联规则挖掘及预测方法,其特征在于,所述步骤(1)和步骤(2)之间还包括步骤:筛选频繁2-项集L2。3.如权利要求1所述的基于贝叶斯模型的输电线路运行状态关联规则挖掘及预测方法,其特征在于,所述步骤(1)中,采用Apriori算法、AprioriTid算法以及AprioriHybrid算法的其中之一通过扫描项集I生成频繁1-项集L1。4.如权利要求1所述的基于贝叶斯模型的输电线路运行状态关联规则挖掘及预...

【专利技术属性】
技术研发人员:杨越文侯慧娟盛戈皞陈玉峰杨祎郭志红林颖
申请(专利权)人:上海交通大学国网山东省电力公司电力科学研究院
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1