基于FP-growth的跳闸明细数据与气象数据关联分析及预警方法技术

技术编号:18862454 阅读:73 留言:0更新日期:2018-09-05 15:03
本发明专利技术公开了一种基于FP‑growth的跳闸明细数据与气象数据关联分析方法,获取电力系统的跳闸明细数据并统一格式,读取跳闸明细数据的故障地理坐标与故障发生时间,获取历史气象数据,并对历史气象数据中的每种天气数据进行聚类化,建立跳闸明细数据与历史气象数据的连接,根据跳闸明细数据与历史气象数据,建立样本数据库,采用FP‑growth算法挖掘样本数据库中各项或项集之间的强关联规则,以强关联规则作为跳闸明细数据与气象数据的关联规则,从而完成跳闸明细数据与气象数据关联分析。本发明专利技术能够快速且多维度、多层次地挖掘出气象数据与电力系统跳闸明细数据的关联规则。本发明专利技术还公开了利用关联规则进行跳闸故障预警的方法。

Correlation analysis and early warning method of trip detail data and meteorological data based on FP-growth

The invention discloses an association analysis method of tripping detail data and meteorological data based on FP growth, obtains tripping detail data of power system and unifies the format, reads fault geographic coordinates and fault occurrence time of tripping detail data, obtains historical meteorological data, and obtains each weather data of historical meteorological data. Clustering is used to establish the connection between tripping detail data and historical meteorological data. According to the tripping detail data and historical meteorological data, a sample database is established. FP growth algorithm is used to mine strong association rules between items or itemsets in the sample database. Strong association rules are used as the gateway between tripping detail data and meteorological data. Association rules are used to complete the correlation analysis between trip detail data and meteorological data. The invention can quickly and multi-dimensionally and multi-hierarchically mine the association rules between meteorological data and detailed data of power system tripping. The invention also discloses a method for early warning of tripping fault by using association rules.

【技术实现步骤摘要】
基于FP-growth的跳闸明细数据与气象数据关联分析及预警方法
本专利技术涉及电力系统运维
,具体涉及一种分析气象数据与电力系统跳闸明显数据的关联规则的方法,还涉及一种利用关联规则进行跳闸故障预警的预警方法。
技术介绍
电力输电线路暴露在自然环境中,实际运行环境对线路的运行状态具有不可避免的重要影响,通过多种物理化学变化加速输电设备电气、机械及其他性能的劣化,严重时会引发突然性的设备失效,因此深入研究气象环境与线路故障跳闸之间的密切联系具有重要的实用价值。目前随着气象科学技术的迅速发展进步,气象部门可提供更为丰富、高质量的气象数据产品,再加以电力部门多年架设的大量微气象监测装置,反映输电线路实际运行环境的气象数据在急剧增加;另外经过电网运营部门多年管理实践,积累了丰富的线路故障跳闸明细数据,具有信息量大、格式规范的特点,可为线路故障跳闸研究提供丰富数据。但是,目前关于线路跳闸与气象数据之间的关系还未被挖掘揭示出来,还不能利用气象数据对跳闸事故进行预测。面对日益丰富的大量数据,已有的挖掘数据之间关联规则的方法主要采用Apriori算法,该算法作为关联规则挖掘的经典算法,基于其核心理论:“频繁项集的子集是频繁项集;非频繁项集的超集是非频繁项集”,显示出良好的性能,但随着数据库的增大,同时也存在两个致命的性能瓶颈:1.产生大量的候选集;2.多次扫描数据库,需要相当大的I/O负载。随着电力系统运行记录数据及相关气象数据的数据量增长,势必需要更为高效可靠的数据挖掘算法。Han等人提出了一种不产生候选集的发现频繁项集的挖掘方法FP-growth,它使用一种FP-tree形式的数据结构压缩数据,在产生频繁项集的过程中采用分治策略自底向上生成后缀项集并构造条件FP-tree,进而探索某个特定项结尾的频繁项集。实验证明,生成的FP-tree足够小或路径重叠较多时,FP-growth算法的运算速度比Apriori算法快几个数量级。如附图1所示,随着事务数量的增多,FP-growth算法的运算效率更愈专利技术显。本专利技术据此提出了一种基于FP-growth算法的电力系统气象数据与跳闸明细数据关联规则分析方法。
技术实现思路
针对上述现有技术的不足,本专利技术提供一种基于FP-growth的跳闸明细数据与气象数据关联分析方法,解决现有技术中还未揭露气象数据与电力系统跳闸明细数据的关联规则的技术问题,能够快速挖掘出气象数据与电力系统跳闸明细数据的关联规则,能够多维度、多层次的挖掘出关联规则。为了解决上述技术问题,本专利技术采用了如下的技术方案:一种基于FP-growth的跳闸明细数据与气象数据关联分析方法,包括以下步骤:步骤1:获取电力系统的跳闸明细数据,跳闸明细数据包含n种类型的跳闸数据,并统一跳闸明细数据的格式,从而使同一类型并具有相同含义的跳闸数据具有统一的格式;步骤2:读取跳闸明细数据的故障地理坐标与故障发生时间;步骤3:获取历史气象数据,每条历史气象数据包含有m种不同类型的天气数据,并分别对每种类型的天气数据进行聚类化;步骤4:根据历史气象数据的监测时间与故障发生时间的对应关系,以及历史气象数据的监测点地理坐标与故障地理坐标的对应关系,建立跳闸明细数据与历史气象数据的连接,从而使得每条跳闸明细数据都有对应的历史气象数据;步骤5:以每次跳闸事件作为一个事务,每个事务中包含跳闸明细数据以及该跳闸明细数据对应连接的历史气象数据;以事务中跳闸明细数据中的n种类型的跳闸数据对应作为事务中的n个项目,以事务中历史气象数据中的m项天气数据对应作为事务中的m个项目,从而使得每个事务包含m+n个项目;采集若干事务建立样本数据库;步骤6:采用FP-growth算法挖掘样本数据库中项目或各项集之间的强关联规则,所述项集为包含项目的集合:设置支持度阈值以及置信度阈值,以样本数据库作为输入,通过频繁模式树FP-tree挖掘频繁项集,所述频繁项集是指满足支持度阈值的项集;从频繁项集中筛选出同时满足支持度阈值与置信度阈值的频繁项集作为强关联规则;步骤7:以强关联规则作为跳闸明细数据与气象数据的关联规则,从而完成跳闸明细数据与气象数据关联分析。优选的,历史气象数据按如下方式进行聚类化:分别将每种类型的天气数据的测量范围划分成若干聚类区间;将落入同一聚类区间内的同一类型的历史气象数据归为同一聚类项。优选的,步骤401:将时间划分为若干时间区间,落入同一时间区间的时间点则归为同类时间,并为属于同类时间的时间点赋予相同的时间ID,从而使得属于同类时间的历史气象数据的监测时间与跳闸明细数据的故障发生时间具有相同的时间ID;步骤402:采用网格进行地理区域划分,得到若干网格区域,并对每个网格区域赋予一个网格ID,从而使得落入同一网格区域的历史气象数据的监测点地理坐标与跳闸明细数据的故障地理坐标具有相同的网格ID;步骤403:将具有相同网格ID且具有相同时间ID的跳闸明细数据与历史气象数据一一对应起来,从而实现跳闸明细数据与历史气象数据的连接。优选的,所述跳闸明细数据包括以下类型的跳闸数据:电压等级、运维单位、跳闸原因以及重合闸是否成功。优选的,所述历史气象数据包括以下类型的天气数据:风速、风向、气温、湿度、24h降雨量、12h降雨量以及光照强度。本专利技术还提供一种电网系统的跳闸故障预警方法,采用上述的基于FP-growth算法的跳闸明细数据与气象数据关联分析方法挖掘出跳闸明细数据与气象数据的关联规则,并利用所述关联规则进行跳闸故障预警。与现有技术相比,本专利技术具有以下有益效果:1、统一跳闸明细数据的格式使得相同含义的跳闸数据在形式上也相同,从而在构造样本数据库时相同含义的跳闸数据则属于同一项目,从而在采用FP-growth算法进行关联规则挖掘时,使得相同跳闸数据构成的相同项目之间能够组成项集,从而能够更好的挖掘出跳闸的内因,即由电网系统自身的原因导致跳闸。当然,由跳闸数据构成的项目与由天气数据构成的项目之间组成项集,则能挖掘出跳闸的外因,即由天气原因导致的跳闸。2、通过设置网格ID与时间ID来进行跳闸明细数据与历史气象数据的连接,能够提高连接的速度,减速运算量;并且由于天气在一定时间段和一定的区域范围内并不会有太大的差异,因此对时间进行区间划分,使得虽然在时间点上不能完全一致的历史气象数据监测时间与跳闸明细数据的故障发生时间能够对应起来;同样的,对地理区域进行划分,使得虽然在坐标点上不能完全一致的历史气象数据的监测点地理坐标与跳闸明细数据的故障地理坐标能够对应起来;这样大大降低了对气象监测点的布局密度要求以及监测频率要求,利用现有的气象监测系统便能实现,无需再增设气象监测点。3、对每种类型的天气数据进行聚类化,是考虑到由于测量的误差,同类型的天气数据在形式上虽然不同,但是本质上是相同的情况,这样更利于FP-Growth算法挖掘出本质性的关联规则。另外,聚类化后能够将数值化天气数据转化为文本数据。4、在分析电力系统历史跳闸明细数据时融入了线路运行环境信息——气象数据,工作人员只需要将气象数据与线路跳闸明细数据按相近的时间、位置连接起来,统一数据格式;由于气象数据包括了气温、风速、风向、湿度、降水量等维度,然后跳闸明细数据包括故障时间、线路、故障类型、重合闸是否成功本文档来自技高网
...

【技术保护点】
1.一种基于FP‑growth的跳闸明细数据与气象数据关联分析方法,其特征在于:包括以下步骤:步骤1:获取电力系统的跳闸明细数据,跳闸明细数据包含n种类型的跳闸数据,并统一跳闸明细数据的格式,从而使同一类型并具有相同含义的跳闸数据具有统一的格式;步骤2:读取跳闸明细数据的故障线路名称、故障地理坐标以及故障发生时间;步骤3:获取历史气象数据,每条历史气象数据包含有m种不同类型的天气数据,并分别对每种类型的天气数据进行聚类化;步骤4:根据历史气象数据的监测时间与故障发生时间的对应关系,以及历史气象数据的监测点地理坐标与故障地理坐标的对应关系,建立跳闸明细数据与历史气象数据的连接,从而使得每条跳闸明细数据都有对应的历史气象数据;步骤5:以每次跳闸事件作为一个事务,每个事务中包含跳闸明细数据以及该跳闸明细数据对应连接的历史气象数据;以事务中跳闸明细数据中的n种类型的跳闸数据对应作为事务中的n个项目,以事务中历史气象数据中的m项天气数据对应作为事务中的m个项目,从而使得每个事务包含m+n个项目;采集若干事务建立样本数据库;步骤6:采用FP‑growth算法挖掘样本数据库中各项目或项集之间的强关联规则,所述项集为包含项目的集合:设置支持度阈值以及置信度阈值,以样本数据库作为输入,通过频繁模式树FP‑tree挖掘频繁项集,所述频繁项集是指满足支持度阈值的项集;从频繁项集中筛选出同时满足支持度阈值与置信度阈值的频繁项集作为强关联规则;步骤7:以强关联规则作为跳闸明细数据与气象数据的关联规则,从而完成跳闸明细数据与气象数据关联分析。...

【技术特征摘要】
1.一种基于FP-growth的跳闸明细数据与气象数据关联分析方法,其特征在于:包括以下步骤:步骤1:获取电力系统的跳闸明细数据,跳闸明细数据包含n种类型的跳闸数据,并统一跳闸明细数据的格式,从而使同一类型并具有相同含义的跳闸数据具有统一的格式;步骤2:读取跳闸明细数据的故障线路名称、故障地理坐标以及故障发生时间;步骤3:获取历史气象数据,每条历史气象数据包含有m种不同类型的天气数据,并分别对每种类型的天气数据进行聚类化;步骤4:根据历史气象数据的监测时间与故障发生时间的对应关系,以及历史气象数据的监测点地理坐标与故障地理坐标的对应关系,建立跳闸明细数据与历史气象数据的连接,从而使得每条跳闸明细数据都有对应的历史气象数据;步骤5:以每次跳闸事件作为一个事务,每个事务中包含跳闸明细数据以及该跳闸明细数据对应连接的历史气象数据;以事务中跳闸明细数据中的n种类型的跳闸数据对应作为事务中的n个项目,以事务中历史气象数据中的m项天气数据对应作为事务中的m个项目,从而使得每个事务包含m+n个项目;采集若干事务建立样本数据库;步骤6:采用FP-growth算法挖掘样本数据库中各项目或项集之间的强关联规则,所述项集为包含项目的集合:设置支持度阈值以及置信度阈值,以样本数据库作为输入,通过频繁模式树FP-tree挖掘频繁项集,所述频繁项集是指满足支持度阈值的项集;从频繁项集中筛选出同时满足支持度阈值与置信度阈值的频繁项集作为强关联规则;步骤7:以强关联规则作为跳闸明细数据与气象数据的关联规则,从而完成跳闸明细数据与气象数据关联分析。2.根据权利要求1所述的基于FP-growth的跳闸明细数据与气象数据关联分析方法,其特征在于:历...

【专利技术属性】
技术研发人员:庄文兵熊小伏李勇杰钟劲松马勤勇王建张小军魏伟李晓光朱章甫郑子梁刘刚依力扎提·吐尔汗祁创
申请(专利权)人:国网新疆电力公司电力科学研究院重庆大学
类型:发明
国别省市:新疆,65

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1