基于FP-Tree算法的电网二次设备状态评价指标的信息挖掘处理方法技术

技术编号:34468949 阅读:16 留言:0更新日期:2022-08-10 08:42
本发明专利技术公开了一种基于FP

【技术实现步骤摘要】
基于FP

Tree算法的电网二次设备状态评价指标的信息挖掘处理方法


[0001]本专利技术涉及电力工程
,特别是涉及一种电力系统二次设备状态评价指标的信息挖掘处理方法。

技术介绍

[0002]电力系统中的数据存在数据种类混杂、数据质量差、要求高、实时性等特征,因此如何有效的加工处理大量业务数据对于电力系统来说就显得尤为重要。在智能变电站中,存在大量的传感器和随之而来的海量的二次设备测量数据,针对电网二次设备的状态评价,能否做好原始数据的处理工作将直接影响到设备状态评价的结果以及二次设备状态检修计划的制定。
[0003]对于二次设备状态评估问题,完备合理的评估指标体系和科学有效的评估方法都非常重要。当前,关于电网二次设备评估指标体系的构建,大多基于专家经验。随着各类传感器的投入使用,二次设备的运行状态监测变得更加全面和细致,相应的评估指标种类以及产生的数据量也随之增加,加重了运维人员的工作量。作为设备运行状态风险评估的首要步骤,如何进行评估指标的筛选,进而构建符合当前设备运行工况的状态评估指标体系,将直接影响到评估结果的科学合理性。
[0004]在数据处理方面,数据挖掘技术是处理大数据的一种非常重要的手段之一,可用来对海量的二次设备状态数据信息进行处理,从而对评估指标进行筛选,为二次设备的监控和状态评估打基础。而在数据挖掘技术中,关联规则是海量数据挖掘非常经典的任务,其主要目标是试图从一系列事务集中挖掘出频繁项以及对应的关联规则。
[0005]二次设备状态评价指标:电网二次设备的状态检修工作主要是基于设备的历史运维数据实现对设备当前或未来运行状态的风险评估。因此,对二次设备历史运维数据的挖掘、应用显得尤为重要,主要表现为二次设备风险评估指标的选取和评价权重的确定。在实际运维中,二次设备风险评估相关的指标多、数据量大,这路参考了南方电网有限责任公司《中国南方电网公司二次设备状态评价与风险评估导则》和《智能变电站继电保护信息规范》,征询了继电保护装置生产厂商产品研发人员的意见和继电保护运维人员的意见,对二次设备运行状态风险评估相关参数指标进行初步整理和筛选,并根据评估指标的数据类型主要分为定性和定量两类,总计40余项,部分指标如表1所示:
[0006]表1部分二次设备状态评价指标
[0007][0008]数据挖掘中关联规则的形式化描述:关联规则是一种用于寻找数据项之间隐藏关系、描述数据之间密切程度的搜索式方法,其挖掘对象一般是事务数据集。设有N个事务集构成的事务数据集D={T1,T2,

,T
N
},其中T
j
(j=1,2,

,N)称为事务数据集D的事务集,构成事务集T
j
的元素称为事务集的项I
k
(k=1,2,

,p),p为该事务集在项的数量。D中所有项的集合为项集I={I1,I2,

,I
m
},m为项的总数。若I中包含k个项,则I为k项集,显然
[0009]概念1项集与频繁项集。设事务集M={i1,i2,

,i
t
},则M为事务数据集D的一个t项集,其支持度V
Sup
(M)定义为包含M的事务数所占的百分比,可表示为:
[0010][0011]若V
Sup
(M)大于给定的最小支持度阈值ε0,则称M为频繁项集。
[0012]概念2定义在I和D上的关联规则可表示为的蕴含式,X为前提,Y为结论,并且满足其成立条件是符合V
Sup
(M)支持度和置信度的要求,
[0013]概念3关联规则的支持度用于衡量关联规则在整个数据集的统计重要性,定义为项集(X∪Y)的支持度,即:
[0014][0015]概念4关联规则的置信度用于衡量关联规则的可信程度,定义为包含X和Y的事务数与包含X的事务数的比值,即:
[0016][0017]概念5关联规则的相关度用于判断关联规则中事件X和Y的相关性,且越高表明正相关性越高,且越低表明负相关性越高,=1表明无相关性。
[0018][0019]目前,在二次设备状态评估数据处理中,有人提出基于Apriori的关联规则挖掘算法筛选评估指标,构建二次设备运行状态风险评估指标体系。Apriori算法简单且易于实现,是常用的关联规则挖掘算法;但其缺点也十分明显。随着数据集规模的不断增长,Apriori算法逐渐显现出一定的局限性:(1)需多次扫描数据库,很大的I/O负载,算法的执行效率较低;(2)产生大量的候选项目集,会消耗大量的内存。

技术实现思路

[0020]本专利技术的目就是针对上述之不足而提供一种基于FP

Tree算法的电网二次设备状态评价指标的信息挖掘处理方法,利用海量的电网二次设备缺陷状态信息数据和众多的评价指标,提高二次设备运行状态风险评估的效率和准确率,利用FP

Tree关联规则算法进行数据挖掘,对评估指标集进行进一步精简与筛选,从而降低评估复杂度和工作量。
[0021]本专利技术为了解决上述技术问题而采用的技术解决方案如下:
[0022]基于FP

Tree算法的电网二次设备状态评价指标的信息挖掘处理方法,步聚如下:
[0023]一、二次设备状态数据收集
[0024]收集二次设备状态的各类数据,含在线监控、日志、检修中发现的缺陷,将缺陷数据离散化,构建二次设备的缺陷集,即关联规则项集D,如下式:
[0025]D={M,T,R,P}
[0026]该项集中各事务集选取如下:M为设备制造商,T为设备类别,R为设备缺陷原因,P为设备发生部位;
[0027]二、FP

Tree算法应用
[0028]初始化:根据实际情况,定义好最小支持度S
min
,使用上述步骤中的缺陷集,经过挖掘可得到频繁项集,具体过程如下:
[0029]①
构造FP

tree
[0030]扫描缺陷集一遍,得到频繁项1

项集K1,将K1按照支持度降序排列得到L1;然后创建FP

tree的根节点“NULL”,缺陷库中的每项事务按如下步骤处理:将每条事务按照L1的顺序排列,并将事务的项依次添加到FP

tree中,FP

tree中的结点信息包括事务项和其计数值cnt,如果该添加项结点已存在,则计数值cnt加1;如果该添加项结点不存在,则添加新结点,且设计数值cnt为1;如此递归调用直到所有事务添加完毕;
[0031]②
挖掘FP

Tree
[0032]调用函数FP

growth(FP

Tree,NULL),其伪代码如下:
[0033]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于FP

Tree算法的电网二次设备状态评价指标的信息挖掘处理方法,其特征在于步聚如下:一、二次设备状态数据收集收集二次设备状态的各类数据,含在线监控、日志、检修中发现的缺陷,将缺陷数据离散化,构建二次设备的缺陷集,即关联规则项集D,如下式:D={M,T,R,P}该项集中各事务集选取如下:M为设备制造商,T为设备类别,R为设备缺陷原因,P为设备发生部位;二、FP

Tree算法应用初始化:根据实际情况,定义好最小支持度S
min
,使用上述步骤中的缺陷集,经过挖掘可得到频繁项集,具体过程如下:

构造FP

tree扫描缺陷集一遍,得到频繁项1

项集K1,将K1按照支持度降序排列得到L1;然后创建FP

tree的根节点“NULL”,缺陷库中的每项事务按如下步骤处理:将每条事务按照L1的顺序排列,并将事务的项依次添加到FP

...

【专利技术属性】
技术研发人员:赵明婧
申请(专利权)人:国网河南省电力公司安阳供电公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1