基于数据关联的电力系统二次设备缺陷分析方法及系统技术方案

技术编号:29837804 阅读:19 留言:0更新日期:2021-08-27 14:27
本发明专利技术公开了一种基于数据关联的电力系统二次设备缺陷分析方法及系统,包括:获取待分析电力二次设备的历史缺陷数据,并进行数据提取;将提取的数据中的文本型数据转化为数字型数据;对于处理后的数据,利用聚类算法得到设定数量的簇类;基于所述簇类将大规模的缺陷文本分解为若干个簇内相似程度高,簇间相似程度低的数据集。本发明专利技术利用K‑means算法可以将缺陷文本数据分成若干个簇,在一定的程度上减少缺陷文本数据的大小,减少后续的缺陷分析的工作量;此外各个簇内相似度较高,具有一定的关联性,在此基础上利用Apriori算法对各个簇分别进行关联分析能够找出各缺陷属性之间的关联强弱,能够为缺陷分析提供一定的指导作用。

【技术实现步骤摘要】
基于数据关联的电力系统二次设备缺陷分析方法及系统
本专利技术涉及电力设备缺陷分析
,尤其涉及一种基于数据关联的电力系统二次设备缺陷分析方法及系统。
技术介绍
本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。电力系统二次设备的可靠运行是电力系统安全稳定的重要保障。近年来,随着经济的飞速发展,电网规模不断扩大,电网中二次设备的数量也发生了跨越式的增长,“设备多,人少”的矛盾给二次设备的运维人员带来了相当大的工作负担,同时也给电网运行带来了风险,二次设备的运维和管控水平亟待提高。二次设备的运维人员在日常工作中会对所发现和处理的缺陷进行记录和归档,方便日后的查看、统计和分析。这些二次设备缺陷数据中蕴含着大量的有用信息,对缺陷数据进行挖掘和分析将对提升二次设备的运维和管控水平有着重要的意义。但是,当前对于二次设备缺陷数据的挖掘和分析仍然缺乏理论性和系统性,主要体现在分析方法简单,仅进行缺陷数据的分类和统计,对于数据之间的关联关系等重要特性并未涉及,分析结果对二次设备运维和管控的指导意义不大。电力系统的数字化、信息化、智能化不断发展,带来了更多的数据源,缺陷数据的规模也大幅度提高,导致工作量增大,传统的数据分析方法不能够达到理想的效果。
技术实现思路
为了解决上述问题,本专利技术提出了一种基于数据关联的电力系统二次设备缺陷分析方法及系统,能够解决传统的数据分析方法耗费时间和人力,数据未能得到充分的利用等问题,并且能够挖掘出缺陷数据之间存在的关联性。在一些实施方式中,采用如下技术方案:一种基于数据关联的电力系统二次设备缺陷分析方法,包括:获取待分析电力二次设备的历史缺陷数据,并进行数据提取;将提取的数据中的文本型数据转化为数字型数据;对于处理后的数据,利用聚类算法得到设定数量的簇类;基于所述簇类结合挖掘关联规则的算法确定缺陷分析结果。作为进一步地方案,获取待分析电力二次设备的历史缺陷数据,具体包括:与出现缺陷的二次设备本身相关的信息、针对缺陷的评价信息以及针对缺陷事件的发现、处理流程信息。作为进一步地方案,进行提取的历史缺陷数据包括:二次设备的生产厂家、二次设备型号、二次设备缺陷的原因、发生缺陷的设备部位、缺陷等级、缺陷发现的时间、缺陷处理的时间以及处理缺陷所涉及的专业。作为进一步地方案,将获取的数据中的文本型数据转化为数字型数据,具体包括:分别为不同的文本属性的数据分配相对应的数值数据,构建缺陷数据集矩阵。作为进一步地方案,对于处理后的数据,利用聚类算法得到设定数量的簇类,具体包括:随机生成K个聚类中心;计算缺陷数据集矩阵中的每个样本点到聚类中心的距离;根据所述距离将样本点划分到与其距离最小的簇类当中去;重新计算新的聚类中心;判断新的聚类中心是否收敛;如果收敛,输出K个簇类;否则,更新新的聚类中心,重新对数据进行聚类,直到聚类中心收敛为止。作为进一步地方案,根据欧几里得距离计算数据集中样本点xj到各聚类中心点vi之间的距离。作为进一步地方案,还包括:对不同厂家的同一电力系统二次设备进行缺陷分析,确定不同厂家设备的故障多发类型。在另一些实施方式中,采用如下技术方案:一种基于数据关联的电力系统二次设备缺陷分析系统,包括:数据获取模块,用于获取待分析电力二次设备的历史缺陷数据,并进行数据提取;数据处理模块,用于将提取的数据中的文本型数据转化为数字型数据;缺陷分析模块,用于对于处理后的数据,利用聚类算法得到设定数量的簇类;基于所述簇类结合挖掘关联规则的算法确定缺陷分析结果。在另一些实施方式中,采用如下技术方案:一种终端设备,其包括处理器和存储器,处理器用于实现各指令;存储器用于存储多条指令,所述指令适于由处理器加载并执行上述的基于数据关联的电力系统二次设备缺陷分析方法。在另一些实施方式中,采用如下技术方案:一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行上述的基于数据关联的电力系统二次设备缺陷分析方法。与现有技术相比,本专利技术的有益效果是:本专利技术利用K-means算法可以将缺陷文本数据分成若干个簇,在一定的程度上减少缺陷文本数据的大小,减少后续的缺陷分析的工作量;此外各个簇内相似度较高,具有一定的关联性,在此基础上利用Apriori算法对各个簇分别进行关联分析能够找出各缺陷属性之间的关联强弱,能够为缺陷分析提供一定的指导作用。本专利技术方法能够进一步挖掘缺陷数据之间的关联度,为设备的检修和维护提供一定的指导作用。本专利技术的其他特征和附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本方面的实践了解到。附图说明图1是本专利技术实施例中基于聚类算法和关联规则相结合的电力系统二次设备缺陷分析方法示意图;图2是本专利技术实施例中聚类算法示意图。图3是本专利技术实施例中Apriori算法示意图。具体实施方式应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本专利技术使用的所有技术和科学术语具有与本申请所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。实施例一在一个或多个实施方式中,公开了一种基于数据关联的电力系统二次设备缺陷分析方法,参照图1,包括以下步骤:(1)获取待分析电力二次设备的历史缺陷数据,并进行数据提取;具体地,缺陷数据主要包括三类:1)与出现缺陷的二次设备本身紧密相关的信息,如设备的生产厂家、设备类型、设备型号、设备的投运时间、发生缺陷的二次设备部位等。2)针对缺陷的简要评价信息,如缺陷的级别和缺陷的主要原因等。3)针对缺陷事件本身的发现、处理等流程性的信息,如发现缺陷的时间、处理的时间和所涉及的专业等。在进行数据分类之前,需要对数据做预处理,提取出具有重要特征的缺陷数据,减少计算的复杂度。其中,前2类信息主要用于缺陷的事后分析,而第3类更偏向于缺陷的管理。本实施例针对前2类信息,考虑部分类型的信息之间存在的冗余关系,提取出二次设备的生产厂家、二次设备型号、二次设备缺陷的原因、发生缺陷的设备部位以及缺陷等级等5项重要信息作为数据挖掘和缺陷分析的对象。(2)将提取的数据中的文本型数据转化为数字型数据;具体地,本实施例中,电力系统二次设备历史缺陷数据,是一类多重变量的数据集;完整的缺陷数据集是一个30×5的矩阵,每一行对应着一种故障缺陷,包含的属性有本文档来自技高网
...

【技术保护点】
1.一种基于数据关联的电力系统二次设备缺陷分析方法,其特征在于,包括:/n获取待分析电力二次设备的历史缺陷数据,并进行数据提取;/n将提取的数据中的文本型数据转化为数字型数据;/n对于处理后的数据,利用聚类算法得到设定数量的簇类;基于所述簇类结合挖掘关联规则的算法确定缺陷分析结果。/n

【技术特征摘要】
1.一种基于数据关联的电力系统二次设备缺陷分析方法,其特征在于,包括:
获取待分析电力二次设备的历史缺陷数据,并进行数据提取;
将提取的数据中的文本型数据转化为数字型数据;
对于处理后的数据,利用聚类算法得到设定数量的簇类;基于所述簇类结合挖掘关联规则的算法确定缺陷分析结果。


2.如权利要求1所述的一种基于数据关联的电力系统二次设备缺陷分析方法,其特征在于,获取待分析电力二次设备的历史缺陷数据,具体包括:与出现缺陷的二次设备本身相关的信息、针对缺陷的评价信息以及针对缺陷事件的发现、处理流程信息。


3.如权利要求2所述的一种基于数据关联的电力系统二次设备缺陷分析方法,其特征在于,进行提取的历史缺陷数据包括:二次设备的生产厂家、二次设备型号、二次设备缺陷的原因、发生缺陷的设备部位、缺陷等级、缺陷发现的时间、缺陷处理的时间以及处理缺陷所涉及的专业。


4.如权利要求1所述的一种基于数据关联的电力系统二次设备缺陷分析方法,其特征在于,将获取的数据中的文本型数据转化为数字型数据,具体包括:
分别为不同的文本属性的数据分配相对应的数值数据,构建缺陷数据集矩阵。


5.如权利要求1所述的一种基于数据关联的电力系统二次设备缺陷分析方法,其特征在于,对于处理后的数据,利用聚类算法得到设定数量的簇类,具体包括:
随机生成K个聚类中心;
计算缺陷数据集矩阵中的每个样本点到聚类中心的距离;
根据所述距离将样本点划分...

【专利技术属性】
技术研发人员:丁晓兵郑茂然张静伟陈朝晖余江张弛黄河李正红高宏慧陈宏山刘千宽
申请(专利权)人:中国南方电网有限责任公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1