一种基于混合聚类的电力设备并行故障诊断方法及装置制造方法及图纸

技术编号:35473510 阅读:13 留言:0更新日期:2022-11-05 16:20
本发明专利技术提供一种基于混合聚类的电力设备并行故障诊断方法及装置,能够实时的完成相应流式数据的并行诊断,实时满足监测数据的故障诊断,及时发现电力设备的故障。本方法包括以下步骤:根据历史电网数据自适应配置storm平台中各个组件的并行度和相关进程数;通过IRichSpout接口将实时电网数据接入到storm平台的Spout源组件中,形成待处理数据流;按照时间顺序将待处理数据流封装到多个Tuple元组中,并为每个Tuple元组生成唯一的ID;利用PreBolt组件接收Tuple元组,并通过标准分数法对Tuple元组中的数据集进行预处理,得到标准化样本;利用故障诊断模型处理标准化样本,获得电力设备的故障诊断结果。得电力设备的故障诊断结果。得电力设备的故障诊断结果。

【技术实现步骤摘要】
一种基于混合聚类的电力设备并行故障诊断方法及装置


[0001]本专利技术属于电网电力行业多元数据监测诊断领域,涉及一种基于混合聚类的电力设备并行故障诊断方法及装置。

技术介绍

[0002]随着电力系统的发展,电力设备故障对人们生活造成重大影响,因此亟需对设备的状态进行持续监测。而传感器技术和通信技术的不断进步,导致电网数据以指数级增长,同时这些数据呈实时性、易失性和无限性,是需要持续监测的流式数据。原有平台Hadoop可以处理批量数据,但实时性较差,而Storm是开源的分布式实时计算架构,可以快速处理海量数据流,弥补了Hadoop实时性处理的不足。
[0003]当前,随着Storm的兴起,其在电力行业领域出现一些应用成果。在Storm上实现基于时间的滑动窗口处理方法,并通过阈值判断实现电网数据流的异常检测。对电网设备中报警数据进行快速处理,通过聚类算法实现相关数据流的处理。
[0004]减法聚类算法和K

means算法属于机器学习算法,机器学习算法可以分为有监督学习和无监督学习两种。在现实世界中,大部分样本是不带标签的,因此无监督学习比监督学习应用更加广泛。K

means算法属于典型的无监督学习聚类算法,其初始聚类中心的选择为随机初始化,因此其聚类结果的准确性不稳定。

技术实现思路

[0005]本专利技术的目的在于克服现有技术中的不足,提供一种基于混合聚类的电力设备并行故障诊断方法,能够实时的完成相应流式数据的并行诊断,实时满足监测数据的故障诊断,及时发现电力设备的故障。
[0006]为达到上述目的,本专利技术是采用下述技术方案实现的:
[0007]第一方面,本专利技术提供了一种基于混合聚类的电力设备并行故障诊断方法,包括以下步骤:
[0008]根据历史电网数据自适应配置storm平台中各个组件的并行度和相关进程数;
[0009]通过IRichSpout接口将实时电网数据接入到storm平台的Spout源组件中,形成待处理数据流;
[0010]按照时间顺序将待处理数据流封装到多个Tuple元组中,并为每个Tuple元组生成唯一的ID;
[0011]利用PreBolt组件接收Tuple元组,并通过标准分数法对Tuple元组中的数据集进行预处理,得到标准化样本;
[0012]利用故障诊断模型处理标准化样本,获得电力设备的故障诊断结果。
[0013]进一步的,自适应配置storm平台中各个组件的并行度和相关进程数的方法为:
[0014]利用历史电网数据模拟实时电网数据流,其中,历史电网数据的流量大于实时电网数据的预期流量;
[0015]根据历史电网数据计算storm平台中各个组件在不同并行度和不同进程数下的数据吞吐量;
[0016]在数据吞吐量满足预期吞吐量的情况下,自适应配置开销最低的组件并行度和进程数。
[0017]进一步的,通过标准分数法对Tuple元组中的数据集进行预处理,得到标准化样本,包括:
[0018]按照下述公式对其进行归一化,公式如下:
[0019][0020]上式中,x`(x`∈[0,1])为归一化后的数据值;x
min
为元组数据中某一维数据的最小值;x
max
为这一维度数据的最大值。
[0021]进一步的,所述故障诊断模型的构建方法包括:
[0022]将减法聚类算法和K

means聚类算法分别部署SCMBolt组件和K

meansBolt组件中,将SCMBolt组件和K

meansBolt组件连接起来,设置组件的并行度,得到故障诊断模型。
[0023]进一步的,利用故障诊断模型处理标准化样本,获得电力设备的故障诊断结果,包括:
[0024]将标准化样本通过减法聚类算法确定较优的初始聚类中心;
[0025]将减法聚类处理所得的较优的初始聚类中心作为K

means算法的初始聚类中心,再进行聚类,从而实现该样本数据的故障诊断结果。
[0026]进一步的,将标准化样本通过减法聚类算法确定较优的初始聚类中心,包括:
[0027]SCMBolt组件接收PreBolt组件传递的元组,对元组中数据进行减法聚类,通过密度值确定聚类中心,得到的聚类中心为原数据中的点;
[0028]当减法聚类算法完成后,得到初始聚类中心,将其与相应Id编号及此编号对应的标准化待聚类样本封装为一个元组,传递给下游组件K

meansBolt。
[0029]减法聚类的方法包括:
[0030]样本维度为M,样本点个数为n,分别为(x1,x2,...,x
n
)。当维度较高时所有样本点归一到一个超立方体中。在此,每个样本点都可为聚类中心的候选者。则样本点xi的密度指标定义为
[0031][0032]上式中,r
a
为一个正数。r
a
的取值为该点的一个邻域半径,而半径以外的样本点对该点的密度指标有很小的贡献。
[0033]当每一个样本点的密度指标计算完后,选择密度指标最高的样本点作为第一个聚类中心,x
c1
为选中的点,D
c1
是此点的密度指标。则选择下一个聚类中心时,每个样本点x
i
的密度指标可通过下式修正。
[0034][0035]上式中,r
b
为一个正数。
[0036]当修正完所有样本点的密度指标后,选择出新的聚类中心x
c2
,再次修正所有样本点的密度指标,不断的重复该过程,直到足够多的聚类中心出现,得到较优的初始聚类中心。
[0037]进一步的,将减法聚类处理所得的较优的初始聚类中心作为K

means算法的初始聚类中心,再进行聚类,包括:
[0038]K

meansBolt组件对上游SCMBolt组件传来的标准化待聚类样本进行K

means聚类,在聚类过程中将上游SCMBolt组件传来的聚类中心作为K

means聚类的初始聚类中心,通过迭代实现聚类中心的更新,最终得到相关聚类结果。
[0039]进一步的,在聚类过程中将上游SCMBolt组件传来的聚类中心作为K

means聚类的初始聚类中心,通过迭代实现聚类中心的更新,包括:
[0040]a)将上游SCMBolt组件传来的聚类中心作为K

means聚类的初始聚类中心。
[0041]b)计算样本集中所有样本到各个聚类中心的矢量距离,从中选择矢量距离最小的并将此样本划分到其对应的类中。
[0042]c)更新聚类中心,即计算每一类中所有样本数据的平均值,将这些均值作为k类别中新的聚类中心。
[0043]d)不断执行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于混合聚类的电力设备并行故障诊断方法,其特征在于,包括以下步骤:根据历史电网数据自适应配置storm平台中各个组件的并行度和相关进程数;通过IRichSpout接口将实时电网数据接入到storm平台的Spout源组件中,形成待处理数据流;按照时间顺序将待处理数据流封装到多个Tuple元组中,并为每个Tuple元组生成唯一的ID;利用PreBolt组件接收Tuple元组,并通过标准分数法对Tuple元组中的数据集进行预处理,得到标准化样本;利用故障诊断模型处理标准化样本,获得电力设备的故障诊断结果。2.根据权利要求1所述的基于混合聚类的电力设备并行故障诊断方法,其特征在于,自适应配置storm平台中各个组件的并行度和相关进程数的方法为:利用历史电网数据模拟实时电网数据流,其中,历史电网数据的流量大于实时电网数据的预期流量;根据历史电网数据计算storm平台中各个组件在不同并行度和不同进程数下的数据吞吐量;在数据吞吐量满足预期吞吐量的情况下,自适应配置开销最低的组件并行度和进程数。3.根据权利要求1所述的基于混合聚类的电力设备并行故障诊断方法,其特征在于,通过标准分数法对Tuple元组中的数据集进行预处理,得到标准化样本,包括:按照下述公式对其进行归一化,公式如下:上式中,x`(x`∈[0,1])为归一化后的数据值;x
min
为元组数据中某一维数据的最小值;x
max
为这一维度数据的最大值。4.根据权利要求1所述的基于混合聚类的电力设备并行故障诊断方法,其特征在于,所述故障诊断模型的构建方法包括:将减法聚类算法和K

means聚类算法分别部署SCMBolt组件和K

meansBolt组件中,将SCMBolt组件和K

meansBolt组件连接起来,设置组件的并行度,得到故障诊断模型。5.根据权利要求4所述的基于混合聚类的电力设备并行故障诊断方法,其特征在于,利用故障诊断模型处理标准化样本,获得电力设备的故障诊断结果,包括:将标准化样本通过减法聚类算法确定较优的初始聚类中心;将减法聚类处理所得的较优的初始聚类中心作为K

means算法的初始聚类中心,再进行聚类,从而实现该样本数据的故障诊断结果。6.根据权利要求5所述的基于混合聚类的电力设备并行故障诊断方法,其特征在于,将标准化样本通过减法聚类算法确定较优的初始聚类中心,包括:SCMBolt组件接收PreBolt组件传递的元组,对元组中数据进行减法聚类,通过密度值确定聚类中心,得到的聚类中心为原数据中的点;当减法聚类算法完成后,得到初始聚类中心,将其与相应Id编号及此编号对应的标准化待聚类样本封装为一个元组,传递给下游组件K

meansBolt;
减法聚类的方法包括:样本维度为M,样本点个数为n,分别为(x1,x2,...,x
n
);当维度较高时所有样本点归一到一个超立方体中;在此,每个样本点都可为聚类中心的候选者;则样本点xi的密度指标定义为上式中,r
a
为一个正数;r
a
的取值为该点的一个邻域半...

【专利技术属性】
技术研发人员:刘少伟戴必翔秦昌嵩董贝经周
申请(专利权)人:南京国电南自电网自动化有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1