一种基于故障数据状态矩阵进行故障匹配和预警的方法技术

技术编号:22185966 阅读:27 留言:0更新日期:2019-09-25 03:35
本发明专利技术涉及一种基于故障数据状态矩阵进行故障匹配和预警的方法,包括步骤:S1数据归一化处理:Z‑score标准化方法,给予原始故障数据的均值和标准差进行数据的标准化;S2将故障数据样本向量计算出相似性距离;S3把故障数据样本向量按照相似性距离的大小进行排序,并按照样本向量选取的规则,选取相应的样本向量数目组成故障样本状态矩阵;S4把此组成的故障样本状态矩阵存入故障数据库中。本发明专利技术的有益效果是:本方案与传统的预警系统相比,另辟蹊径,建立故障数据状态矩阵,更加高效;本方案建立故障数据库,实现了数据的积累,为以后数据的利用提供更大的可能性;本方案故障数据状态矩阵的建立是有计算机来实现的,因此大大减少人为误差。

A Method of Fault Matching and Early Warning Based on Fault Data State Matrix

【技术实现步骤摘要】
一种基于故障数据状态矩阵进行故障匹配和预警的方法
本专利技术涉及故障匹配和预警的方法,更具体地说,它涉及一种基于故障数据状态矩阵进行故障匹配和预警的方法。
技术介绍
现有的预警系统均是采用设备运行时的正常数据,通过筛选出设备运行时各个工况下的正常数据,建立正常数据的状态矩阵,利用从现场采集来的实时数据与正常数据进行相似度计算,建立实时数据趋势图与样本数据趋势图,通过实时数据与样本数据的偏差值与设定的报警值作对比,超出报警值即产生报警,此预警系统的缺点就是太依赖于样本数据和报警值的选择,如果样本数据和报警值选择不恰当,此预警系统将会出现问题。
技术实现思路
本专利技术的目的在于克服上述不足,提供一种基于故障数据状态矩阵进行故障匹配和预警的方法。基于故障数据状态矩阵进行故障匹配和预警的方法,包括如下步骤:S1数据归一化处理:Z-score标准化方法,给予原始故障数据的均值和标准差进行数据的标准化;经过处理的数据符合标准正态分布,即均值为0,标准差为1;转化函数为:X*=(X-μ)/σ其中μ为所有故障数据的均值,σ为所有故障数据的标准差,X为原始故障数据,X*为数据化归一后的数据;S2将故障数据样本向量计算出相似性距离;S3把故障数据样本向量按照相似性距离的大小进行排序,并按照样本向量选取的规则,选取相应的样本向量数目组成故障样本状态矩阵;S4把此组成的故障样本状态矩阵存入故障数据库中;S5把实时数据按照归一化方式进行处理后,转换成实时数据向量,与所建立的故障数据库中的故障样本状态矩阵进行相似性计算,计算出相应的相似性距离,进而判断实时数据与故障数据在统一归一化的情况下的相似性的程度,相似性距离越近表示相似程度越大,则计算机记录此对比结果,接着继续匹配故障数据库中此设备下的其他故障样本状态矩阵,相似度低的则不记录结果;S6在记录下的结果中,对比选择出最接近实时的历史故障,进而来给出预警。作为优选:步骤S2的相似性距离计算公式为:设两个向量为X=(x1,...,xn),Y=(y1,...,yn)1)欧几里德距离假设x,y是n维空间的两个点,他们之间的欧几里德距离是:当n=2时,欧几里德距离就是两个点的距离;用欧几里德距离表示相似度,采用以下公式进行转换:距离越小,相似度越大;利用欧氏距离d定义的相似度s,s=1/(1+d),相似度s的范围为[0,1],s值越大,说明d越小,也就是距离越近,则相似度越大;2)Tanimoto系数相似度范围为[0,1],完全重叠时为1,无重叠项时为0,越接近1说明越相似3)基于皮尔森相关性的相似度皮尔森相关系数反应两个变量之间的线性相关程度,它取值在[-1,1]之间;当两个变量的线性关系增强时,相关系数趋于1或-1;当一个变量增大,另一个变量也增大时表明它们之间是正相关的,如果一个变量增大,另一个变量却减少,表明它们之间是负相关的;如果相关系数等于0表明它们之间不存在线性相关关系;用数学公式表示,皮尔森相关系数等于两个变量的协方差除于两个变量的标准差;其中Cov(X,Y)为协方差矩阵,协方差反应了2个特征的协同程度,如果同时增大或小,协方差为正;若一个增大一个减小,则为负值;绝对值的大小反应了2者的变化快慢;相对于协方差,相关系数剔除了方差大小不一的影响;其中u表示X的期望E(X),v表示Y的期望E(Y)。COV(X,Y)=E((X-μ)(Y-v)),标准差(StandardDeviation)方差(Variance):一个随机变量的方差表述的是它的离散程度;Var(X)=E(X2)-E2(X)相关距离的定义:Dxy=1-ρxy相关系数越大,表示相关距离越近,则相似度越高。本专利技术的有益效果是:1、本方案与传统的预警系统相比,另辟蹊径,建立故障数据状态矩阵,更加高效。2、本方案建立故障数据库,实现了数据的积累,为以后数据的利用提供更大的可能性。3、本方案故障数据状态矩阵的建立是有计算机来实现的,因此大大减少人为误差。4、本方案与传统预警系统相辅相成进而大大提高预警的准确性。5、本方案应用广泛,适用于发电厂、化工厂及所有的监控预警领域。6、本方案的使用操作简单明了,使用者可以很快学会并且熟练应用。具体实施方式下面结合实施例对本专利技术做进一步描述。下述实施例的说明只是用于帮助理解本专利技术。应当指出,对于本
的普通技术人员来说,在不脱离本专利技术原理的前提下,还可以对本专利技术进行若干改进和修饰,这些改进和修饰也落入本专利技术权利要求的保护范围内。1、由于故障数据每一变量数量级不同,变化范围也不同,所以要将故障数据进行归一化处理,数据归一化的具体作用是归纳统一样本的统计分布性,归一化在0-1之间是统计的概率分布,归一化在-1-+1之间是统计的坐标分布。归一化有同一、统一、和合一的意思。归一化是一种简化计算的方式,将有量纲的表达式,经过变换,化为无量纲的表达式,成为纯量数据归一化处理方式有:Z-score标准化方法,也称为均值归一化(meannormaliztion),给予原始故障数据的均值(mean)和标准差(standarddeviation)进行数据的标准化。经过处理的数据符合标准正态分布,即均值为0,标准差为1。转化函数为:X*=(X-μ)/σ其中μ为所有故障数据的均值,σ为所有故障数据的标准差,X为原始故障数据,X*为数据化归一后的数据。2、故障数据化归一之后再将故障数据样本向量通过相似性距离进行排序。关于相似度的计算,现有的几种基本方法都是基于向量的,其实也就是计算两个向量的距离,距离越近相似度越大。相似性距离可以用以下距离公式计算(设两个向量为X=(x1,...,xn),Y=(y1,...,yn)1)欧几里德距离(EuclideanDistance)最初用于计算欧几里德空间中两个点的距离,假设x,y是n维空间的两个点,他们之间的欧几里德距离是:可以看出,当n=2时,欧几里德距离就是两个点的距离。当用欧几里德距离表示相似度,一般采用以下公式进行转换:距离越小,相似度越大。利用欧氏距离d定义的相似度s,s=1/(1+d),相似度s的范围为[0,1],s值越大,说明d越小,也就是距离越近,则相似度越大。同皮尔森相似度一样,该相似度也没有考虑重叠数对结果的影响,同样的Mahout通过增加一个枚举类型(Weighting)的参数来使得重叠数也成为计算相似度的影响因子2)Tanimoto系数(TanimotoCoefficient)Tanimoto系数也称为Jaccard系数,是Cosine相似度的扩展,也多用于计算文档数据的相似度:相似度范围为[0,1],完全重叠时为1,无重叠项时为0,越接近1说明越相似3)基于皮尔森相关性的相似度(Pearsoncorrelation-basedsimilarity)皮尔森相关系数反应了两个变量之间的线性相关程度,它取值在[-1,1]之间。当两个变量的线性关系增强时,相关系数趋于1或-1;当一个变量增大,另一个变量也增大时表明它们之间是正相关的,如果一个变量增大,另一个变量却减少,表明它们之间是负相关的。如果相关系数等于0表明它们之间不存在线性相关关系。用数学公式表示,皮尔森相关系数等于两个变量的协方差除于两个变量的标准差。其中Cov(X,Y)为协方差矩阵协本文档来自技高网
...

【技术保护点】
1.一种基于故障数据状态矩阵进行故障匹配和预警的方法,其特征在于,包括如下步骤:S1数据归一化处理:Z‑score标准化方法,给予原始故障数据的均值和标准差进行数据的标准化;经过处理的数据符合标准正态分布,即均值为0,标准差为1;转化函数为:X*=(X‑μ)/σ其中μ为所有故障数据的均值,σ为所有故障数据的标准差,X为原始故障数据,X*为数据化归一后的数据;S2将故障数据样本向量计算出相似性距离;S3把故障数据样本向量按照相似性距离的大小进行排序,并按照样本向量选取的规则,选取相应的样本向量数目组成故障样本状态矩阵;S4把此组成的故障样本状态矩阵存入故障数据库中;S5把实时数据按照归一化方式进行处理后,转换成实时数据向量,与所建立的故障数据库中的故障样本状态矩阵进行相似性计算,计算出相应的相似性距离,进而判断实时数据与故障数据在统一归一化的情况下的相似性的程度,相似性距离越近表示相似程度越大,则计算机记录此对比结果,接着继续匹配故障数据库中此设备下的其他故障样本状态矩阵,相似度低的则不记录结果;S6在记录下的结果中,对比选择出最接近实时的历史故障,进而来给出预警。

【技术特征摘要】
1.一种基于故障数据状态矩阵进行故障匹配和预警的方法,其特征在于,包括如下步骤:S1数据归一化处理:Z-score标准化方法,给予原始故障数据的均值和标准差进行数据的标准化;经过处理的数据符合标准正态分布,即均值为0,标准差为1;转化函数为:X*=(X-μ)/σ其中μ为所有故障数据的均值,σ为所有故障数据的标准差,X为原始故障数据,X*为数据化归一后的数据;S2将故障数据样本向量计算出相似性距离;S3把故障数据样本向量按照相似性距离的大小进行排序,并按照样本向量选取的规则,选取相应的样本向量数目组成故障样本状态矩阵;S4把此组成的故障样本状态矩阵存入故障数据库中;S5把实时数据按照归一化方式进行处理后,转换成实时数据向量,与所建立的故障数据库中的故障样本状态矩阵进行相似性计算,计算出相应的相似性距离,进而判断实时数据与故障数据在统一归一化的情况下的相似性的程度,相似性距离越近表示相似程度越大,则计算机记录此对比结果,接着继续匹配故障数据库中此设备下的其他故障样本状态矩阵,相似度低的则不记录结果;S6在记录下的结果中,对比选择出最接近实时的历史故障,进而来给出预警。2.根据权利要求1所述的基于故障数据状态矩阵进行故障匹配和预警的方法,其特征在于,步骤S2的相似性距离计算公式为:设两个向量为X=(x1,...,xn),Y=(y1,...,yn)1)欧几里德距离假设x,y是n维空间的两个点,他们之间的欧几里德距离是:当n=2时,欧几...

【专利技术属性】
技术研发人员:范海东解剑波李清毅关键周君良李峰
申请(专利权)人:浙江浙能技术研究院有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1