一种时序数据非预期故障检测方法技术

技术编号:15329619 阅读:101 留言:0更新日期:2017-05-16 13:15
本发明专利技术提供了一种时序数据非预期故障检测方法,本方法通过已知数据对参数呈现的不同态势进行学习,建立起参数信息库和事件特征库;然后,分析出不同样本的组合特征与时序系统故障状况的关系;该方法包括数据预处理模块、TK‑Means聚类模块、特征库生成模块、检测判定模块;该方法将各参数值进行多特征提取、聚类等数据挖掘操作后,把各个参数在同一时间上的特征字符组合起来建立起事件特征库;当在实时数据中观测到事件特征库中没有出现过的特征组合时,即判定为发生了非预期事件,非预期事件就是潜在的非预期故障。

A method for detecting unexpected faults in time series data

The invention provides a non sequential data expected fault detection method, this method is different from the known data on the situation of learning parameters, establish the parameter information database and event feature library; then, analyses the relationship between combination features of different samples and fault conditions of timing system; the method includes data preprocessing module, TK Means clustering module, feature database generation module, detection decision module; the method parameters of feature extraction and clustering data mining operations, the various parameters at the same time the character group together to establish the event feature library; when the combination of features in real-time data observed in the event feature library there have been no, that is determined to be the unexpected events, unexpected events is not expected failure potential.

【技术实现步骤摘要】
一种时序数据非预期故障检测方法
本专利技术属于智能信息处理和计算机
,具体涉及一种时序数据非预期故障检测方法。
技术介绍
复杂的时序系统由很多部件构成,每个部件又有很多个观测参数。一般而言,部件各参数的不同态势会呈现出系统整体或局部的运行情况。需要对已知数据所呈现出的不同态势进行学习,建立起事件特征库。然后,分析出不同事件的特征组合模式与时序系统运行状况的关系。这样就可以根据当前数据的组合特征实时反映出时序系统当前的运行状况。如果检测到了事件特征库中并未出现过的组合模式,那么就是发生了非预期事件。非预期事件可能代表着新出现的情况,更可能代表着以前未知的故障特征。现有方法大多以基于案例推理(即CaseBasedReasoning,CBR)的方法对数据属性进行分析,将其与案例库中的案例特征进行对比然后判定出具体故障;对于新的非预期案例要么判定错误,要么无能为力。现有方法收集整理案例库往往比较困难,需要消耗大量人力。
技术实现思路
本专利技术的目的在于提供了一种时序数据非预期故障检测方法,能够用于实时检测非预期事件或者故障,并提供相关辅助信息,帮助系统用户去判断该非预期事件所反映的系统运行状况。为达到上述目的,本专利技术采用的技术方案是:一种时序数据非预期故障检测方法,实现该方法的系统包括数据预处理模块、TK-Means聚类模块、特征库生成模块、检测判定模块,其具体步骤是:1)首先,采用数据预处理模块对原始数据进行去野值、等间隔处理文件以及归一化处理,获取标准化的数据,并且提取相关多特征向量;2)其次,采用TK-Means聚类模块对特征向量进行聚类,然后基于聚类结果,将原始数据表示成特征字符串;3)然后,采用特征库生成模块对每个参数在数据预处理和聚类过程中的基本数据记录到参数信息库中,包括每个参数的最大值、最小值、簇中心向量和特征字符对应情况,然后生成一个用于记录所有参数组合特征的出现次数与频率的事件特征库;4)最后,通过检测判定模块对新数据实时获得其特征向量,并对同一时刻多个参数特征的组合与特征库中数据进行对比,如果该组合特征在特征库中已有记录,那么就是已知模式,否则就是检测到非预期模式,非预期模式就是潜在的非预期故障。所述的数据预处理模块“去野值处理”是指删除无效野值,保留有效值;对数据进行等间隔处理保证在连续时间段内任意两个数据点之间的时间间隔相同;数据经过等间隔处理之后进行归一化处理消除不同量纲对结果的影响从而获取标准化的数据。所述的TK-Means聚类模块采用申请号:2015105516228,一种时序数据异常特征的挖掘系统及方法,其中,‘a’表示最频繁出现的特征,‘b’表示次频繁出现的特征,依此类推;出现概率小于给定阈值0.02的特征被表示为‘?’;空数据,即未记录数据的区间或者被删除的区间,则用‘#’来表示。所述的特征库生成模块生成一个参数信息库和一个事件特征库:所述的参数信息库的建立包括:2-1)取一个待处理参数;2-2)在参数信息库中创建该参数的记录;2-3)记录该参数的最大值和最小值特征;2-4)记录该参数均值、方差、小波系数、傅立叶系数、频率特征的最大值和最小值;2-5)获得该参数TK-Means聚类的结果;2-6)聚类结果记录该参数每个簇中心向量及其对应的特征字符;2-7)判断当前是否处理完所有的参数;如果未处理完所有参数,则转至步骤2-1重复执行上述过程;如果已经处理完所有参数,则执行步骤2-8);2-8)输出结果,更新参数信息库内容;生成参数信息库过程结束;所述的事件特征库的建立过程:3-1)对齐所有参数的特征字符序列;3-2)记录特征库统计起止时间、窗口数目、参数组成;3-3)置当前字符位置i为0;3-4)判断当前字符位置i是否小于序列长度,如果当前字符位置i小于序列长度,则执行步骤3-5),如果当前字符位置i大于或者等于序列长度则执行步骤3-10);3-5)取所有参数在i位置上的特征字符组合成特征模式t;3-6)判定特征模式t是否已经存在于事件特征库中;如果模式t已经存在于事件特征库中,则执行步骤3-7),特征模式t没有存在于事件特征库中,则执行步骤3-8);3-7)把特征模式t的出现次数加1;3-8)把特征模式t的出现次数置为1;3-9)把当前字符位置i加1;然后转至步骤3-4)重复执行上述循环直至当前字符位置i大于或者等于序列长度;3-10)更新所有模式的出现频率,即用该模式的出现次数除以序列长度;3-11)输出结果,更新事件特征库内容;生成事件特征库过程结束。所述的检测判定模块的检测判定包括以下步骤:4-1)取所有参数在当前窗口的数据;4-2)取当前参数在当前窗口的特征向量;4-3)计算该参数特征向量与该参数信息库中各簇中心向量的欧几里得距离di;4-4)求取di中的最小值d;4-5)判断d是否小于给定阈值δ,δ=0.2);如果d<δ,则执行步骤4-6),否则执行步骤4-7);其中,h(w)表示当前窗口w的特征字符,T表示该参数特征字符的集合,di表示w与某个簇中心向量ci之间的欧几里得距离,δ表示给定的阈值;4-6)当前参数在当前窗口的特征字符为距离d所对应的特征字符;4-7)当前参数在当前窗口的特征字符记为“?”;4-8)判断所有参数是否已经处理完;如果参数未处理完则执行步骤4-9),如果所有参数都已经处理完,则执行步骤4-10);4-9)取下一个参数;然后转至步骤重复执行4-2)至4-8)至所有参数都处理完;4-10)把所有参数在当前窗口的特征字符组合成一个特征模式V;4-11)判断事件特征库中是否包含当前特征模式V;4-11)如果事件特征库中没有包含当前特征模式V,则执行步骤4-12),如果事件特征库中已经包含了当前特征模式V,则执行步骤4-14)4-12)当前窗口出现了一个非预期事件N,其特征模式为V;4-13)记录并输出该非预期事件N的相关信息,非预期故障检测判定过程结束;4-14)当前窗口出现了已知事件K,即特征库中模式V所对应的事件;4-14)输出已知事件K的相关信息;非预期故障检测判定过程结束。相对于现有技术,本专利技术采用数据挖掘策略可以自动学习扩充事件特征库,只要有大量数据就能实现自适应式学习,不需要人工干预。用特征字符的组合对故障模式进行了高度抽象,能够检测出新的未知的非预期事件/故障模式,而且还同时记录了新事件/故障所对应的特征模式。本专利技术方法不但为分析新故障提供了详细特征信息和结构信息,而且还使系统具备了自动扩充特征库的能力。附图说明图1是本方法模块框架图。图2是生成参数信息库的流程图。图3是生成事件特征库的流程图。图4是检测判定模块的流程图。图5是一个示例参数信息库。图6是一个示例事件特征库。图7是对新数据进行实时检测判定的示例结果。具体实施方式本专利技术实现了一种时序数据非预期故障检测方法,该方法利用历史数据学习出数据基本特征以及特征组合模式并保存到信息库和特征库中,然后对待检测数据提取特征,并查看其特征组合是否与特征库中已有模式相匹配。如果待检测特征模式与库中已有模式匹配,那么待检测数据出现的就是已知事件,否则就检测到了非预期事件。非预期事件就是潜在的非预期故障,一般反映了系统运行异常或故障。参照图1,实现本专利技术的系统包括数据预处理模本文档来自技高网...
一种时序数据非预期故障检测方法

【技术保护点】
一种时序数据非预期故障检测方法,其特征在于:实现该方法的系统包括数据预处理模块(1‑1)、TK‑Means聚类模块(1‑2)、特征库生成模块(1‑3)、检测判定模块(1‑4),其具体步骤是;1)首先,采用数据预处理模块(1‑1)对原始数据进行去野值、等间隔处理文件以及归一化处理,获取标准化的数据,并且提取相关多特征向量;2)其次,采用TK‑Means聚类模块(1‑2)对特征向量进行聚类,然后基于聚类结果,将原始数据表示成特征字符串;3)然后,采用特征库生成模块(1‑3)对每个参数在数据预处理和聚类过程中的基本数据记录到参数信息库中,包括每个参数的最大值、最小值、簇中心向量和特征字符对应情况,然后生成一个用于记录所有参数组合特征的出现次数与频率的事件特征库;4)最后,通过检测判定模块(1‑4)对新数据实时获得其特征向量,并对同一时刻多个参数特征的组合与特征库中数据进行对比,如果该组合特征在特征库中已有记录,那么就是已知模式,否则就是检测到非预期模式,非预期模式就是潜在的非预期故障。

【技术特征摘要】
1.一种时序数据非预期故障检测方法,其特征在于:实现该方法的系统包括数据预处理模块(1-1)、TK-Means聚类模块(1-2)、特征库生成模块(1-3)、检测判定模块(1-4),其具体步骤是;1)首先,采用数据预处理模块(1-1)对原始数据进行去野值、等间隔处理文件以及归一化处理,获取标准化的数据,并且提取相关多特征向量;2)其次,采用TK-Means聚类模块(1-2)对特征向量进行聚类,然后基于聚类结果,将原始数据表示成特征字符串;3)然后,采用特征库生成模块(1-3)对每个参数在数据预处理和聚类过程中的基本数据记录到参数信息库中,包括每个参数的最大值、最小值、簇中心向量和特征字符对应情况,然后生成一个用于记录所有参数组合特征的出现次数与频率的事件特征库;4)最后,通过检测判定模块(1-4)对新数据实时获得其特征向量,并对同一时刻多个参数特征的组合与特征库中数据进行对比,如果该组合特征在特征库中已有记录,那么就是已知模式,否则就是检测到非预期模式,非预期模式就是潜在的非预期故障。2.根据权利要求1所述时序数据非预期故障检测方法,其特征在于:所述的数据预处理模块(1-1)“去野值处理”是指删除无效野值,保留有效值;对数据进行等间隔处理保证在连续时间段内任意两个数据点之间的时间间隔相同;数据经过等间隔处理之后进行归一化处理消除不同量纲对结果的影响从而获取标准化的数据。3.根据权利要求1所述时序数据非预期故障检测方法,其特征在于:所述的TK-Means聚类模块(1-2)采用申请号:2015105516228,一种时序数据异常特征的挖掘系统及方法,其中,‘a’表示最频繁出现的特征,‘b’表示次频繁出现的特征,依此类推;出现概率小于给定阈值0.02的特征被表示为‘?’;空数据,即未记录数据的区间或者被删除的区间,则用‘#’来表示。4.根据权利要求1所述时序数据非预期故障检测方法,其特征在于:所述的特征库生成模块(1-3)生成一个参数信息库和一个事件特征库:所述的参数信息库的建立包括:2-1)取一个待处理参数;2-2)在参数信息库中创建该参数的记录;2-3)记录该参数的最大值和最小值特征;2-4)记录该参数均值、方差、小波系数、傅立叶系数、频率特征的最大值和最小值;2-5)获得该参数TK-Means聚类的结果;2-6)聚类结果记录该参数每个簇中心向量及其对应的特征字符;2-7)判断当前是否处理完所有的参数;如果未处理完所有参数,则转至步骤2-1重复执行上述过程;如果已经处理完所有参数,则执行步骤2-8);2-8)输出结果,更新参数信息库内容;生成参数信息库过程结束;所述的事件特征库的建立过程:3-1)对齐所有参数的特征字符序列;3-2)记录特征...

【专利技术属性】
技术研发人员:鲍军鹏赵静杨天社魏强王徐华吴冠王小乐齐勇
申请(专利权)人:西安交通大学中国西安卫星测控中心
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1