【技术实现步骤摘要】
一种基于实时数据流量化复杂度的异常识别的方法
[0001]本专利技术涉及数据流异常识别的方法
,尤其涉及基于实时数据流量化复杂度的异常识别的方法。
技术介绍
[0002]随着现代产品、网络和流程,其本身及不同属性/数据之间的耦合关系变得更加复杂,系统的异常种类和数量迅速增加。大数据时代的到来,大量高速实时的数据流也变得越来越常见。在实际应用中,复杂系统中有着大量潜在的异常故障。识别并预测系统异常及故障一般采用动态模型或过程,及大量准确且高质量的样本数据。
[0003]然而,对象系统的数学模型经常过于复杂或根本不存在,关键设备的典型数据(历史工作数据、故障数据以及分析数据等)的获取代价通常十分高昂,且具有很强的不确定性和不完整性,使得这些传统方法对系统的诊断和预测非常看男。
[0004]此外,系统本身会随着时间的推移而发展并产生更多不确定性,一旦发生未知的异常类型,传统方法必须重新学习,在实际应用中几乎不可能,无法达到系统诊断预测的业务要求
技术实现思路
[0005]本专利技术的目的是为了 ...
【技术保护点】
【技术特征摘要】
1.一种基于实时数据流量化复杂度的异常识别的方法,其特征在于,包括以下步骤:步骤一:构造系统的结构化信息度量,构造系统的相空间;步骤二:进行相空间所包含的信息通过信息熵推导进行定量计算和相空间变量之间的非线性相关性通过基于互信息的广义相关系数进行定量计算;步骤三:按照一定的水平模糊数,将相空间分割成等宽单元,并将样本点的数值转化为等价的向量;步骤四:抽取系统中变量之间的依赖规则,通过系统图对系统整体信息结构进行描述;步骤五:由系统变量的信息熵推导,互信息,广义相关系数,及Hadamard矩阵乘上SOE的谱矩阵函数,得到系统的量化复杂度;步骤六:确定系统图拓扑结构稳定性,合成系统健康度指标,分解到不同属性对系统当前状态的贡献量;步骤七:靠近临界复杂度,观察信息熵是否会破坏系统的稳健性并给出相关预警。2.根据权利要求1所述的基于实时数据流量化复杂度的异常识别的方法,其特征在于,用于步骤一中,相空间的构造步骤:步骤一:决定使用的数据通道个数及数据种类;步骤二:定义系统崩溃采样时间及采样频率;步骤三:基于每两个样本数据构造相空间。3.根据权利要求1所述的基于实时数据流量化复杂度的异常识别的方法,其特征在于,用于步骤二中,根据信息熵进行定量的计算公式为:设随机变量X为所给定的信源,则信源X根据信息熵的量化计算:其中:p(x
i
)为X取值等于x
i
的概率,i=1,2,
…
,n;相关变量之间的非线性相关性通过广义相关系数进行定量计算:其中:0<R
g
<1,X与Y的关联性越强,R
g...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。