一种基于数据驱动的报警根源寻找方法技术

技术编号:15691182 阅读:104 留言:0更新日期:2017-06-24 04:10
本发明专利技术公开的一种基于数据驱动的报警根源寻找方法,本发明专利技术通过数据采集、数据时间平稳性检查、数据预处理及参数优化设置步骤,建立变量之间关系的数学模型,然后计算变量间的NTE及NDTE值,从而判断系统变量间是否具有直接的因果关系,该方法不依赖于系统物理模型和先验知识,仅依靠过程测量变量就能获得因果关系,适用性强,可广泛应用于化工、纺织、冶金等工业领域,在报警发出初期就能寻找根源,以便及时隔离和排除故障,减少甚至避免事故发生,提高系统运行的安全性和可靠性,同时也能减少环境污染。

A method of finding the root of alarm based on data driven

A method for data driven alarm based on source disclosed by the invention, data acquisition, time stability check, data preprocessing and parameter optimization of setting process, mathematical model of the relationship between variables, and then calculate the NTE and NDTE variables, in order to determine whether a direct causal relationship of system variables among the methods do not depend on the physical model and prior knowledge, only rely on the process of measurement variables can obtain the causal relationship, strong applicability, can be widely used in chemical, textile, metallurgy and other industries, can be issued in early warning for the root, to prompt isolation and troubleshooting, reduce or even avoid the accidents and improve safety and the reliability of the system, but also can reduce the pollution of the environment.

【技术实现步骤摘要】
一种基于数据驱动的报警根源寻找方法
本专利技术属于安全监控
,特别涉及一种基于数据驱动的报警根源寻找方法。
技术介绍
由于对工业系统安全性和可靠性要求的不断提高,在线、实时地对系统运行过程进行监控成为现代工业系统中必不可少的关键环节。考虑到难以获取系统精确的数学模型和先验知识以及工业系统产生大量历史运行数据等情况,基于数据驱动的过程监控成为现代工业安全监控的主流技术。在故障发生后发出警报能帮助工作人员及时判断系统运行情况,但该方法不能确定警报发生原因。报警根源寻找方法就能够在警报发生时明确报警原因,因而受到了普遍重视。报警根源寻找方法通过一系列措施准确定位故障,辅助工作人员及时隔离并排除故障。经过多年的发展,人们已经提出了多种报警根源寻找技术,主要分为三大类:1)符号有向图方法,依赖于系统的物理模型和先验知识;2)Granger因果分析方法,是基于预测的因果关系;3)转变熵(transferentropy,TE)方法。前两种方法都只适用于线性系统,通过构建模型来获取变量之间的关系,并不适用于大型复杂系统。最后一种方法主要通过计算过程变量的概率密度函数来获取变量之间的因果关系,能够应用于复杂的非线性系统,实用性更强。该类方法的不足在于对建模数据的数量具有较高的要求,而现代工业系统产生海量数据的特点正好弥补这一不足。因此,本专利技术人考虑利用转变熵方法确定变量间的因果关系,为寻找报警根源奠定坚实的基础。
技术实现思路
本专利技术的目的在于提供一种基于数据驱动的报警根源寻找方法,不依赖于系统物理模型和先验知识,仅依靠过程测量变量就能获得因果关系,就可在报警发出初期就能寻找根源,以便及时隔离和排除故障,减少甚至避免事故发生,提高系统运行的安全性和可靠性。为了实现上述目的,本专利技术采用如下技术方案:一种基于数据驱动的报警根源寻找方法,包括以下步骤:步骤一:检测工业系统的工作数据并获得观测变量,并将d个观测变量存储到数据矩阵X中,检查数据的时间平稳性并对数据进行预处理;所述的工作数据包括反应系统运行情况的参数;步骤二:对模型参数进行初始化,并利用Cao准则或者Ragwitz准则优化模型参数;步骤三:计算转变熵矩阵P,包括:A、选取变量:从数据矩阵X中任取两个变量,标记为x、y,共d(d-1)/2种组合;B、计算两个变量间的转变熵:其中,是联合概率密度函数,f(·|·)是条件概率密度函数,w是随机向量假设w的元素是w1,w2,…,ws,∫(·)dw是和分别是x和y历史测量值的嵌入向量,k1和l1分别是y和x的嵌入维数,h1是预测范围;C、计算标准转变熵:其中,H表示熵,是条件熵;且Tx→y≠Ty→x;如果大于规定阈值,则判定两个变量x、y具有因果关系;D、重复步骤B、C直至计算d(d-1),将d(d-1)/2种组合的变量标准转变熵计算出来,存入矩阵P中,然后将具有因果关系的变量用流向图表示;步骤四:基于信息流向图中变量因果关系计算标准直接转变熵:从矩阵P任取x、y、z3个具有因果关系的变量,其中z是中间变量,判断x和y的直接因果关系,包括:1)、计算直接转变熵:其中,v表示随机向量预测范围h=max(h1,h3),嵌入向量是z的历史值,能够为i+h时刻的预测y提供有效信息,是x的历史值,若h=h1,则若h=h3,则且计算Tx→z时,l2和m1是x和z的嵌入维数,h2是预测范围,τ2是时间间隔;计算Tz→y时,k2和m2是y和z的嵌入维数,h3是预测范围,τ3是时间间隔;2)、计算标准直接转变熵:如果大于规定阈值,则说明x和y有直接的因果关系;对步骤三信息流向图中的变量进行上述1)和2)两步计算,验证变量因果关系的真假性;步骤五,根据步骤四的验证结果建立变量直接因果关系图。步骤一中,用增广的富勒检验方法对数据进行时间平稳性检查。所述步骤一对数据进行预处理包括:利用滤波等方法处理数据噪声。步骤四中,从矩阵P任取x、y、z3个具有因果关系的变量,其中变量z可以为空,x、y为相邻变量。采用上述方案后,本专利技术具有以下优点:仅利用反映系统运行的海量数据建立模型,不依赖于系统的物理模型和先验知识,限制条件少,适用性强;此外,在报警初期进行故障定位,能够快速排出故障,减少重大事故发生,提高系统的安全性和可靠性,提高经济效益。下面结合附图对本专利技术做进一步的说明。附图说明图1为本专利技术基于数据驱动的报警根源寻找方法的流程图。图2为变量x、y和z的关系图。图3为变量x、y和z的信息流向图,其中z到y有直接的因果关系。图4为变量x、y和z的信息流向图,其中z到y没有因果关系。图5为基于标准转变熵的信息流向图。图6为标准直接转变熵的计算步骤。图7为基于标准直接转变熵的信息流向图。具体实施方式实施例一结合图1说明本具体实施方式,本专利技术实施例一揭示的一种基于数据驱动的报警根源寻找方法,是按以下步骤进行的:步骤一:检测工业系统的工作数据并获得观测变量,并将d个观测变量存储到数据矩阵X中,此实施例利用了增广的富勒检验方法检查数据的时间平稳性,并对数据进行预处理,预处理包括利用滤波等方法处理数据噪声;其中工作数据包括反应系统运行情况的参数,例如温度、压力、水位等;步骤二:对模型参数进行初始化,并利用Cao准则优化模型参数;模型是指建立变量因果关系的模型,模型参数就是建立模型需要的一些设置参数,预处理后的工作数据是模型的输入;步骤三:计算转变熵矩阵P:A、从数据矩阵X中取3个变量,标记为x、y、z,计算任意两个变量间的标准转变熵值(normalizedTE,NTE),共d(d-1)/2种组合;以这3个变量为例说明标准直接转变熵的计算方法;B、计算x到y的TE值:其中,是联合概率密度函数,f(·|·)是条件概率密度函数,w是随机向量假设w的元素是w1,w2,...,ws,∫(·)dw是和分别是x和y历史测量值的嵌入向量,k1和l1分别是y和x的维数,h1是预测范围;如果Tx→y=0,说明x和y没有因果关系;C、计算x到y的NTE:其中,是条件熵;H表示熵;D、计算x到z的TE值:其中,和是时间间隔τ2的嵌入向量,η是随机向量h2是预测范围;如果Tx→z=0,说明x和z没有因果关系;E、计算x到z的NTE值:F、计算z到y的TE值:其中,和是时间间隔τ3的嵌入向量,是随机向量h3是预测范围;如果Tz→y=0,说明z和y没有因果关系;G、计算z到y的NTE值:对数据矩阵X的任意两个变量都进行TE值的计算,并将该TE值存储到d×d的矩阵P中;矩阵P的对角线元素是变量本身的转变熵,其值为NA;当NTE值大于规定的阈值时,判定两个变量具有因果关系,描述基于NTE的信息流向图;需要说明的是,通常利用高斯核函数估计概率密度函数对单变量概率密度函数可以用下列公式计算其中,N是样本数,γ是减少概率密度函数估计的带宽,c=(4/3)1/5≈1.06;对d维多变量情形,概率密度函数估计可以用下列公式计算其中,s=1,…,d;步骤四:计算标准直接转变熵值(normalizeddirectTE,NDTE):A:计算直接转变熵(directTE,DTE):如图2所示,x引起z和y的变化,为了判断x和y是否具有直接因果关系,定义DTE:其中,v表示随机向量预测范围h=max(h1,h本文档来自技高网...
一种基于数据驱动的报警根源寻找方法

【技术保护点】
一种基于数据驱动的报警根源寻找方法,其特征在于,包括以下步骤:步骤一:检测工业系统的工作数据并获得观测变量,并将d个观测变量存储到数据矩阵X中,检查数据的时间平稳性并对数据进行预处理;所述的工作数据包括反应系统运行情况的参数;步骤二:对模型参数进行初始化,并利用Cao准则或者Ragwitz准则优化模型参数;步骤三:计算转变熵矩阵P,包括:A、选取变量:从数据矩阵X中任取两个变量,标记为x、y,共d(d‑1)/2种组合;B、计算两个变量间的转变熵:公式如下:

【技术特征摘要】
1.一种基于数据驱动的报警根源寻找方法,其特征在于,包括以下步骤:步骤一:检测工业系统的工作数据并获得观测变量,并将d个观测变量存储到数据矩阵X中,检查数据的时间平稳性并对数据进行预处理;所述的工作数据包括反应系统运行情况的参数;步骤二:对模型参数进行初始化,并利用Cao准则或者Ragwitz准则优化模型参数;步骤三:计算转变熵矩阵P,包括:A、选取变量:从数据矩阵X中任取两个变量,标记为x、y,共d(d-1)/2种组合;B、计算两个变量间的转变熵:公式如下:其中,是联合概率密度函数,f(·|·)是条件概率密度函数,w是随机向量假设w的元素是w1,w2,...,ws,∫(·)dw是和分别是x和y历史测量值的嵌入向量,k1和l1分别是y和x的嵌入维数,h1是预测范围;C、计算标准转变熵:其中,H表示熵,是条件熵;且Tx→y≠Ty→x;如果大于规定阈值,则判定两个变量x、y具有因果关系;D、重复步骤B、C直至计算d(d-1),将d(d-1)/2种组合的变量标准转变...

【专利技术属性】
技术研发人员:陈豪张景欣王耀宗张丹蔡品隆
申请(专利权)人:泉州装备制造研究所
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1