一种基于改进核Fisher的化工过程故障诊断方法技术

技术编号:14420874 阅读:95 留言:0更新日期:2017-01-12 23:10
一种基于改进核Fisher的化工过程故障诊断方法如下:步骤1、采集原始的化工过程故障数据并进行归一化处理,将此数据分为训练集和测试集;步骤2、将训练集输入改进类间距的核Fisher方法中,输出阈值参数并用交叉验证法优化选取高斯径向基核函数的参数;步骤3、将步骤1输出的测试集输入改进类间距的核Fisher方法进行投影;步骤4、根据步骤2输出的阈值参数判断经步骤3投影后数据是否为边界点,并采用马氏距离结合改进后的K‑NN算法来判断故障类别。本发明专利技术所提方法改善了样本数据在投影空间的分布,并引入边界阈值参数,马氏距离与改进K‑NN算法的配合,在保证分类时间尽量短的情况下提高了总体样本的分类准确率。

【技术实现步骤摘要】

本专利技术涉及一种化工过程的故障诊断方法,尤其涉及一种基于改进核Fisher的化工过程故障诊断方法,属于自动化检测

技术介绍
现代的化工过程具有大规模、高复杂性、多变量和在闭环控制下运行等特点。但是化工过程存在着许多不安全因素,比其他生产有着更大的危险性,如果化工过程的设备发生了一些小故障而不能及时排除,可能导致整个生产过程都不能正常的工作,会造成一定的人力和财力的损失。所以确保化工过程安全可靠的运行是很重要的,而进行故障诊断是最重要的一种手段。故障诊断技术通过监控生产过程的运行状态,检测状态信息,在故障发生后迅速定位故障源,隔离并消除故障。化工过程产生了大量数据,这些数据具有多变量、非线性、时变、强耦合和高噪声等特点。基于数据驱动的统计方法在化工过程得到了广泛的运用,目前常用的统计方法有:主元分析、最小二乘、独立元分析、Fisher判别分析等方法,然而这些方法有其局限性,都是基于线性变换的方法,但是对于复杂的化工过程,这些方法已经不能满足需要。将核方法引入Fisher判别分析中,很大程度上解决了原始数据呈非线性分布问题,引起了人们的重视。但是运用核Fisher分析法进行故障诊断时,还是存在一些问题:1、对于故障样本在投影空间的投影数据,存在边界数据由于远离类中心且处于不同类的分界处,导致归类模糊误判的问题;2、在投影空间,有的样本类间距离存在很大差异性,导致类间距小的类别间出现投影数据混叠,互相掩盖的现象。针对以上问题,目前缺乏比较好的解决办法。本专利技术提出的方法不仅适用于映射样本空间不同类别数据出现混叠的情况,而且适用于映射样本空间出现边界样本较多的情况,不仅能有效的兼顾测试样本的分类时间,而且能提高分类的准确率。
技术实现思路
本专利技术的目的是针对现有故障诊断方法存在的部分故障样本的映射空间仍然会出现混叠现象以及类别边界上数据归类模糊问题,提出了一种基于改进核Fisher的化工过程故障诊断方法。为达到上述目的,本专利技术采用以下技术方案。一种基于改进核Fisher的化工过程故障诊断方法,具体步骤如下:步骤1、采集原始的化工过程故障数据,对此原始数据进行归一化处理,再将归一化处理后的原始数据分为两部分:训练集和测试集;其中,所述的采集原始的化工过程故障数据,称为原始数据;步骤2、将步骤1输出的训练集输入改进类间距的核Fisher方法中,输出阈值参数,并用交叉验证法优化选取高斯径向基核函数的参数,得到训练好的改进类间距的核Fisher方法;所述的改进类间距的核Fisher方法具体步骤见实施例1;所述的阈值参数记为ε,其详细定义见实施例1;所述的交叉验证法见文献:2013年,范永东,题目为“模型选择中的交叉验证方法综述”;步骤3、将步骤1输出的测试集输入改进类间距的核Fisher方法进行投影;步骤4、根据步骤2输出的阈值参数判断经步骤3投影后的测试集中的数据是否为边界点,并决定采用马氏距离还是用改进后的K-NN算法来判断此测试集中数据的故障类别;其中,测试集中的数据简称测试数据;步骤4具体如下:4.1如果测试数据不是边界点,则采用马氏距离来判断该数据的故障类别;4.2如果测试数据是边界点,则用改进后的K-NN算法来判别该数据的故障类别;至此,经过步骤1到步骤4,完成了一种基于改进核Fisher的化工过程故障诊断方法。有益效果本专利技术所提出的一种基于改进核Fisher的化工过程故障诊断方法,与其他故障诊断方法相比,具有如下有益效果:1.改进类间距的核Fisher方法能够改善样本数据在投影空间的分布,利于后续的故障类别分类;2.在测试数据不是边界点时,采用马氏距离来进行分类,马氏距离可以排除不同变量间的相关性干扰,能计算样本与不同总体间的相似性,更适合用来判断故障类别;3.本专利技术提出的方法改进了投影后故障样本的具体分类方法,通过引入边界阈值参数ε,有效的分离出了边界样本点,通过改进K-NN算法,大大提高了边界样本点的分类准确率;4.通过马氏距离与改进K-NN算法的配合,在保证分类时间尽量短的情况下,使得总体样本的分类准确率得到了提高。附图说明图1为本专利技术一种基于改进核Fisher的化工过程故障诊断方法及实施例1的流程图;图2为本专利技术一种基于改进核Fisher的化工过程故障诊断方法实施例2中三类故障的核Fisher特征向量分布图;图3为本专利技术一种基于改进核Fisher的化工过程故障诊断方法实施例2中时间随阈值的变化;图4为本专利技术一种基于改进核Fisher的化工过程故障诊断方法实施例3中核Fisher投影;图5为本专利技术一种基于改进核Fisher的化工过程故障诊断方法实施例3中改进类间距的核Fisher投影。具体实施方式本专利技术提供了一种基于改进核Fisher的化工过程故障诊断方法,对于化工过程的故障诊断具有实际的借鉴意义。传统的故障诊断方法大多是基于线性变换的方法,但是针对化工过程故障诊断数据呈非线性分布,数据类别复杂的现象,这些传统的方法显然已经不能满足需要。而核Fisher方法很好的解决了数据的非线性分布问题,它首先利用核函数的映射将低维非线性问题转化为高维的线性问题,然后依据样本的不同特征,将测试数据投影到某个方向,使得测试数据的投影的类间离散度最大化并同时最小化类内离散度,从而达到分离故障样本的效果。下面结合说明书附图及实施例,对本专利技术方法作进一步说明。实施例1本专利技术提出的一种基于改进核Fisher的化工过程故障诊断方法,更是在核Fisher方法的基础上,从类间离散度和边界数据的分类方法两方面进行改进,提高了故障诊断的准确率。图1是本专利技术一种基于改进核Fisher的化工过程故障诊断方法,其中也包含了本实施例中相应步骤的流程图。从图1可以看出,本专利技术包括如下步骤:步骤A、输入原始数据;步骤B、归一化处理,并输出训练集和测试集;步骤C、针对步骤B输出的不同类型数据,分别进行如下操作:C.1对训练集中数据采用交叉验证法选取核参数,得到改进类间距的核Fisher方法;C.2对测试集中数据直接输入改进类间距的核Fisher方法进行处理;步骤D、根据投影后的测试数据是否为边界点,采用改进的K-NN算法配合马氏距离判别法来进行故障类别判断,最后输出测试集故障数据类别。本实施例将本专利技术所提出的一种基于改进核Fisher的化工过程故障诊断方法的步骤进行细化,具体针对步骤2中改进类间距的核Fisher方法,以及步骤4中的具体故障判别方法进行深入阐述。改进类间距的核Fisher方法基于核Fisher方法,核Fisher方法包含如下:假设在p维空间的所有样本点有C类,即p维空间的所有样本点包含在C个集合中,这些集合记为G1,G2,…,GC,此C个集合中的样本总数为N;第j(j=1,2,...C)个类Gj包含Nj个样本记做且N1+N2+...NC=N;样本x∈Rp,其中,Rp是p维空间,通过非线性高维映射φ后,即:φ(x)∈H,其中,H为高维特征空间;在H中,训练样本的类内离散度SW和类间的离散度SB分别通过公式(1)和公式(2)计算:SW=1NΣi=1CΣj=1Ni(φ(xij)-mi)(φ(xij)-mi)T---(1)]]>SB=1NΣi=1CNi(mi-m)(m本文档来自技高网
...
一种基于改进核Fisher的化工过程故障诊断方法

【技术保护点】
一种基于改进核Fisher的化工过程故障诊断方法,其特征在于:具体步骤如下:步骤1、采集原始的化工过程故障数据,对此原始数据进行归一化处理,再将归一化处理后的原始数据分为两部分:训练集和测试集;步骤2、将步骤1输出的训练集输入改进类间距的核Fisher方法中,输出阈值参数,并用交叉验证法优化选取高斯径向基核函数的参数;步骤3、将步骤1输出的测试集输入改进类间距的核Fisher方法进行投影;步骤4、根据步骤2输出的阈值参数判断经步骤3投影后的测试集中的数据是否为边界点,并决定采用马氏距离还是用改进后的K‑NN算法来判断此测试集中数据的故障类别,具体为:4.1如果测试数据不是边界点,则采用马氏距离来判断该数据的故障类别;4.2如果测试数据是边界点,则用改进后的K‑NN算法来判别该数据的故障类别;至此,经过步骤1到步骤4,完成了一种基于改进核Fisher的化工过程故障诊断方法。

【技术特征摘要】
1.一种基于改进核Fisher的化工过程故障诊断方法,其特征在于:具体步骤如下:步骤1、采集原始的化工过程故障数据,对此原始数据进行归一化处理,再将归一化处理后的原始数据分为两部分:训练集和测试集;步骤2、将步骤1输出的训练集输入改进类间距的核Fisher方法中,输出阈值参数,并用交叉验证法优化选取高斯径向基核函数的参数;步骤3、将步骤1输出的测试集输入改进类间距的核Fisher方法进行投影;步骤4、根据步骤2输出的阈值参数判断经步骤3投影后的测试集中的数据是否为边界点,并决定采用马氏距离还是用改进后的K-NN算法来判断此测试集中数据的故障类别,具体为:4.1如果测试数据不是边界点,则采用马氏距离来判断该数据的故障类别;4.2如果测试数据是边界点,则用改进后的K-NN算法来判别该数据的故障类别;至此,经过步骤1到步骤4,完成了一种基于改进核Fisher的化工过程故障诊断方法。2.如权利要求1所述的一种基于改进核Fisher的化工过程故障诊断方法,其特征还在于:步骤1中,所述的采集原始的化工过程故障数据,称为原始数据。3.如权利要求1所述的一种基于改进核Fisher的化工过程故障诊断方法,其特征还在于:步骤2中所述的阈值参数记为ε,所述的改进类间距的核Fisher方法基于核Fisher方法,核Fisher方法如下:步骤I、构造核Fisher方法并计算类内离散度和类间离散度;假设在p维空间的所有样本点有C类,即p维空间的所有样本点包含在C个集合中,这些集合记为G1,G2,…,GC,此C个集合中的样本总数为N;第j(j=1,2,...C)个类Gj包含Nj个样本记做且N1+N2+...NC=N;样本x∈Rp,其中,Rp是p维空间,通过非线性高维映射φ后,即:φ(x)∈H,其中,H为高维特征空间;在H中,训练样本的类内离散度SW和类间的离散度SB分别通过公式(1)和公式(2)计算:SW=1NΣi=1CΣj=1Ni(φ(xij)-mi)(φ(xij)-mi)T---(1)]]>SB=1NΣi=1CNi(mi-m)(mi-m)T---(2)]]>其中,训练样本为步骤1输出的训练集中的一个样本;上式(1)和(2)中,mi表示H中第i类训练集的均值:而m表示所有样本点在特征空间H中的均值:T代表转置;计算公式(1)和公式(2)的展开式时,需要计算两个高维特征空间的向量内积,如mi.m,而所有这些向量内积计算麻烦,因此引入核函数来计算:在默认参数的情况下,RBF核函数(高斯核函数)具有较好的分类能力;采用RBF核函数计算公式(1)和公式(2)中的内积:k(x,z)=exp(-||x-z||2δ2)---(3)]]>式(3)中,参数δ为正常数,代表高斯宽度;k(x,z)表示H空间的任意向量x和z的内积,本发明采用交叉验证法选取参数δ;上述核Fisher方法在计算类间离散度存在如下问题:类间差异的权重(对应公式(2)中的Ni参数,)仅仅是依据不同类别样本数在总体样本中所占比例计算,但是在实际情况中,会出现有部分类距离其他类别很远,但是有些类别的间距很小,容易出现类间差异较小的类...

【专利技术属性】
技术研发人员:徐发富马立玲王军政沈伟汪首坤李静
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1