基于平均影响值数据变换的特征加权K近邻故障诊断方法技术

技术编号:17542068 阅读:212 留言:0更新日期:2018-03-24 19:37
本发明专利技术公开了一种基于平均影响值数据变换的特征加权K近邻故障诊断方法。本发明专利技术中MIV的计算过程是通过对系统的输入值做等比例增加和减小,得到增加和减少后的数据分别作为系统输入,求解其对应的系统输出值。求取各个输入变量做等比例增加对应的系统输出值减去各个输入变量做等比例减小对应的系统输出值得到系统输入的各个参变量对系统输出的影响程度值及MIV值;采用多次计算求平均值的方式确定各个特征变量最终的MIV值。通过对MIV值一定的等比例放缩,将其用作K近邻方法输入数据的特征权值来进行故障诊断。通过UCI标准数据集的仿真测试,验证了本方法的有效性。

A feature weighted K nearest neighbor fault diagnosis method based on average influence value data transformation

The invention discloses a feature weighted K nearest neighbor fault diagnosis method based on the average influence value data transformation. The calculation process of MIV in the present invention is to increase or decrease the input value of the system by increasing the proportion and decreasing the data. For each input variables and increase the proportion of output value corresponding to the system output system subtracted from each input variable do to reduce the proportion of the corresponding to the degree of influence of each parameter on the system input and system output value and MIV value; multiple averaging calculation method to determine the final MIV value of each feature variable. By reducing the equal proportion of the MIV value, it is used as the characteristic weight of the input data of the K nearest neighbor method to diagnose the fault. The validity of this method is verified by the simulation test of UCI standard data set.

【技术实现步骤摘要】
基于平均影响值数据变换的特征加权K近邻故障诊断方法
本专利技术属于故障诊断领域,具体涉及一种基于平均影响值数据变换的特征加权K近邻故障诊断方法。
技术介绍
在现在工业生产和社会服务中,各类自动化设备越来越复杂,使得精细建模较为困难。但近年来传感器技术的发展,我们可以获得大量的监测数据。常存在着大量的高度相关的状态变量,而这些变量的瞬时采样值都反映着设备运行是否正常、系统输出是否达标等关键信息。因此基于数据驱动的故障诊断方法越来越受到人们的重视。然而基于数据驱动的方法必然要面临各类变量量纲差异的问题,现有基于数据驱动的故障诊断方法有很多,像主元分析、小波变换、支持向量机等大多是在原有量纲的基础上进行故障诊断。即使进行数据标准化,同样要面临标准化之后变量之间的多样性降低,几何角度呈均匀分布等问题。这给后续数据压缩和特征提取带来了一定的难度。尽管后来提出了一些基于像信息增益、信息熵、Gini不纯度等方法求取特征权值的方法,但因其计算的复杂性,使得其实际应用较为困难。为解决上述问题,从业人员进行了大量的探索,也提出了一些方法。其中一种称为相对主元分析(RelativePrincipleComponentAnalysis,RPCA)的方法,它利用系统的先验信息来引入每个变量的权重,以消除由于标准化后数据“均匀”分布造成的特征提取困难的问题,但是该方法的不足之处在于它需要来自系统的大量先验信息这在实际工程应用中难以获得。MIV方法能够反映处神经网络的权重矩阵的变化情况,被认为评价神经网络输入参数相关性的最佳指标,MIV可以测定出神经网络输入神经元对输出神经元的影响权重。MIV符号代表相关的方向,绝对值大小代表影响的相对权重。
技术实现思路
本专利技术针对现有技术的不足,设计一种基于平均影响值数据变换的特征加权K近邻故障诊断方法。本方法通过运用平均影响值(MIV)算法计算经过标准化处理后各个特征分量对系统输出的影响程度,根据其数值上的比例关系为各个特征变量赋权值。然后,采用UI-balance标准数据集,根据创建的机器学习故障诊断模型进行模型测试,并将其应用到智能电网信息物理系统的攻击检测中。本专利技术包括以下各步骤:步骤(1)依据信号的前向传播和误差的反向传播来构建BP神经网络:步骤(1-1)网络的初始化:假设输入层的节点个数为n,隐含层的节点个数为l,输出层的节点个数为m;各层节点的个数无统一的标准,一般是根据输入输出序列在经过多次实验来确定。输入层到隐含层的权重ωij,隐含层到输出层的权重为ωjk',输入层到隐含层的偏置为aj,隐含层到输出层的偏置为bk'。以上权重及偏置参数的初始化是随机的,在接下来的多次迭代中进行一次次的更新修正。学习速率为η,取[0.01,0.1]之间,激励函数g(x)的输出结果是[-1,1]或者[0,1],其中激励函数g(x)有诸多形式,本方法将其取作Sigmoid函数。形式为:步骤(1-2)正向传递:有了输入和初始参数以及激活函数,一个节点的输出表示如下,对应输入乘以连接隐含层的对应权值加上阈值,最后经过激活函数得到隐含层节点的一个输出,假设系统输入为X=[x1,x2,....xn],计算表达式如下。隐含层节点的输入:隐含层节点的输出:输出节点的输出:其中,;i=1,2,…,n;j=1,2,…,l;k'=1,2,…,m;步骤(1-3)反向传递:误差计算,我们定义损失函数(lossfunction)如下:以上,Y为期望输出,O为实际输出,权值更新即是隐含层和输出层权值更新。其表达式如下隐含层到输出层的权值更新计算:ωjk'=ωjk'+ηHjek'(8)输出层到隐含层的权值更新计算:步骤(1-4)判断算法迭代是否结束,一种是迭代次数达到上限,另一种是判断相邻的两次误差之间的差别是否小于指定的值。步骤(2)求取数据集的各输入变量对输出的MIV,MIV是用于确定输入神经元对输出神经元影响大小的一个指标,其符号代表相关的方向,绝对值大小代表影响的相对重要性。具体计算过程如下:IVi=Oi,+-Oi,-(16)综上,取0.1≤δ≤0.3;表示所有样本的第i个特征分量分别增减δ后的矩阵;表示第k'个样本数据的第i个特征分量分别增减δ后的向量;xi(k')表示第k'样本数据的第i个特征分量的值。网络训练终止后,将训练样本集和分别作为仿真样本利用已建成的网络进行仿真,得到两个仿真结果Oi,+和Oi,-,IVi即为样本数据中第i个变量的平均影响值。同理可求得样本数据中其它各变量的平均影响值。IV=[IV1,IV2,…,IVn]T(17)IV(ImpactValue)中的各个参数即为样本数据中各个特征变量对输出的影响值。最后,多次仿真取m组IV值,求取其中对应特征变量IV值的平均值,记作MIV。MIV绝对值的大小即为各自变量对网络输出影响的相对重要性,从而实现样本数据特征的加权。步骤(3)K近邻算法设计a.训练样本中找k个近邻计算测试样本中每一个样本x(k'),k'=1,2,…,N,与训练样本之间的欧氏距离,并找到距离它最近的k'个样本。di,j=||x(i)-x(j)||2,i≠j(19)上式中,x(i)和x(j)分别表示两个样本,i,j=1,2,…,N。b.统计计算k个近邻中属于各类的概率以上k表示k个近邻,kα表示k个近邻中属于α类的样本个数,α=1,2,…,c,其中c为样本中类别个数。c.故障诊断对于一个新的样本x(k),根据式(19)计算其k个近邻;根据式(20)统计计算p(α);将p(α)从大到小排序,pmax(α)所属的类就是测试样本x(k)所属的故障类。步骤(4)载入UI-balance数据集进行故障诊断仿真测试为验证本文提出算法的有效性,我们使用UCI标准数据集中balance数据集进行对比仿真实验。其中balance数据集中有625组数据,每组数据包含4个特征(4×625),共3类,1类数据49组,2类数据288组,3类数据288组。标准化处理后,由基于MIV的BP神经网络算法进行数据特征加权。然后我们采用交叉验证的方法选取500组(80%)数据作为训练样本,用于分类器构建,剩下的125组(20%)数据作为测试样本,用于测试计算本文提出的特征加权算法对分类器性能的影响。样本数据特征权值(MIV)的求取过程如下:a.原始样本数据的标准化,按照如下方式标准化b.将标准化后的数据运用基于MIV的BP神经网络进行特征变量权值求取,对神经网络的部分参数进行设置,本文将神经网络的最大迭代次数设置成2000,期望目标误差最小值设为1.0*e-5。针对同一标准UCI-balance数据集,分别采用普通的标准化处理和MIV-BP神经网络加权处理后,用机器学习算法中的KNN算法进行分类。本专利技术的有益效果:利用基于平均影响值数据变换的特征加权方法,可使K-近邻故障诊断方法的诊断准确率最高提高8%;由于BP神经网络中的部分参数是随机初始化,故造成每次计算得到的各变量的IV值不同,故采用多次计算求平均值的方式确定各个特征变量最终的MIV值,通过MIV加权后的分类准确率也均高于直接数据标准化的分类准确率。最终将其应用到智能的电网信息物理系统的攻击检测中,相较于传统检测手段,本专利技术提出的算法有效提高了攻击的检测精度。本文档来自技高网
...
基于平均影响值数据变换的特征加权K近邻故障诊断方法

【技术保护点】
基于平均影响值数据变换的特征加权K近邻故障诊断方法,其特征在于该方法具体包括以下各步骤:步骤(1)依据信号的前向传播和误差的反向传播来构建BP神经网络:步骤(1‑1)网络的初始化:假设输入层的节点个数为n,隐含层的节点个数为l,输出层的节点个数为m;输入层到隐含层的权重ωij,隐含层到输出层的权重为ωjk',输入层到隐含层的偏置为aj,隐含层到输出层的偏置为bk';以上权重及偏置参数的初始化是随机的,在接下来的多次迭代中进行一次次的更新修正;学习速率为η,取[0.01,0.1]之间,激励函数g(x)的输出结果是[‑1,1]或者[0,1],其中激励函数g(x)将其取作Sigmoid函数;形式为:

【技术特征摘要】
1.基于平均影响值数据变换的特征加权K近邻故障诊断方法,其特征在于该方法具体包括以下各步骤:步骤(1)依据信号的前向传播和误差的反向传播来构建BP神经网络:步骤(1-1)网络的初始化:假设输入层的节点个数为n,隐含层的节点个数为l,输出层的节点个数为m;输入层到隐含层的权重ωij,隐含层到输出层的权重为ωjk',输入层到隐含层的偏置为aj,隐含层到输出层的偏置为bk';以上权重及偏置参数的初始化是随机的,在接下来的多次迭代中进行一次次的更新修正;学习速率为η,取[0.01,0.1]之间,激励函数g(x)的输出结果是[-1,1]或者[0,1],其中激励函数g(x)将其取作Sigmoid函数;形式为:步骤(1-2)正向传递:有了输入和初始参数以及激活函数,一个节点的输出表示如下,对应输入乘以连接隐含层的对应权值加上阈值,最后经过激活函数得到隐含层节点的一个输出,假设系统输入为X=[x1,x2,....xn],计算表达式如下;隐含层节点的输入:隐含层节点的输出:输出节点的输出:其中,;i=1,2,…,n;j=1,2,…,l;k'=1,2,…,m;步骤(1-3)反向传递:误差计算,我们定义损失函数如下:以上,Y为期望输出,O为实际输出,权值更新即是隐含层和输出层权值更新;其表达式如下隐含层到输出层的权值更新计算:ωjk'=ωjk'+ηHjek'(8)输出层到隐含层的权值更新计算:

【专利技术属性】
技术研发人员:文成林姬思雨
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1