一种云计算环境下故障检测方法技术

技术编号:21438148 阅读:51 留言:0更新日期:2019-06-22 13:49
本发明专利技术公开了一种云计算环境下故障检测方法,本发明专利技术方法为:监测数据特征提取,通过计算云计算环境监测数据集中的任意两个特征之间的相关性系数值选取特征以得到故障特征集;根据故障特征集中对应的特征序号,提取故障数据的特征数据形成训练数据集,对训练数据集中的特征进行平均值、方差计算,并构建故障模型参数二维数组,将其放入故障库中;按照故障特征集提取监测异常数据,判断监测异常数据的故障类型是否与当前故障库已知故障相似,对与已知故障无法匹配的监测异常数据进行未知故障检测。本发明专利技术通过对故障模型的不断更新实现了故障检测的自适应性以及实现已知故障与未知故障的检测,为故障恢复做准备。

【技术实现步骤摘要】
一种云计算环境下故障检测方法
本专利技术涉及一种云计算环境下故障检测方法,属于云故障检测领域。
技术介绍
近年来,云计算的应用技术越来越广泛,然而大量的恶意攻击和其自身的复杂性与大规模性使得系统及其上的各种软硬件经常发生故障,引起部分甚至所有服务的失效。云计算故障检测技术已经成为该领域的研究热点。云计算环境下的故障检测主要研究如何对云计算环境中出现的故障进行检测、分离和识别,即判断故障是否发生及故障发生的种类。饶翔等提出一种基于故障注入测试的故障特征提取方法,首先过滤噪声日志;然后构造故障识别器识别不同故障的早期特征;最后为每类故障构造限状态追踪器追踪该故障的后期传播状态,从而在故障被识别出来后持续跟踪故障传播状态。目前,针对云计算故障数据检测的方法主要通过采集数据建立故障训练数据训练模型,然后对待检测云计算数据进行检测,并没有考虑到如何及时检测未知故障,且故障类型库的更新不够及时,将影响新故障的有效识别。
技术实现思路
本专利技术提供了一种云计算环境下故障检测方法,有助于判断云计算环境下发生的已知、未知故障及类型,同时还可以用于故障数据的更新。本专利技术的技术方案是:一种云计算环境下故障检测方法,所述方法的具体步骤如下:所述方法的具体步骤如下:Step1、监测数据特征提取,通过计算云计算环境监测数据集中的任意两个特征之间的相关性系数值选取特征以得到故障特征集;Step2、根据故障特征集中对应的特征序号,提取故障数据的特征数据形成训练数据集,对训练数据集中的特征进行平均值、方差计算,并构建故障模型参数二维数组,将其放入故障库中;Step3、已知故障检测:按照故障特征集提取监测异常数据,判断监测异常数据的故障类型是否与当前故障库已知故障相似,对无法判断的故障类型,执行Step4;Step4、未知故障检测,对与已知故障无法匹配的监测异常数据进行未知故障检测。所述Step1具体如下:Step1.1、初始化相关性系数矩阵RelationMatrix为空,故障特征集FaultFeatureSet置空,判断栈EstimateStack值为空,i=1,j=1,输入包含m个特征的云计算监测数据集MonitorData,其中MonitorData={d1,d2,d3,…,dn},dτ=(x1,x2,…xm),τ=1,2,…n,dτ表示第τ条数据,xm表示第m个特征对应的值,执行Step1.2;Step1.2、根据公式(1)计算MonitorData中前一个特征与后续其余特征相关性系数,并将结果存入到矩阵RelationMatrix中,执行Step1.3;其中,rij表示第i个特征与第j个特征的的相关性系数,xik表示MonitorData中第k条数据的第i个特征对应的值,yjk表示MonitorData中第k条数据的第j个特征对应的值,n为MonitorData中的数据个数;Step1.3、判断i≤m:如果是,则执行Step1.4;否则,执行Step1.11;Step1.4、判断RelationMatrix的第i列是否为null:如果是,执行Step1.5;否则,执行Step1.6;Step1.5、i++,执行Step1.3;Step1.6、将i存储到FaultFeatureSet中,并查找RelationMatrix中第i列中值在[-1,-0.8]∪[0.8,1]范围内的所有数值,并将这些数值所对应的行号存放到EstimateStack中,执行Step1.7;Step1.7、判断EstimateStack是否等于null:如果是,则执行Step1.5;否则,执行Step1.8;Step1.8、取出EstimateStack栈顶元素并赋值给j,执行Step1.9;Step1.9、查找RelationMatrix中第j列中在[-1,-0.8]∪[0.8,1]范围内的所有数值,并将这些数值所对应的行号存放到EstimateStack中,并去掉重复元素,执行Step1.10;Step1.10、将RelationMatrix中第j列中所有元素置空,执行Step1.7;Step1.11、输出故障特征集FaultFeatureSet,执行Step2。所述Step2具体如下:Step2.1、初始化故障模型参数二维数组FaultModelArray,平均值参数mean=0,方差值参数variance=0,随机参数ran_k=1,len=0,输入故障数据FaultData,故障数据FaultData为采集包含m个特征的云计算监测数据集MonitorData所代表的对象产生的历史故障数据,执行Step2.2;Step2.2、将与FaultFeatureSet中对应的特征序号对故障数据FaultData进行特征数据提取形成训练数据集TrainData,执行Step2.3;Step2.3、len=TrainData中包含的特征个数,执行Step2.4;Step2.4、判断ran_k≤len:如果是,执行Step2.5;否则,执行Step2.9;Step2.5、获取TrainData中第ran_k个特征的数据,执行Step2.6;Step2.6、计算第ran_k个特征的平均值与方差并赋值给mean,variance,执行Step2.7;Step2.7、将mean,variance存入FaultModelArray的第ran_k行,执行Step2.8;Step2.8、ran_k++,执行Step2.4;Step2.9、为FaultModelArray添加标签,执行Step2.10;其中标签包括故障类型、故障描述;Step2.10、将带有标签的FaultModelArray放入到故障库中,执行Step3。所述Step3具体如下:Step3.1、初始化故障概率initP=1,概率数组ProbabilityArray,临时变量ti=1,tj=0,next=1,p=0,数组temp,阈值T=0.0000008,输入监测异常数据MonitorAnomalyData,MonitorAnomalyData是对监测数据经过判断之后确定为异常的数据,MonitorAnomalyData={t1,t2,t3,…,tn},tτ=(z1,z2,…zm),τ=1,2,..,n,tτ表示第τ条数据,zm表示第m个特征对应的值,执行Step3.2;Step3.2、根据FaultFeatureSet中包含的特征序号提取MonitorAnomalyData中对应的特征,形成待检测故障数据集U,执行Step3.3;Step3.3、将故障库中的故障种类数量赋值给tj,执行Step3.4;Step3.4、提取待检测故障数据集U中的特征数据赋值给数组temp,执行Step3.5;Step3.5、判断ti≤tj:如果是,则执行Step3.6;否则,执行Step3.12;Step3.6、判断next≤temp的长度:如果是,则执行Step3.7;否则,执行Step3.10;Step3.7、根据公式(2)将temp[next]与故障库中第ti类对应的特征参数进行计算,获得ati_next故障类别下第next个值取值为bnext的条件概率P(bnext|ati_next),并将计算结果赋值给p,执本文档来自技高网...

【技术保护点】
1.一种云计算环境下故障检测方法,其特征在于:所述方法的具体步骤如下:Step1、监测数据特征提取,通过计算云计算环境监测数据集中的任意两个特征之间的相关性系数值选取特征以得到故障特征集;Step2、根据故障特征集中对应的特征序号,提取故障数据的特征数据形成训练数据集,对训练数据集中的特征进行平均值、方差计算,并构建故障模型参数二维数组,将其放入故障库中;Step3、已知故障检测:按照故障特征集提取监测异常数据,判断监测异常数据的故障类型是否与当前故障库已知故障相似,对无法判断的故障类型,执行Step4;Step4、未知故障检测,对与已知故障无法匹配的监测异常数据进行未知故障检测。

【技术特征摘要】
1.一种云计算环境下故障检测方法,其特征在于:所述方法的具体步骤如下:Step1、监测数据特征提取,通过计算云计算环境监测数据集中的任意两个特征之间的相关性系数值选取特征以得到故障特征集;Step2、根据故障特征集中对应的特征序号,提取故障数据的特征数据形成训练数据集,对训练数据集中的特征进行平均值、方差计算,并构建故障模型参数二维数组,将其放入故障库中;Step3、已知故障检测:按照故障特征集提取监测异常数据,判断监测异常数据的故障类型是否与当前故障库已知故障相似,对无法判断的故障类型,执行Step4;Step4、未知故障检测,对与已知故障无法匹配的监测异常数据进行未知故障检测。2.根据权利要求1所述的云计算环境下故障检测方法,其特征在于:所述Step1具体如下:Step1.1、初始化相关性系数矩阵RelationMatrix为空,故障特征集FaultFeatureSet置空,判断栈EstimateStack值为空,i=1,j=1,输入包含m个特征的云计算监测数据集MonitorData,其中MonitorData={d1,d2,d3,…,dn},dτ=(x1,x2,…xm),τ=1,2,…n,dτ表示第τ条数据,xm表示第m个特征对应的值,执行Step1.2;Step1.2、根据公式(1)计算MonitorData中前一个特征与后续其余特征相关性系数,并将结果存入到矩阵RelationMatrix中,执行Step1.3;其中,rij表示第i个特征与第j个特征的的相关性系数,xik表示MonitorData中第k条数据的第i个特征对应的值,yjk表示MonitorData中第k条数据的第j个特征对应的值,k=1,2,…,n,n为MonitorData中的数据个数;Step1.3、判断i≤m:如果是,则执行Step1.4;否则,执行Step1.11;Step1.4、判断RelationMatrix的第i列是否为null:如果是,执行Step1.5;否则,执行Step1.6;Step1.5、i++,执行Step1.3;Step1.6、将i存储到FaultFeatureSet中,并查找RelationMatrix中第i列中值在[-1,-0.8]∪[0.8,1]范围内的所有数值,并将这些数值所对应的行号存放到EstimateStack中,执行Step1.7;Step1.7、判断EstimateStack是否等于null:如果是,则执行Step1.5;否则,执行Step1.8;Step1.8、取出EstimateStack栈顶元素并赋值给j,执行Step1.9;Step1.9、查找RelationMatrix中第j列中在[-1,-0.8]∪[0.8,1]范围内的所有数值,并将这些数值所对应的行号存放到EstimateStack中,并去掉重复元素,执行Step1.10;Step1.10、将RelationMatrix中第j列中所有元素置空,执行Step1.7;Step1.11、输出故障特征集FaultFeatureSet,执行Step2。3.根据权利要求2所述的云计算环境下故障检测方法,其特征在于:所述Step2具体如下:Step2.1、初始化故障模型参数二维数组FaultModelArray,平均值参数mean=0,方差值参数variance=0,随机参数ran_k=1,len=0,输入故障数据FaultData,故障数据FaultData为采集包含m个特征的云计算监测数据集MonitorData所代表的对象产生的历史故障数据,执行Step2.2;Step2.2、将与FaultFeatureSet中对应的特征序号对故障数据FaultData进行特征数据提取形成训练数据集TrainData,执行Step2.3;Step2.3、len=TrainData中包含的特征个数,执行Step2.4;Step2.4、判断ran_k≤len:如果是,执行Step2.5;否则,执行Step2.9;Step2.5、获取TrainData中第ran_k个特征的数据,执行Step2.6;Step2.6、计算第ran_k个特征的平均值与方差并赋值给mean,variance,执行Step2.7;Step2.7、将mean,variance存入FaultModelArray的第ran_k行,执行Step2.8;Step2.8、ran_k++,执行Step2.4;Step2.9、为FaultModelArray添加标签,执行Step2.10;其中标签包括故障类型、故障描述;Step2.10、将带有标签的FaultModelArray放入到故障库中,执行Step3。4.根据权利要求3所述的云计算环境下故障检测方法,其特征在于:所述Step3具体如下:Step3.1、初始化故障概率initP=1,概率数组ProbabilityArray,临时变量ti=1,tj=0,next=1,p=0,数组temp,阈值T=0.0000008,输入监测异常数据MonitorAnomalyData,MonitorAnomalyData是对监测数据经过判断之后确定为异常的数据,MonitorAnomalyData={t1,t2,t3,…,tn},tτ=(z1,z2,…zm),τ=1,2,..,n,tτ表示第τ条数据,zm表示第m个特征对应的值,执行Step3.2;Step3.2、根据FaultFeatureSet中包含的特征序号提取MonitorAnomalyData中对应的特征,形成待检测故障数据集U,执行Step3.3;Step3.3、将故障库中的故障种类数量赋值给tj,执行Step3.4;Step3.4、提取待检测故障数据集U中的特征数据赋值给数组temp,执行Step3.5;Step3.5、判断ti≤tj:如果是,则执行Step3.6;否则,执行Step3.12;Step3.6、判断next≤temp的长度:如果是,则执行Step3.7;否则,执行Step3.10;Step3.7、根据公式(2)将temp[next]与故障库中第ti类对应的特征参数进行计算,获得ati_next故障类别下第next个值取值为bnext的条件概率P(bnext|ati_next),并将计算结果赋值给p,执行Step3.8;其中,bnext为temp[next]具体数据值,temp[next]为数组temp的第next个值,ati_next表示故障库中第ti类故障,为故障库中第ti类对应的具体特征参数,即Step2中的平均值mean,方差variance;Step3.8、initP=p*initP,执行Step3.9;Step3.9、next++,执行Step3.6;Step3.10、将initP赋值给ProbabilityArray中第ti个变量,令initP=1,执行Step3.11...

【专利技术属性】
技术研发人员:姜瑛闫腾腾李凌宇汪海涛丁家满
申请(专利权)人:昆明理工大学
类型:发明
国别省市:云南,53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1