云环境下基于混合策略的故障检测性能优化方法技术

技术编号:19751097 阅读:37 留言:0更新日期:2018-12-12 05:44
本发明专利技术适用于云技术领域,提供了一种云环境下基于混合策略的故障检测性能优化方法,该方法包括:S1、对云系统运行环境进行异常程度评估;S2、基于云系统运行环境的异常程度来确定云系统的检测时间周期。本发明专利技术基于云系统运行环境异常程度自适应调节检测周期,异常程度低,检测周期长,异常程度高,检测周期短,从而达到检测周期的合理性,在提高故障检测的针对性的同时降低其代价。

【技术实现步骤摘要】
云环境下基于混合策略的故障检测性能优化方法
本专利技术属于云
,提供了一种云环境下基于混合策略的故障检测性能优化方法。
技术介绍
近年来,云计算技术得到飞速发展,然而,云计算平台的应用多样性,以及云环境的动态性导致云计算系统不时发生故障,从而对人们正常的工作生活产生严重影响,也会造成相关企业巨大的经济损失。云系统通常要求同时响应数以百万级别的用户请求,其承受的巨大工作量,多变的系统运行环境导致会发生许多故障。例如,通过周期为1年的观测,在阿里云计算公司的一个很小集群中,也会碰到每天100条左右的各种类型故障预警。由于云计算系统结构复杂,体量巨大,检测系统要求能从多个节点上检测多个层次(如系统层、中间件层、应用层)各种资源使用量的检测数据,为云计算系统的运行状态持续检测提供信息。但是,检测、传送以及分析众多检测数据肯定会导致云系统资源的巨大消耗,从而会降低云系统性能、异常检测的时效性和准确性。而亚马逊CloudWatch检测系统和谷歌检测系统只支持固定时长的检测周期,如对几分钟检测数据收集一次。同样,从使用者的方面角度,使用云平台检测服务要求费用与检测的频率成正比,检测费用会占总共运行费用的18%。因此云系统维护人员和使用者希望能够减少检测对象数量和降低检测频率(在单位时间内的检测数据的检测次数),以降低云系统维护成本和使用费用。由于故障在持续检测的周期内发生,虽然检测对象过少以及检测频率过低降低云系统开销,但是,有效检测数据过少,也会降低故障检测的准确性与时效性。因此,如何调节检测监测频率,成为检测云计算系统并保证云系统可靠性的关键。一般云系统的检测采用固定时间周期。固定时间周期对每个检测设置一个固定时长的检测周期,收集器采用了能够远端调节检测周期的方式,但是对于使用人为调节方式来调节检测粒度,很难快速对数据响应。Nagio采用固定时间方式检测优化。该检测面临问题是云系统正常运行下收集的检测数据通常是在警戒线以下,无需对所产生的故障预警进行处理,云系统会继续按照先前设定的时间周期对采样的数据进行收集,而实际上该预警的时间点占检测时间的比重非常少,意味着云系统浪费很多的资源去收集无效的数据,同时增加观察数据时间和云系统维护人员的压力。
技术实现思路
本专利技术实施例提供一种基于云环境下基于混合策略的故障检测性能优化方法,选取多个对云故障预警有效属性,利用检测节点收集实时检测数据对故障进行预警,基于运行环境的故障程度来动态调节检测周期,以降低云系统检测成本。本专利技术是这样实现的,一种基于云环境下基于混合策略的故障检测性能优化方法,所述方法包括如下步骤:S1、对云系统运行环境进行异常程度评估;S2、基于云系统运行环境的异常程度来确定云系统的检测时间周期。进一步的,所述步骤S1具体包括如下步骤:S11、基于决策树模型及SVM模型来检测云系统中的故障样本;S12、计算故障样本的故障概率;S13、基于故障样本的故障概率来评估云系统运行环境的异常程度。进一步的,所述步骤S11具体包括如下步骤:S111、通过决策树模型检测云系统中的样本,将样本区分为正常样本一及异常样本一,采用标识一对正常样本一进行标识;S112、通过SVM模型检测云系统的样本,将样本区分为正常样本二及异常样本二,采用标识二对正常样本二进行标识;S113、被标识一和标识二共同标记的样本确定为正常样本;否则,确定为故障样本。进一步的,所述云系统运行环境异常程度的计算公式具体如下:其中,Pi表示云系统在Ti时刻运行环形的异常程度值,表示di的决策值,决策值是基于决策函数获取的,其中f1,f2分别是指二次规划求解得到的最小值及拉格朗日乘子的和。进一步的,云系统的检测时间周期采用如下公式进行计算:其中,Ti+1为第i+1时刻对云系统检测时间周期;tα为最大检测时间周期,为预先设置的参数;tβ为最小检测时间周期,为预先设置的参数,R为调节比例,ν1,ν2,ν3为预设边界值。进一步的,ν1,ν2,ν3值的确定方法包括如下步骤:S31、在训练样本库中,设置V1,V2,V3值,V1,V2,V3值的设置方法具体如下:设置V1的初始值为0,取值步长为s,最终值为1;当V1在[0,1]范围内每取一个值,设置V2的初始值为V1+s,取值步长为s,最终值为1,且设置V3的初始值为V2+s,取值步长为s,最终值为1;S32、将故障样本检测率最高的V1值,V2值,及V3值组合分别赋予ν1,ν2,ν3。本专利技术提供的基于混合策略的故障检测性能优化方法具有如下有益技术效果:1.通过决策树检测策略与SVM检测策略的配合使用,大大降低云故障的漏报率,进而提高了云系统运行环境异常程度评估的精准性;2.基于云系统运行环境异常程度自适应调节检测周期,异常程度低,检测周期长,异常程度高,检测周期短,从而达到检测周期的合理性,在提高故障检测的针对性的同时降低其代价;3.决策树检测策略与SVM检测策略的配合使用,使得云系统异常程度的评估更精准,进而进一步提高了云系统检测周期合理性。附图说明图1为本专利技术实施例提供的云环境下基于混合策略的故障检测性能优化方法的流程图;图2为本专利技术实施例提供的ν1,ν2的阈值寻优图;图3为本专利技术实施例提供的ν1,ν3的阈值寻优图;图4为本专利技术实施例提供的混合策略模型PSO与经典算法Grid的选优参数Time耗费比较图;图5为本专利技术实施例提供的混合策略与SCNN、PNN检测率比较图;图6为本专利技术实施例提供的混合策略与SCNN、PNN效用率比较图;图7为本专利技术实施例提供的动态周期与固定周期检测率比较图;图8为本专利技术实施例提供的动态周期与固定周期效用率比较图;图9为本专利技术实施例提供的不同策略下检测率的方差比较图;图10为本专利技术实施例提供的不同策略下效用率的方差比较图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。图1为本专利技术实施例提供的云环境下基于混合策略的故障检测性能优化方法的流程图,该方法包括如下步骤:S1、对云系统运行环境进行异常程度评估;在本专利技术实施实施例中,步骤S1具体包括如下步骤:S11、通过混合策略检测云系统中的故障样本;在本专利技术实施例中,混合策略是指决策树模型与SVM模型的结合,基于混合策略的云系统故障样本检测方法包括如下步骤:S111、通过决策树模型检测云系统中的样本,将样本区分为正常样本一及异常样本一,采用标识一对正常样本一进行标识;S112、通过SVM模型检测云系统的样本,将样本区分为正常样本二及异常样本二,采用标识二对正常样本二进行标识;S113、被标识一和标识二共同标记的样本确定为正常样本;否则,确定为故障样本。通过决策树对云系统进行监控,获得第Ti时刻故障样本数据di,对样本进行初次分类,分类为正常样本一和异常样本一,正常样本一采用c1=1进行标识,异常样本一采用c1=0进行标识。决策树对噪声点比较敏感,为了避免噪声点对分类结果的影响,同时采用SVM检测策略对云系统进行监测,获得第Ti时刻故障样本数据di,对样本进行初次分类,分类为正常样本二和异常样本二,正常样本二采用c2=1进行标识,异常样本二采用c2=0进行本文档来自技高网
...

【技术保护点】
1.一种云环境下基于混合策略的故障检测性能优化方法,其特征在于,所述方法包括如下步骤:S1、对云系统运行环境进行异常程度评估;S2、基于云系统运行环境的异常程度来确定云系统的检测时间周期。

【技术特征摘要】
1.一种云环境下基于混合策略的故障检测性能优化方法,其特征在于,所述方法包括如下步骤:S1、对云系统运行环境进行异常程度评估;S2、基于云系统运行环境的异常程度来确定云系统的检测时间周期。2.如权利要求1所述云环境下基于混合策略的故障检测性能优化方法,其特征在于,所述步骤S1具体包括如下步骤:S11、基于决策树模型及SVM模型来检测云系统中的故障样本;S12、计算故障样本的故障概率;S13、基于故障样本的故障概率来评估云系统运行环境的异常程度。3.如权利要求2所述云环境下基于混合策略的故障检测性能优化方法,其特征在于,所述步骤S11具体包括如下步骤:S111、通过决策树模型检测云系统中的样本,将样本区分为正常样本一及异常样本一,采用标识一对正常样本一进行标识;S112、通过SVM模型检测云系统的样本,将样本区分为正常样本二及异常样本二,采用标识二对正常样本二进行标识;S113、被标识一和标识二共同标记的样本确定为正常样本;否则,确定为故障样本。4.如权利要求1或2所述云环境下基于混合策略的故障检测性能优化方法,其特征在于,所述云系统运行环境异常程度...

【专利技术属性】
技术研发人员:张佩云舒升谢杰敏谢荣见章一磊
申请(专利权)人:安徽师范大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1