一种电网业务服务器运行状态预警方法技术

技术编号:20686844 阅读:26 留言:0更新日期:2019-03-27 20:40
一种电网业务服务器运行状态预警方法,属于智能电网技术领域,为了解决针对电网业务服务器运行状态难以人工监测的问题,本发明专利技术方法主要分为两个部分,一是确定警报阈值,该部分基于切比雪夫不等式与改进型的瑞利分布,再结合小概率事件的定义,确定警报上限值,求出参数ε,并确定异常的可能性;二是基于BP网络模型进行时序预测,该部分与第一个部分研究结果进行综合分析,对未来的数据点进行预警,达到提前发现问题的目的。通过实验研究表明,利用所提方法设定的警报阈值,能在保证科学性的前提下对数据异常点进行预警,并确定某一数据点有多大的可能性是异常点,达到对异常数据预警的目的。

【技术实现步骤摘要】
一种电网业务服务器运行状态预警方法
本专利技术涉及电网业务服务器运行状态预警方法,属于智能电网

技术介绍
目前节能减排、绿色能源和可持续发展成为世界关注的焦点,世界各国对下一代电网发展均给予极大的关注。近几年来,我国对智能电网建设也给予重视,让电网脱离传统的模式,使其具有较高的效率[1]。在智能电网建设期间正确处理好智能电网建设与环保能源发展的互联互动关系,实现节能减排显得极为重要[2]。在节能减排的大形势下,最大程度发挥国网IT自动化运维平台业务系统服务器的使用效率,降低或延缓当前投资和新建投资需求,对提高电网发展质量和企业经济效益,促进电网和社会可持续发展具有重要意义[3]。在智能电网系统中,大数据产生于整个系统的各个环节,尤其是监控中心,每天都会产生海量数据。国内电网公司和企业的数据中心维护的数据量都非常大,电网业务服务器运行状态难以人工监测。服务器出现一些问题时,往往力不从心,从问题发生到解决问题需要较长的时间。有效的监控系统能通过对监控所采集到的数据进行分析并最终确定是哪台服务器的哪部分出现问题。如果没有这些自动化的监控系统,对网站或者服务器的管理员来说,出现问题很难在短时间内解决[4]。在设备监控方面,电网数据中对业务系统服务器的运维监测方面,目前主要致力于业务系统服务器的CPU、内存和硬盘资源的调整。PradeepPadala[5]等人提出了一个资源控制系统,它主要是由基于控制论的在线模型预估器和多输入多输出(MIMO)资源控制器构成的。它能够通过捕捉应用程序性能和资源分配值之间的复杂关系,自动的适应应用负载的动态变化,按需调整分配资源量。AnielAMenasce[6]等人提出了一种随虚拟机工作负载变化,根据CPU优先级动态调整计算资源分配的方法。与文献[5]相比,它主要考虑到了迁移代价问题,试图通过权衡CPU利用率和内存的大小选择要迁移的虚拟机,并在负载阈值的基础上对服务器的负载趋势进行预测,避免瞬时负载峰值触发迁移[7]。在各设备运行状态预警方面,为及时发现和排除信息网络系统和设备的隐患,需要对业务系统服务器进行提前预警。目前研究的热点是对CPU利用率的预测。为了使服务器可以更及时、更准确地响应应用负载的变化问题,文献[8]提出了利用ARIMA-BP神经网络综合预测模型来预测服务器的CPU利用率。在深入分析了自回归积分滑动平均(ARIMA)模型与BP网络模型特点的基础上,构建了ARIMA与BP神经网络组合的服务器时间序列预测模型。其基本思想是发挥ARIMA模型在线性空间、BP神经网络模型在非线性空间的预测优势,将服务器CPU利用率时间序列的数据结构拆分为线性主体和非线性残差两部分进行分析。首先用ARIMA模型预测序列的大体趋势,然后在非线性残差进行估计方面,用BP神经网络模型估计,最终得到较好的预测结果。但文献[8]仅给出了预测结果,没有对预测结果进行利用,没有电网业务服务器运行状态预警。传统的业务系统服务器设备的CPU使用率的阈值是运维人员根据经验人为设定,阈值一经设定便长期不变,不能满足监控中心大量实时数据需求,且不能对存在的潜在风险进行预测,极易造成经济损失。因此利用深度学习挖掘海量数据的深层信息,为业务系统服务器的CPU自适应的设定动态阈值,研究合理的适用于国网IT自动化运维平台业务系统服务器设备实际运行环境的监控和预警的方法,对潜在的风险或隐患进行预测并对攻击事件进行追踪溯源具有非常重要的意义。
技术实现思路
本专利技术的目的是提供一种电网业务服务器运行状态预警方法,针对电网业务服务器运行状态难以人工监测的问题,利用服务器CPU利用率来确定该服务器未来时刻某一数据点有多大的可能性是异常点,以达到对异常数据预警的目的。本专利技术为解决上述技术问题采取的技术方案是:一种电网业务服务器运行状态预警方法,所述方法的实现过程为:(1)采集整个电网系统中所有服务器的CPU利用率历史数据;(2)利用改进的瑞利分布公式计算出每台服务器CPU利用率历史数据的概率分布,通过概率分布得到自适应阈值;改进的瑞利分布公式中的方差是不断变化的,计算最近的初始30天之内CPU利用率数据值的初始方差和数学期望μ;根据所述初始方差得到改进的瑞利分布公式的初始表达式;(3)根据所采集的CPU利用率历史数据,利用BP网络模型预测出各台服务器未来时刻的CPU利用率数值;每次数据更新一天,那么就抛弃所述30天中的第一天的数据,计入最新一天的更新数据,再次算出步骤(2)所述的方差,对应得到改进的瑞利分布公式的新表达式;(4)根据小概率事件的定义,计算出每天的自适应阈值;(5)再把步骤(4)所述自适应阈值代入切比雪夫不等式中,评价该天所预测的全部数据点是否存在故障点,从完成对电网业务服务器运行状态的预警。进一步地,步骤(2)的具体过程为:改进的瑞利分布公式为:x>0其中,定义A为自适应系数;x为样本值,表示CPU利用率;σ2表示方差,f(x)为概率分布(概率密度分布);当x=μ时,f(μ)为最大值,从而确定出A的值;对式(7)进行积分,计算自适应阈值,令X0>x>0,求出X0,X0为自适应阈值。进一步地,在步骤(3)中,根据所采集的CPU利用率历史数据,利用BP网络模型预测出各台服务器未来时刻的CPU利用率数值的具体实现过程为:选用3层BP神经网络,即输入层、输出层和一个隐含层;训练函数选用“trainlm”,输入层和隐含层之间的传递函数选用“tansig”,隐含层和输出层之间的传递函数选用“purelin”;隐含层节点数式中,i为隐含层节点数,n为输入节点数,m为输出节点数,a为1-10之间的调节常数。n=5,m=1,i的取值范围为4-13;最大训练次数为1000次。进一步地,步骤(5)的实现过程为:所述切比雪夫不等式是在随机变量X的分布未知情况下,对事件|X-μ|<ε概率做出估计,设随机变量的数学期望E(X)=μ,方差D(X)=σ2,则对于任意正数ε,有如下的关系或式中,X代表随机变量,代表自适应阈值;ε代表任意正数,其实际意义代表设定阈值的标准。在判断某时刻电网业务服务器运行是否存在异常的过程中,引入各个时刻的CPU利用率数据,该随机变量的概率密度未知,但是可以使用计算CPU利用率的均值与方差来预判该点是否为怀疑点;如果是正常的时间点,可以选取比较小的ε值,选取的ε越小,则说明该时刻的CPU利用率数据点与均值的差越小,切比雪夫不等式说明CPU利用率数据点与均值的差小于ε的概率大于1-σ2/ε2,求得的概率下限值越大,则该时刻的CPU利用率数据点是正常点的可能性越大;根据公式由ε-μ=X0得出ε的值,进而计算出某一点是异常点的可能性;当检测某一主机时,由ε-μ=X0得到ε的值,此时所警报的数据点至少有概率值为P的可能性为异常点。本专利技术的有益效果是:本专利技术提出了利用改进型瑞利分布的切比雪夫不等式确定自适应动态阈值的方法,该方法巧妙地利用了瑞利分布函数的概率密度分布特点,对CPU利用率的数据分布进行分析。首先结合小概率事件的定义对CPU利用率的数据值进行阈值设定,计算出某个数据点有多大的可能性是异常点;然后利用BP网络模型,预测出未来时刻CPU利用率数值,与之前得到的阈值比较,理出未来本文档来自技高网
...

【技术保护点】
1.一种电网业务服务器运行状态预警方法,其特征在于,所述方法的实现过程为:(1)采集整个电网系统中所有服务器的CPU利用率历史数据;(2)利用改进的瑞利分布公式计算出每台服务器CPU利用率历史数据的概率分布,通过概率分布得到自适应阈值;改进的瑞利分布公式中的方差是不断变化的,计算最近的初始30天之内CPU利用率数据值的初始方差和数学期望μ;根据所述初始方差得到改进的瑞利分布公式的初始表达式;(3)根据所采集的CPU利用率历史数据,利用BP网络模型预测出各台服务器未来时刻的CPU利用率数值;每次数据更新一天,那么就抛弃所述30天中的第一天的数据,计入最新一天的更新数据,再次算出步骤(2)所述的方差,对应得到改进的瑞利分布公式的新表达式;(4)根据小概率事件的定义,计算出每天的自适应阈值;(5)再把步骤(4)所述自适应阈值代入切比雪夫不等式中,评价该天所预测的全部数据点是否存在故障点,从完成对电网业务服务器运行状态的预警。

【技术特征摘要】
1.一种电网业务服务器运行状态预警方法,其特征在于,所述方法的实现过程为:(1)采集整个电网系统中所有服务器的CPU利用率历史数据;(2)利用改进的瑞利分布公式计算出每台服务器CPU利用率历史数据的概率分布,通过概率分布得到自适应阈值;改进的瑞利分布公式中的方差是不断变化的,计算最近的初始30天之内CPU利用率数据值的初始方差和数学期望μ;根据所述初始方差得到改进的瑞利分布公式的初始表达式;(3)根据所采集的CPU利用率历史数据,利用BP网络模型预测出各台服务器未来时刻的CPU利用率数值;每次数据更新一天,那么就抛弃所述30天中的第一天的数据,计入最新一天的更新数据,再次算出步骤(2)所述的方差,对应得到改进的瑞利分布公式的新表达式;(4)根据小概率事件的定义,计算出每天的自适应阈值;(5)再把步骤(4)所述自适应阈值代入切比雪夫不等式中,评价该天所预测的全部数据点是否存在故障点,从完成对电网业务服务器运行状态的预警。2.根据权利要求1所述的一种电网业务服务器运行状态预警方法,其特征在于,步骤(2)的具体过程为:改进的瑞利分布公式为:其中,定义A为自适应系数;x为样本值,表示CPU利用率;σ2表示方差,f(x)为概率分布;当x=μ时,f(μ)为最大值,从而确定出A的值;对式(7)进行积分,计算自适应阈值,令X0>x>0,求出X0,X0为自适应阈值。3.根据权利要求2所述的一种电网业务服务器运行状态预警方法,其特征在于,在步骤(3)中,根据所采集的CPU利用率历史数据,利用BP网络模型预测出各台服务器未来时刻的CPU利用率数值的具体实现过程为:选...

【专利技术属性】
技术研发人员:王玉静彭悟焯王庆岩谢金宝康守强
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:黑龙江,23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1