一种用于数据中心动力环境监控的动态预警方法及装置制造方法及图纸

技术编号:20620984 阅读:43 留言:0更新日期:2019-03-20 13:44
本发明专利技术公开了一种用于数据中心动力环境监控的动态预警方法及装置,本发明专利技术先对时间序列进行预处理,去除异常值并保证数据对齐,再对预处理后的时间序列进行分解,提取其中的趋势项,季节项和随机波动项。通过分别对趋势项、季节项和随机波动项进行参数估计,建立时间序列预测模型,并利用该预测模型对关键指标的未来运行状态进行预测。基于故障判别规则来自动识别是否会发生故障以及是否推送预警。最后通过定期更新以上步骤,实现数据中心动力环境监控的动态预警。从而使得运维人员能在故障实际发生前采取相应的应急措施,避免故障的发生。

A Dynamic Early Warning Method and Device for Monitoring the Force Environment of Data Center

The invention discloses a dynamic early warning method and device for monitoring the dynamic environment of data center. The method first preprocesses time series, removes outliers and ensures data alignment, then decomposes the preprocessed time series, extracts trend items, seasonal items and random fluctuation items. By estimating the parameters of trend term, seasonal term and random fluctuation term respectively, a time series prediction model is established, and the future operation status of key indicators is predicted by using this prediction model. Based on fault discrimination rules, it can automatically identify whether a fault will occur and whether an early warning will be pushed. Finally, the above steps are updated regularly to realize the dynamic early warning of the monitoring of the data center's dynamic environment. In this way, operators can take corresponding emergency measures before the actual occurrence of the fault, so as to avoid the occurrence of the fault.

【技术实现步骤摘要】
一种用于数据中心动力环境监控的动态预警方法及装置
本专利技术涉及计算机
,特别是涉及一种用于数据中心动力环境监控的动态预警方法及装置。
技术介绍
动力和环境系统作为数据中心的重要组成部分,为IT设备的可靠运行提供了极为重要的支撑。因此,保障动力和环境系统的安全、可靠、稳定运行,是数据中心管理的一项重要工作。传统的做法是采用运行维护人员定点、定期巡查和24小时值班,这样不仅耗费了大量的人力、物力,而且不能全面、及时地掌握设备的实时运行状况。随着信息化技术的发展,数据中心的管理逐步采用数字化集中监控平台。其作为一种自动化监控手段,可对数据中心动力和环境基础设施进行24小时的不间断监控,并在设备出现告警或故障后及时推送相关信息,告知运行维护人员进行处理。这种方式虽然实现了对设备的实时监控,极大提高了故障发现的全面性和及时性。但其弊端是属于事后处理,无法避免故障带来的损失。对于一些重要的设备,如高压配电柜、UPS等,一旦其发生故障,则很可能引发服务器断电、业务中断,甚至引起重大的经济损失和严重的社会影响。因此,需对这些设备进行动态预警,在故障发生前采取针对性的预防维护措施,尽可能避免其故障的发生。从而进一步提升数据中心基础设施的可靠性和安全性。
技术实现思路
本专利技术提供了一种用于数据中心动力环境监控的动态预警方法,以解决现有技术中不能很好地实现对设备进行动态预警的问题。本专利技术一方面提供了一种用于数据中心动力环境监控的动态预警方法,包括:对数据中心动力环境监控平台的时序监控数据进行预处理;选择预测模型,并建立时间序列预测模型;根据所述时间序列预测模型预测未来运行状态,并进行状态预警的判别和推送;根据实际监测数据重新对时序监控数据进行预处理,并重新构建预测模型。优选地,对数据中心动力环境监控平台的时序监控数据进行预处理,包括:对数据中心动力环境监控平台的时序监控数据进行异常数据的修正,数据聚合和数据分散处理。优选地,对数据中心动力环境监控平台的时序监控数据进行异常数据的修正,数据聚合和数据分散处理,包括:从数据中心动力环境监控平台的时序数据库中获取预定指标在过去预定时间内的时序监测数据,记作第一时间序列Y={x1,x2,...,xn},其中n表示第一时间序列Y中的样本数量;对时序监控数据进行异常检测,利用欧式距离或聚类方法,发现并修正时间序列Y中的异常点,得到修正异常值后的第二时间序列Ym={x'1,x'2,...,x'n};对于修正后的时序监控数据进行聚合或分散,假定k为对齐后的历史数据时间间隔,当k大于第二时间序列Ym中两个数据点之间的时间间隔时,利用时间间隔k内的样本均值或最大值、最小值对第二时间序列Ym进行聚合处理;当k小于第二时间序列Ym中两个数据点之间的时间间隔时,利用插值算法对第二时间序列Ym进行分散处理,获得对齐后的第三时间序列Y'={xk,x2k,...,xmk},其中m为第三时间序列Y'中的样本数量,将第三时间序列Y'重新记为Y'={y1,y2,...,yt,yt+1,...,ym},t为自然数,t<m。优选地,选择预测模型包括:将第三时间序列Y'进行分解,得到随机波动项Lt,趋势项Tt和季节项St;当第三时间序列Y'适用于加法模型,则采用加法模型进行分解,其中yt是第三时间序列Y'中的第t个元素;Lt=α(yt-St-p)+(1-α)(Lt-1+Tt-1)Tt=β(Lt-Lt-1)+(1-β)Tt-1St=γ(yt-Lt)+(1-γ)St-pFt+1=Lt+Tt+St+1-p当第三时间序列Y'适用于乘法模型,则采用乘法模型进行分解:Lt=α(yt/St-p)+(1-α)(Lt-1+Tt-1)Tt=β(Lt-Lt-1)+(1-β)Tt-1St=γ(yt/Lt)+(1-γ)St-pFt+1=(Lt+Tt)St+1-p其中,α,β,γ分别为随机波动项平滑因子、趋势项平滑因子和季节项平滑因子,p为季节项的周期,且0≤α≤1,0≤β≤1,0≤γ≤1。优选地,建立时间序列预测模型,包括:确定时间序列预测模型中Lt的初始值L0和Tt的初始值T0:对于St的初始值序列S0={s1-p,s2-p,..,s0},当采用加法模型st-p=yt-L0,t=1,2,...,p,当采用乘法模型确定时间序列预测模型的参数;根据网格搜索法确定随机波动项平滑因子α、趋势项平滑因子β和季节项的平滑因子γ的最优值;基于确立的模型初始值和α、β、γ,得到随机波动项Lt,趋势项Tt和季节项St的具体模型,并进一步组合获得Holt-Winters时间序列预测模型。优选地,根据网格搜索法确定随机波动项平滑因子α、趋势项平滑因子β和季节项平滑因子γ的最优值,包括:进行网格划分,得到由所有网格点组成的候选参数集F={a1,a2,...,ak,...,an},其中,ak=(αk,βk,γk),n为候选参数集中向量的个数;对于任意ak属于候选参数集F={a1,a2,...,ak,...,an},依据其对应的系数αk,βk,γk和模型的初始值确定Holt-Winters时间序列预测模型,计算确定的时间序列模型的拟合值与实际值的误差平方和,根据误差平方和最小为标准,优选出模型的参数α,β和γ。优选地,根据所述时间序列预测模型预测未来运行状态,并进行状态预警的判别和推送,包括:根据所述时间序列预测模型预测未来运行状态特定指标在未来预定时刻的预测值,自动匹配相应的故障诊断规则,判断是否存在故障,以及存在故障情况下的故障等级,并在动力环境监控平台上进行推送;优选地,当现有动力环境监控平台不存在相应的故障诊断规则,则依据历史第三时间序列Y'={y1,y2,...,yt,yt+1,...,ym}计算均值μ和标准差σ,并根据均值μ和标准差σ建立故障诊断规则,并在预测值处于区间[μ-mσ,μ+mσ]之内,则认为其正常,若在区间之外,则推送故障预警,其中m=1,2,3,...,且m值是根据待预警指标的重要程度和历史数据的特征确定。优选地,根据实际监测数据重新对时序监控数据进行预处理,并重新构建预测模型,包括:当获得待预警指标在未来预定时段的实际监测数据后,更新序列Y={x1,x2,...,xn},重新对数据中心动力环境监控平台的时序监控数据进行预处理,并建立时间序列预测模型,根据所述时间序列预测模型预测未来运行状态,并进行状态预警的判别和推送。本专利技术第二方面提供一种用于数据中心动力环境监控的动态预警装置,包括:预处理单元,用于对数据中心动力环境监控平台的时序监控数据进行预处理;建立单元,用于选择预测模型,并建立时间序列预测模型;预警单元,用于根据所述时间序列预测模型预测未来运行状态,并进行状态预警的判别和推送;更新单元,用于根据实际监测数据重新对时序监控数据进行预处理,并重新构建预测模型。本专利技术有益效果如下:本专利技术以实现数据中心基础设施运行状态的在线故障预警,通过利用时间序列预测模型对关键指标的未来运行状态进行预测,并采用故障判别规则来自动识别故障,及时推送故障预警,从而使得运维人员能在故障实际发生前采取相应的应急措施,避免故障的发生,本专利技术有助于降低数据中心的故障风险,提高数据中心基础设施运营的安全性和可靠性。上述说明仅是本专利技术技术方案的概述,本文档来自技高网...

【技术保护点】
1.一种用于数据中心动力环境监控的动态预警方法,其特征在于,包括:对数据中心动力环境监控平台的时序监控数据进行预处理;选择预测模型,并建立时间序列预测模型;根据所述时间序列预测模型预测未来运行状态,并进行状态预警的判别和推送;根据实际监测数据重新对时序监控数据进行预处理,并重新构建预测模型。

【技术特征摘要】
1.一种用于数据中心动力环境监控的动态预警方法,其特征在于,包括:对数据中心动力环境监控平台的时序监控数据进行预处理;选择预测模型,并建立时间序列预测模型;根据所述时间序列预测模型预测未来运行状态,并进行状态预警的判别和推送;根据实际监测数据重新对时序监控数据进行预处理,并重新构建预测模型。2.根据权利要求1所述的方法,其特征在于,对数据中心动力环境监控平台的时序监控数据进行预处理,包括:对数据中心动力环境监控平台的时序监控数据进行异常数据的修正,数据聚合和数据分散处理。3.根据权利要求2所述的方法,其特征在于,对数据中心动力环境监控平台的时序监控数据进行异常数据的修正,数据聚合和数据分散处理,包括:从数据中心动力环境监控平台的时序数据库中获取预定指标在过去预定时间内的时序监测数据,记作第一时间序列Y={x1,x2,...,xn},其中n表示第一时间序列Y中的样本数量;对时序监控数据进行异常检测,利用欧式距离或聚类方法,发现并修正时间序列Y中的异常点,得到修正异常值后的第二时间序列Ym={x'1,x'2,...,x'n};对于修正后的时序监控数据进行聚合或分散,假定k为对齐后的历史数据时间间隔,当k大于第二时间序列Ym中两个数据点之间的时间间隔时,利用时间间隔k内的样本均值或最大值、最小值对第二时间序列Ym进行聚合处理;当k小于第二时间序列Ym中两个数据点之间的时间间隔时,利用插值算法对第二时间序列Ym进行分散处理,获得对齐后的第三时间序列Y'={xk,x2k,...,xmk},其中m为第三时间序列Y'中的样本数量,将第三时间序列Y'重新记为Y'={y1,y2,...,yt,yt+1,...,ym},t为自然数,t<m。4.根据权利要求3所述的方法,其特征在于,选择预测模型包括:将第三时间序列Y'进行分解,得到随机波动项Lt,趋势项Tt和季节项St;当第三时间序列Y'适用于加法模型,则采用加法模型进行分解,其中yt是第三时间序列Y'中的第t个元素;Lt=α(yt-St-p)+(1-α)(Lt-1+Tt-1)Tt=β(Lt-Lt-1)+(1-β)Tt-1St=γ(yt-Lt)+(1-γ)St-pFt+1=Lt+Tt+St+1-p当第三时间序列Y'适用于乘法模型,则采用乘法模型进行分解:Lt=α(yt/St-p)+(1-α)(Lt-1+Tt-1)Tt=β(Lt-Lt-1)+(1-β)Tt-1St=γ(yt/Lt)+(1-γ)St-pFt+1=(Lt+Tt)St+1-p其中,α,β,γ分别为随机波动项平滑因子、趋势项平滑因子和季节项平滑因子,p为季节项的周期,且0≤α≤1,0≤β≤1,0≤γ≤1。5.根据权利要求4所述的方法,其特征在于,建立时间序列预测模型,包括:确定时间序列预测模型中Lt的初始值L0和Tt的初始值T0:...

【专利技术属性】
技术研发人员:黄建文朱海龙陈苏曹可建姜卓周双全王海峰
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1