一种数据中心监控预警方法及系统技术方案

技术编号:27404068 阅读:22 留言:0更新日期:2021-02-21 14:16
本发明专利技术公开一种数据中心监控预警方法及系统,其中,数据中心监控预警方法包括:步骤S1,设定被监控对象及其监控指标;步骤S2,获取每个被监控对象的指标数据;步骤S3,根据被监控对象和监控指标从检测模型数据库中选择对应的检测模型,并采用该检测模型对指标数据进行风险检测;步骤S4,根据风险检测结果发出预警提醒。本发明专利技术通过基于被监控对象的指标数据进行风险检测,可以提前发现风险并发出故障预警,保障了服务器和数据中心的正常运行,有效降低了服务器故障率,减少由于服务器故障而导致的重大损失。致的重大损失。致的重大损失。

【技术实现步骤摘要】
一种数据中心监控预警方法及系统


[0001]本专利技术涉及数据中心
,尤其涉及一种数据中心监控预警方法及系统。

技术介绍

[0002]随着科技不断发展进步,各企事业单位建立的数据中心越来越多,用于构建数据中心的服务器的数量也越来越多。服务器作为高级计算机,它拥有高速度的运算能力和强大的外部数据吞吐能力,在数据中心中,服务器的正常运行至关重要。因为一旦服务器发生故障,将会出现服务器保存的数据丢失和用户无法访问等问题。目前主要是在服务器发生故障后,再由管理人员对故障进行处理,使服务器能够恢复正常工作。但是,不管故障处理的速度有多快,以及故障处理效果有多好,只要服务器发生了故障,就会对数据中心的整体运行产生或多或少的影响。综上所述,如何对服务器进行提前故障预警,是目前本领域技术人员亟需解决的技术问题。

技术实现思路

[0003]本专利技术所要解决的技术问题在于,提出一种数据中心监控预警方法及系统,以保障服务器和数据中心的正常运行,有效降低服务器故障率。
[0004]为了解决上述技术问题,本专利技术提供一种数据中心监控预警方法,包括:
[0005]步骤S1,设定被监控对象及其监控指标;
[0006]步骤S2,获取每个被监控对象的指标数据;
[0007]步骤S3,根据被监控对象和监控指标从检测模型数据库中选择对应的检测模型,并采用该检测模型对指标数据进行风险检测;
[0008]步骤S4,根据风险检测结果发出预警提醒。
[0009]进一步地,所述步骤S2中获取的是预设时间段内的指标数据或者实时指标数据。
[0010]进一步地,当步骤S2中获取的是预设时间段内的指标数据时,所述步骤S3中则选择的是趋势预测模型,所述步骤S3中采用该趋势预测模型对指标数据进行风险检测的过程具体包括:
[0011]步骤S31a,将预设时间段内的指标数据按照时间顺序排列以得到指标数据序列;
[0012]步骤S32a,将指标数据序列输入到趋势预测模型中,趋势预测模型输出下一个预设时间段内的最高指标数据值;
[0013]步骤S33a,将最高指标数据值与预设的阈值进行比较,若最高指标数据值大于等于阈值则判定存在风险,若小于阈值则判定不存在风险。
[0014]进一步地,所述步骤S33a中还基于最高指标数据值超出预设阈值的比例生成不同的风险等级,所述步骤S4中根据不同的风险等级生成不同的预警级别。
[0015]进一步地,所述步骤S4中根据预警级别对预警信息进行分组,并对各组预警信息分别设定发送时间,以在预先设定的发送时间内向关联用户发送预警信息,分解预警系统的信息传送压力。
[0016]进一步地,当所述步骤S2中获取的是实时指标数据,所述步骤S3中则选择的是异常检测模型,所述步骤S3中采用该异常检测模型对指标数据进行风险检测的过程具体包括:
[0017]步骤S31b,将实时指标数据输入异常检测模型,输出对应的指标数据特征;
[0018]步骤S32b,将指标数据特征与标准指标特征进行比较,若指标数据特征符合标准指标特征则确定实时指标数据处于正常状态;否则,确定所述指标数据处于异常状态。
[0019]本专利技术还提供一种数据中心监控预警系统,包括:
[0020]监控目标设定模块,用于设定被监控对象及其监控指标;
[0021]指标数据获取模块,用于获取每个被监控对象的指标数据;
[0022]风险预测模块,用于根据被监控对象和监控指标从检测模型数据库中选择对应的检测模型,并采用该检测模型对指标数据进行风险检测;
[0023]预警模块,用于根据风险检测结果发出预警提醒。
[0024]进一步地,所述指标数据获取模块获取的是预设时间段内的指标数据或者实时指标数据。
[0025]进一步地,当所述指标数据获取模块获取的是预设时间段内的指标数据时,所述风险检测模块从检测模型数据库中选择对应的趋势预测模型,并将预设时间段内的指标数据按照时间顺序排列以得到指标数据序列,再将指标数据序列输入到趋势预测模型后输出下一个预设时间段内的最高指标数据值,将最高指标数据值与预设的阈值进行比较,若最高指标数据值大于等于阈值则判定存在风险,若小于阈值则判定不存在风险。
[0026]进一步地,当所述指标数据获取模块获取的是实时指标数据时,所述风险预测模块从检测模型数据库中选择对应的异常检测模型,所述风险检测模块将实时指标数据输入异常检测模型后输出对应的指标数据特征,再将指标数据特征与标准指标特征进行比较,若指标数据特征符合标准指标特征则确定实时指标数据处于正常状态;否则,确定所述指标数据处于异常状态。
[0027]本专利技术实施例的有益效果在于:通过基于被监控对象的指标数据进行风险检测,可以提前发现风险并发出故障预警,保障了服务器和数据中心的正常运行,有效降低了服务器故障率,减少由于服务器故障而导致的重大损失。
附图说明
[0028]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0029]图1是本专利技术实施例一一种数据中心监控预警方法的流程示意图。
[0030]图2是图1所示步骤S3的具体流程示意图。
[0031]图3是图1所示步骤S3的另一具体流程示意图。
[0032]图4是本专利技术实施例二一种数据中心监控预警系统的模块结构示意图。
具体实施方式
[0033]以下各实施例的说明是参考附图,用以示例本专利技术可以用以实施的特定实施例。
[0034]请参考图1,本专利技术的优选实施例提供一种用于数据中心的多方位监控预警方法,包括以下步骤:
[0035]步骤S1:设定被监控对象及其监控指标;
[0036]步骤S2:获取每个被监控对象的指标数据;
[0037]步骤S3:根据被监控对象和监控指标从检测模型数据库中选择对应的检测模型,并采用该检测模型对指标数据进行风险检测;
[0038]步骤S4:根据风险检测结果发出预警提醒。
[0039]可以理解,在所述步骤S1中,被监控对象可以是数据中心的多个服务器中的至少一个,也可以是某些网络设备,或者是至少一个虚拟集群,工作人员可以根据实际需要进行选择设定,在此不做具体限定。另外,针对不同的被监控对象可以设定不同的监控指标,例如监控指标可以包括目标服务器的CPU使用率、CPU温度、内存使用率、硬盘使用率等,用户配置在数据中心上的相关应用的使用指标等,物理机CPU、memory、电压、电流、能耗和温度等的运行状态和使用情况,虚拟机CPU、memory、disk I/O、Net I/O等的运行状态和使用情况,一般地,工作人员可以在设定监控界面中的操作来确定所述监控指标。
[0040]可以理解,在所述步骤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据中心监控预警方法,其特征在于,包括:步骤S1,设定被监控对象及其监控指标;步骤S2,获取每个被监控对象的指标数据;步骤S3,根据被监控对象和监控指标从检测模型数据库中选择对应的检测模型,并采用该检测模型对指标数据进行风险检测;步骤S4,根据风险检测结果发出预警提醒。2.根据权利要求1所述的数据中心监控预警方法,其特征在于,所述步骤S2中获取的是预设时间段内的指标数据或者实时指标数据。3.根据权利要求2所述的数据中心监控预警方法,其特征在于,当步骤S2中获取的是预设时间段内的指标数据时,所述步骤S3中则选择的是趋势预测模型,所述步骤S3中采用该趋势预测模型对指标数据进行风险检测的过程具体包括:步骤S31a,将预设时间段内的指标数据按照时间顺序排列以得到指标数据序列;步骤S32a,将指标数据序列输入到趋势预测模型中,趋势预测模型输出下一个预设时间段内的最高指标数据值;步骤S33a,将最高指标数据值与预设的阈值进行比较,若最高指标数据值大于等于阈值则判定存在风险,若小于阈值则判定不存在风险。4.根据权利要求3所述的数据中心监控预警方法,其特征在于,所述步骤S33a中还基于最高指标数据值超出预设阈值的比例生成不同的风险等级,所述步骤S4中根据不同的风险等级生成不同的预警级别。5.根据权利要求4所述的数据中心监控预警方法,其特征在于,所述步骤S4中根据预警级别对预警信息进行分组,并对各组预警信息分别设定发送时间,以在预先设定的发送时间内向关联用户发送预警信息,分解预警系统的信息传送压力。6.根据权利要求2所述的数据中心监控预警方法,其特征在于,当所述步骤S2中获取的是实时指标数据,所述步骤S3中则选择的是异常检测模型,所述步骤S3中采用该异常检测模型对指标数据进行风险检测...

【专利技术属性】
技术研发人员:邱子良
申请(专利权)人:深圳供电局有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1