服务器健康度分析方法,装置,存储介质及电子设备制造方法及图纸

技术编号:21199699 阅读:22 留言:0更新日期:2019-05-25 01:12
本公开的目的是提供一种服务器健康度分析方法,装置,存储介质及电子设备,以解决相关技术中服务器健康分析不够全面的问题。方法包括:获取服务器的多组历史指标;根据所述服务器在产生每一组所述历史指标的时间段内的告警信息对每一组所述历史指标添加健康状态标签,得到样本数据;根据所述样本数据进行机器学习,得到健康度评估模型,其中,所述健康度评估模型的输入为服务器的运行指标,输出为表征所述服务器健康状态的标签。

Server health analysis methods, devices, storage media and electronic equipment

The purpose of the present disclosure is to provide a server health analysis method, device, storage medium and electronic equipment to solve the problem that the server health analysis in related technology is not comprehensive enough. The method includes: acquiring multiple sets of historical indicators of the server; adding health status labels to each set of historical indicators according to the alarm information of the server during the period during which each set of historical indicators is generated to obtain sample data; machine learning based on the sample data to obtain health assessment model, in which the input of the health assessment model serves as a service. The operation index of the server is output as a label representing the health status of the server.

【技术实现步骤摘要】
服务器健康度分析方法,装置,存储介质及电子设备
本公开涉及设备运维
,具体地,涉及一种服务器健康度分析方法,装置,存储介质及电子设备。
技术介绍
随着IT技术的快速发展,各个行业领域都越来越需要IT运维的设备良好运行的支持。通过监控平台能够对IT服务器的不同指标进行监控,并在指标异常的情况下发出报警信息。相关技术中,工作人员能够根据经验来判断指标是否表示设备处于正常运行状态。此外,还可以借助简单的程序来判断服务器是否正常运行,例如,在服务器的CPU使用率低于70%,内存使用率低于80%,对于当前运行磁盘剩余空间较为充足的情况下,确定服务器是正常运行的。
技术实现思路
本公开的目的是提供一种服务器健康度分析方法,装置,存储介质及电子设备,以解决相关技术中服务器健康分析不够全面的问题。为了实现上述目的,第一方面,本公开提供一种服务器健康度分析方法,包括:获取服务器的多组历史指标;根据所述服务器在产生每一组所述历史指标的时间段内的告警信息对每一组所述历史指标添加健康状态标签,得到样本数据;根据所述样本数据进行机器学习,得到健康度评估模型,其中,所述健康度评估模型的输入为服务器的运行指标,输出为表征所述服务器健康状态的标签。可选的,所述根据所述样本数据进行机器学习,得到健康度评估模型,包括:将所述样本数据发送给多个节点进行分布式存储;在每一个所述节点利用神经网络模型对该节点存储的样本数据进行训练,得到多个目标神经网络模型;所述健康度评估模型包括所述多个目标神经网络模型。可选的,所述方法还包括:获取所述服务器当前时刻的运行指标;将所述运行指标分别输入所述多个目标神经网络模型,得到多个标签分类结果;根据多数投票算法从所述多个标签分类结果,确定目标标签分类结果,并根据所述目标标签分类结果确定所述服务器的健康状态。可选的,所述节点为Ignite节点;和/或,所述神经网络模型为极限学习机ELM神经网络模型。可选的,所述根据所述服务器在产生每一组所述历史指标的时间段内的告警信息对每一组所述历史指标添加健康状态标签,得到样本数据,包括:针对任一组历史指标,根据所述服务器产生该组历史指标的时间段内的告警信息的等级,计算所述服务器的目标状态得分,并根据状态得分与健康状态标签的对应关系,将所述目标状态得分对应的目标健康状态标签作为该组历史指标的样本标签。第二方面,本公开提供一种服务器健康度分析装置,包括:第一获取模块,用于获取服务器的多组历史指标;分类模块,用于根据所述服务器在产生每一组所述历史指标的时间段内的告警信息对每一组所述历史指标添加健康状态标签,得到样本数据;机器学习模块,用于根据所述样本数据进行机器学习,得到健康度评估模型,其中,所述健康度评估模型的输入为服务器的运行指标,输出为表征所述服务器健康状态的标签。可选的,所述机器学习模块,用于:将所述样本数据发送给多个节点进行分布式存储;在每一个所述节点利用神经网络模型对该节点存储的样本数据进行训练,得到多个目标神经网络模型;所述健康度评估模型包括所述多个目标神经网络模型。可选的,所述装置还包括:第二获取模块,用于获取所述服务器当前时刻的运行指标;分类模块,用于将所述运行指标分别输入所述多个目标神经网络模型,得到多个标签分类结果;确定模块,用于根据多数投票算法从所述多个标签分类结果,确定目标标签分类结果,并根据所述目标标签分类结果确定所述服务器的健康状态。可选的,所述节点为Ignite节点;和/或,所述神经网络模型为极限学习机ELM神经网络模型。可选的,所述根据所述服务器在产生每一组所述历史指标的时间段内的告警信息对每一组所述历史指标添加健康状态标签,得到样本数据,包括:针对任一组历史指标,根据所述服务器产生该组历史指标的时间段内的告警信息的等级,计算所述服务器的目标状态得分,并根据状态得分与健康状态标签的对应关系,将所述目标状态得分对应的目标健康状态标签作为该组历史指标的样本标签。第三方面,本公开提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现任一项所述服务器健康度分析方法的步骤。第四方面,本公开提供一种电子设备,包括:存储器,其上存储有计算机程序;处理器,用于执行所述存储器中的所述计算机程序,以实现任一项所述服务器健康度分析方法的步骤。上述技术方案,至少能够达到以下技术效果:通过获取服务器的多组历史指标,再根据所述服务器在产生每一组所述历史指标的时间段内的告警信息对每一组所述历史指标添加健康状态标签,得到样本数据,这样,通过告警信息来构建的标签评价能够让样本数据清晰准确的表述服务器在每一时间段内的状态。进一步的,根据所述样本数据进行机器学习,得到健康度评估模型,由于机器学习能够综合多个维度的特征训练得到健康度评估模型,能够自动发现指标之间内在联系,使得健康度评估模型能够更加全面的分析服务器的健康度,继而在健康度评估模型中输入服务器的运行指标后,能够得到更为精准的表征所述服务器健康状态的标签。本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。附图说明附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:图1是根据一示例性实施例示出的一种服务器健康度分析方法流程图。图2是根据一示例性实施例示出的另一种服务器健康度分析方法流程图。图3是根据一示例性实施例示出的另一种服务器健康度分析方法流程图。图4是根据一示例性实施例示出的一种服务器健康度分析装置框图。图5是根据一示例性实施例示出的一种电子设备框图。图6是根据一示例性实施例示出的另一种电子设备框图。具体实施方式以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。相关技术中,一些服务器从指标上来看运行平稳,但实际上处于亚健康的状态。相关技术中检测设备运行状态程序过于简单,缺乏发现多个指标内在关联问题的能力,可能未能及时发现设备运行中存在的风险。对此,本公开实施例提出一种服务器健康度分析方法,以更加全面的分析服务器的健康度。图1是根据一示例性实施例示出的一种服务器健康度分析方法流程图。所述方法包括:S11,获取服务器的多组历史指标。示例的,服务器的历史指标可以分为以下几个类型,分别是CPU使用率(CPU),物理内存使用率(Memory),5分钟平均负载(Load),磁盘使用率(Disk)和虚拟内存使用率(VirtualMemory,Vir-Memory)。具体的,获取的多组历史指标可以是一定时间范围内的指标。其中,每一组指标对应某一时刻服务器的上述类型的指标数据集合。例如,表1所示是一个月内多组历史指标。表1S12,根据所述服务器在产生每一组所述历史指标的时间段内的告警信息对每一组所述历史指标添加健康状态标签,得到样本数据。在具体实施时,可以将健康等级分为四个等级,分别是“健康”、“亚健康”、“危险”、“严重”。可选的,所述根据所述服务器在产生每一组所述历史指标的时间段内的告警信息对每一组所述历史指标添加健康状态标签,得到样本数据,包括:针对任一组历史指标,根据所述服务器产生该组历史指标的时间段内的告警信息的等级,计算本文档来自技高网...

【技术保护点】
1.一种服务器健康度分析方法,其特征在于,包括:获取服务器的多组历史指标;根据所述服务器在产生每一组所述历史指标的时间段内的告警信息对每一组所述历史指标添加健康状态标签,得到样本数据;根据所述样本数据进行机器学习,得到健康度评估模型,其中,所述健康度评估模型的输入为服务器的运行指标,输出为表征所述服务器健康状态的标签。

【技术特征摘要】
1.一种服务器健康度分析方法,其特征在于,包括:获取服务器的多组历史指标;根据所述服务器在产生每一组所述历史指标的时间段内的告警信息对每一组所述历史指标添加健康状态标签,得到样本数据;根据所述样本数据进行机器学习,得到健康度评估模型,其中,所述健康度评估模型的输入为服务器的运行指标,输出为表征所述服务器健康状态的标签。2.根据权利要求1所述的方法,其特征在于,所述根据所述样本数据进行机器学习,得到健康度评估模型,包括:将所述样本数据发送给多个节点进行分布式存储;在每一个所述节点利用神经网络模型对该节点存储的样本数据进行训练,得到多个目标神经网络模型;所述健康度评估模型包括所述多个目标神经网络模型。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取所述服务器当前时刻的运行指标;将所述运行指标分别输入所述多个目标神经网络模型,得到多个标签分类结果;根据多数投票算法从所述多个标签分类结果,确定目标标签分类结果,并根据所述目标标签分类结果确定所述服务器的健康状态。4.根据权利要求2或3所述的方法,其特征在于,所述节点为Ignite节点;和/或,所述神经网络模型为极限学习机ELM神经网络模型。5.根据权利要求1至3中任一项所述的方法,其特征在于,所述根据所述服务器在产生每一组所述历史指标的时间段内的告警信息对每一组所述历史指标添加健康状态标签,得到样本数据,包括:针对任一组历史指标,根据所述服务器产生该组历史指标的时间段内的告警信息的等级,计算所述服务器的目标状态得分,并根据状态得分与健...

【专利技术属性】
技术研发人员:孙卓然
申请(专利权)人:东软集团股份有限公司
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1