一种服务器健康度评估方法和装置制造方法及图纸

技术编号:36083749 阅读:53 留言:0更新日期:2022-12-24 10:58
本发明专利技术提供了一种服务器健康度评估方法和装置,方法包括:监控工具定时发送IPMI指令,获取到CPU温度、CPU功耗、内存温度、内存功耗、存储功耗、GPU温度指标实时数值;读取配置表信息,获取参与计算的指标项目,获取参与计算的指标权重;根据获取的配置信息,对参与计算的指标项目如CPU温度、CPU功耗、内存温度、内存功耗、存储功耗、GPU温度指标,计算出各个指标的健康度;根据CPU温度、CPU功耗、内存温度、内存功耗、存储功耗、GPU温度参与计算指标的健康度,加权计算出服务器的健康度。本发明专利技术通过发送带外IPMI指令获取服务器状态,加权计算得到服务器健康度数值,不访问服务器主机,不占用服务器主机资源,即可获取服务器健康度,提升用户满意度。用户满意度。用户满意度。

【技术实现步骤摘要】
一种服务器健康度评估方法和装置


[0001]本专利技术涉及数据处理领域,具体涉及一种服务器健康度评估方法和装置。

技术介绍

[0002]随着信息化日益普及,企业对信息系统的依赖程度随之增加。服务器作为信息系统基础单元,稳定性和可靠性要求越来越高,服务器运行状态会影响信息系统运行状态,甚至导致业务系统失败。针对服务器进行监控、维护管理的需求随之而来,服务器健康状态重要性不言而喻。
[0003]服务器健康度是指服务器系统可用性、性能符合、资源利用的状态良好,不存在故障或隐患,针对服务器定期进行健康度评估,可以变被动的响应式服务为主动维护,全面掌握服务器运行状况,消除故障隐患,提高系统可用性,让运维监控人员从海量的告警分析、告警实时监测工作中解脱出来,最直观地了解宏观情况,判断优先级紧急程度,从而极大地提高工作效率。可以让高层领导实时、快速、动态地掌握服务器系统运行健康状况。
[0004]服务器健康度需要专门的监测指标来评估。监控工具通过对服务器关键运行指标的监控,实时掌握服务器运行性能状况,主动发现异常情况以及性能瓶颈,及时采取针对性的处理方法及优化措施,提高服务器运行质量以及业务的可靠性和可用性。
[0005]中国专利CN106776214B公开了一种服务器健康度评估方法,一种服务器健康度评估方法,包括步骤:获取服务器的网元指标;通过网管的指标阈值监控信息获取每一网元指标的告警等级以及每一告警等级的指标阈值,指标阈值包括指标阈值上限或/和指标阈值下限;实时获取每一网元指标性能值;当网元指标性能值未超出指标阈值上限或未低于指标阈值下限时,根据每一告警等级、每一告警等级的指标阈值以及每一网元指标性能值计算每一网元指标的健康度损减分数;计算服务器的健康度。这样不可避免会时刻占用主机内存资源、网络带宽,在服务器主机端进行监控,监控程序驻留在服务器主机上,占用服务器主机端资源,影响服务器业务处理。
[0006]因此,针对问题,需要提出一种服务器健康度评估方法,使得不占用服务器主机资源,独立监控服务器健康状态。

技术实现思路

[0007]有鉴于此,本专利技术的目的在于提出一种改进的服务器健康度评估方法和装置,使得不占用服务器主机资源,独立监控服务器健康状态。
[0008]服务器健康度需要专门的监测指标来评估。监控工具通过对服务器关键运行指标的监控,实时掌握服务器运行性能状况,主动发现异常情况以及性能瓶颈,及时采取针对性的处理方法及优化措施,提高服务器运行质量以及业务的可靠性和可用性,现有监控方式不可避免会时刻占用主机内存资源、网络带宽,在服务器主机端进行监控,监控程序驻留在服务器主机上,占用服务器主机端资源,影响服务器业务处理,因此,我们提出一种服务器健康度评估方法,所述服务器健康度评估方法包括:监控工具定时发送IPMI指令,获取指标
实时数值;读取配置表信息,获取参与计算的指标项目,获取参与计算的指标权重;根据获取的配置信息,对参与计算的指标项目计算出各个指标的健康度;根据参与计算指标的健康度,加权计算出服务器的健康度。本专利技术通过发送带外IPMI指令获取服务器状态,加权计算得到服务器健康度数值,监测服务器健康状态,给服务器使用人员提供服务器健康程度的度量表征,方便服务器使用人员了解服务器健康状态,同时简化运维工作量,不访问服务器主机,不占用服务器主机资源,即可获取服务器健康度,提升用户满意度。
[0009]基于上述目的,一方面,本专利技术提供了一种服务器健康度评估方法,该方法包括以下步骤:
[0010]监控工具定时发送IPMI指令,获取到CPU温度、CPU功耗、内存温度、内存功耗、存储功耗、GPU温度指标实时数值;
[0011]读取配置表信息,获取参与计算的指标项目,获取参与计算的指标权重;
[0012]根据获取的配置信息,对参与计算的指标项目如CPU温度、CPU功耗、内存温度、内存功耗、存储功耗、GPU温度指标,计算出各个指标的健康度;
[0013]根据CPU温度、CPU功耗、内存温度、内存功耗、存储功耗、GPU温度参与计算指标的健康度,加权计算出服务器的健康度。
[0014]在根据本专利技术的服务器健康度评估方法的一些实施例中,所述监控工具定时发送IPMI指令,获取到CPU温度、CPU功耗、内存温度、内存功耗、存储功耗、GPU温度指标实时数值的方法,具体包括:
[0015]输入BMCIP、用户名、密码;
[0016]定时发送带外IPMI指令;
[0017]获取CPU温度、CPU功耗、内存温度、内存功耗、存储功耗、GPU温度指标的当前数值。
[0018]在根据本专利技术的服务器健康度评估方法的一些实施例中,所述根据获取的配置信息,对参与计算的指标项目如CPU温度、CPU功耗、内存温度、内存功耗、存储功耗、GPU温度指标,计算出各个指标的健康度的方法,具体包括:
[0019]根据指标数值处于不可逆低阈值,严重低阈值,非严重低阈值,非严重高阈值,严重高阈值,不可逆高阈值范围内,分别计算健康度。
[0020]在根据本专利技术的服务器健康度评估方法的一些实施例中,当指标为CPU温度时,CPU温度范围为不可逆低阈值,严重低阈值,非严重低阈值,非严重高阈值,严重高阈值,不可逆高阈值。
[0021]在根据本专利技术的服务器健康度评估方法的一些实施例中,当指标为CPU功耗时,CPU功耗范围为不可逆低阈值,严重低阈值,非严重低阈值,非严重高阈值,严重高阈值,不可逆高阈值。
[0022]在根据本专利技术的服务器健康度评估方法的一些实施例中,当指标为内存温度时,内存温度范围为不可逆低阈值,严重低阈值,非严重低阈值,非严重高阈值,严重高阈值,不可逆高阈值。
[0023]当指标为内存功耗时,内存功耗范围为不可逆低阈值,严重低阈值,非严重低阈值,非严重高阈值,严重高阈值,不可逆高阈值;
[0024]当指标为存储功耗时,存储功耗范围为不可逆低阈值,严重低阈值,非严重低阈值,非严重高阈值,严重高阈值,不可逆高阈值。
[0025]在根据本专利技术的服务器健康度评估方法的一些实施例中,当指标为GPU温度时,GPU温度范围为不可逆低阈值,严重低阈值,非严重低阈值,非严重高阈值,严重高阈值,不可逆高阈值。
[0026]在根据本专利技术的服务器健康度评估方法的一些实施例中,在所述步骤根据CPU温度、CPU功耗、内存温度、内存功耗、存储功耗、GPU温度参与计算指标的健康度,加权计算出服务器的健康度中,服务器健康度计算公式为:
[0027]Health=∑W
i
*H
i
[0028]其中,服务器健康度计算时首先分别计算单个指标健康度Hi,再计算单个指标健康度与权重Wi乘积,将所有指标健康度权重乘积累加起来即为服务器整体健康度。
[0029]本专利技术的另一方面,还提供了一种服务器健康度评估装置,所述服务器健康度评估装置包括:
[0030]实时数值获取模块,通过监控工具定时发送IPMI指本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种服务器健康度评估方法,其特征在于,所述服务器健康度评估方法包括以下步骤:监控工具定时发送IPMI指令,获取到CPU温度、CPU功耗、内存温度、内存功耗、存储功耗、GPU温度指标实时数值;读取配置表信息,获取参与计算的指标项目,获取参与计算的指标权重;根据获取的配置信息,对参与计算的指标项目如CPU温度、CPU功耗、内存温度、内存功耗、存储功耗、GPU温度指标,计算出各个指标的健康度;根据CPU温度、CPU功耗、内存温度、内存功耗、存储功耗、GPU温度参与计算指标的健康度,加权计算出服务器的健康度。2.根据权利要求1所述的方法,其特征在于,所述监控工具定时发送IPMI指令,获取到CPU温度、CPU功耗、内存温度、内存功耗、存储功耗、GPU温度指标实时数值的方法,具体包括:输入BMCIP、用户名、密码;定时发送带外IPMI指令;获取CPU温度、CPU功耗、内存温度、内存功耗、存储功耗、GPU温度指标的当前数值。3.根据权利要求2所述的方法,其特征在于,所述根据获取的配置信息,对参与计算的指标项目如CPU温度、CPU功耗、内存温度、内存功耗、存储功耗、GPU温度指标,计算出各个指标的健康度的方法,具体包括:根据指标数值处于不可逆低阈值,严重低阈值,非严重低阈值,非严重高阈值,严重高阈值,不可逆高阈值范围内,分别计算健康度。4.根据权利要求3所述的方法,其特征在于,当指标为CPU温度时,CPU温度范围为不可逆低阈值,严重低阈值,非严重低阈值,非严重高阈值,严重高阈值,不可逆高阈值。5.根据权利要求4所述的方法,其特征在于,当指标为CPU功耗时,CPU功耗范围为不可逆低阈值,严重低阈值,非严重低阈值,非严重高阈值,严重高阈值,不可逆高阈值。6.根据权利要求5所述的方法,其特征在于,当指标为内存温度时,内存温度范围为不可逆低阈值,严重低阈值,非严重低阈值,非严重高阈值,严重高阈值,不可逆高阈值;当指标为内存功耗时,内存功耗范...

【专利技术属性】
技术研发人员:郝林伟
申请(专利权)人:山东云海国创云计算装备产业创新中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1