This application discloses a method and device for monitoring the status of a host in a cloud platform. The method includes: calculating the average utilization rate of resources concerned in all hosts of cloud platform; calculating the instant utilization rate of resources concerned in each host of cloud platform; calculating the deviation value between the instant utilization rate of resources concerned in each host and the average utilization rate of resources concerned in each host, and calculating the related value. Note the score of each resource; according to the score of each resource concerned, rank the possible failure hosts among all hosts on the cloud platform. By calculating the score of each resource concerned, we can synthesize whether the utilization rate of each resource is normal or not, determine the sequence of hosts that may break down, facilitate operators to actively maintain the hosts of cloud platform, and reduce the probability of hosts'failure.
【技术实现步骤摘要】
一种用于监控云平台中的主机状态的方法和装置
本申请涉及计算机主机运维领域,尤指一种用于监控云平台中的主机状态的方法和装置。
技术介绍
在云计算时代,云平台内的主机规模逐渐庞大,随着云平台的业务系统中的虚拟机逐渐增多,对主机的监控越来越重要。然而,现有的监控技术无法有效地监控处于高危状态的主机,数据中心运维人员仅能在主机发生故障以后再排查和修复出现故障的主机,这会造成数据中心运维人员维护云平台的主机工作非常被动。
技术实现思路
为了解决上述技术问题,本申请提供了一种用于监控云平台中的主机状态的方法和装置,能够使数据中心运维人员主动获知最可能发生故障的主机。为了达到本申请的目的,本专利技术实施例提供了一种用于监控云平台中的主机状态的方法,该方法包括:计算出云平台中的全部主机中的所关注的资源的利用率的平均值;计算出云平台中的每台主机中的所关注的资源的利用率的即时值;根据每台主机中的所关注的每种资源的利用率的即时值与对应的所关注的资源的利用率的平均值的偏差值,计算出所关注的每种资源的得分;根据所关注的每种资源的得分,排列出在云平台的全部主机之中的有可能发生故障的主机的顺序。进一步地,在一个可选的实施例中,根据所关注的每种资源的得分,排列出在云平台的全部主机之中的有可能发生故障的主机的顺序的步骤包括:将所关注的每种资源的得分乘以所关注的每种资源的相应的影响系数,计算出每台主机的健康指数;根据每台主机的健康指数,排列出在云平台的全部主机之中的有可能发生故障的主机的顺序。进一步地,在一个可选的实施例中,在排列出在云平台的全部主机之中的有可能发生故障的主机的顺序的步骤之后,该 ...
【技术保护点】
1.一种用于监控云平台中的主机状态的方法,其特征在于,所述方法包括:计算出云平台中的全部主机中的所关注的资源的利用率的平均值;计算出所述云平台中的每台主机中的所关注的资源的利用率的即时值;根据每台主机中的所关注的每种资源的利用率的即时值与对应的所关注的资源的利用率的平均值的偏差值,计算出所关注的每种资源的得分;根据所关注的每种资源的得分,排列出在所述云平台的全部主机之中的有可能发生故障的主机的顺序。
【技术特征摘要】
1.一种用于监控云平台中的主机状态的方法,其特征在于,所述方法包括:计算出云平台中的全部主机中的所关注的资源的利用率的平均值;计算出所述云平台中的每台主机中的所关注的资源的利用率的即时值;根据每台主机中的所关注的每种资源的利用率的即时值与对应的所关注的资源的利用率的平均值的偏差值,计算出所关注的每种资源的得分;根据所关注的每种资源的得分,排列出在所述云平台的全部主机之中的有可能发生故障的主机的顺序。2.根据权利要求1所述的方法,其中,所述根据所关注的每种资源的得分,排列出在所述云平台的全部主机之中的有可能发生故障的主机的顺序的步骤包括:将所关注的每种资源的得分乘以所关注的每种资源的相应的影响系数,计算出每台主机的健康指数;根据每台主机的健康指数,排列出在所述云平台的全部主机之中的有可能发生故障的主机的顺序。3.根据权利要求1所述的方法,其特征在于,在所述排列出在所述云平台的全部主机之中的有可能发生故障的主机的顺序的步骤之后,所述方法还包括:按照排列出的有可能发生故障的主机的顺序,输出预先设定的数量的主机的所关注的资源的利用率的即时值以及主机的名称。4.根据权利要求1所述的方法,其特征在于,在所述排列出在所述云平台的全部主机之中的有可能发生故障的主机的顺序的步骤之后,所述方法还包括:如果所关注的资源的得分超过了相应的监控阈值,则输出告警信号。5.根据权利要求2所述的方法,其特征在于,在所述排列出在所述云平台的全部主机之中的有可能发生故障的主机的顺序的步骤之后,所述方法还包括:如果主机的健康指数超过了健康指数的监控阈值,则输出告警信号。6.一种用于监控云平台中的主机状态的装置,包括存储器和处理器,...
【专利技术属性】
技术研发人员:赵龙,
申请(专利权)人:郑州云海信息技术有限公司,
类型:发明
国别省市:河南,41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。