一种评估服务器健康状态的方法技术

技术编号:18444758 阅读:17 留言:0更新日期:2018-07-14 10:18
本发明专利技术公开一种评估服务器健康状态的方法,涉及服务器评估技术领域;根据服务器系统故障对业务处理产生的影响程度不同,对服务器系统故障事件划分不同级别,针对服务器系统故障事件级别进行分析,评估服务器总体的健康状态,本发明专利技术主要根据服务器系统故障事件级别进行统计计算,不仅能够较为准确地评估服务器总体的健康状态,方便用户对服务器的健康状态有所了解,同时也方便用户采取相应的故障措施,避免因服务器造成较大损失。

A method of evaluating the health status of the server

This invention discloses a method of evaluating the health status of the server, involving the field of server evaluation. According to the different effects of the server system failure on the business processing, the server system fault events are divided into different levels, and the server system fault event level is analyzed and the overall server is evaluated. The health state, the invention is based on the statistical calculation of the server system failure event level. It can not only evaluate the overall health status of the server more accurately, but also facilitate the user to understand the health of the server. At the same time, it is also convenient for the user to take the corresponding failure measures to avoid the large loss caused by the server.

【技术实现步骤摘要】
一种评估服务器健康状态的方法
本专利技术公开一种评估服务器的方法,涉及服务器评估
,具体的说是一种评估服务器健康状态的方法。
技术介绍
服务器,也称伺服器,是提供计算服务的设备。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。服务器的构成包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。在网络环境下,根据服务器提供的服务类型不同,分为文件服务器,数据库服务器,应用程序服务器,WEB服务器等。随着计算机技术的高速发展,数据量的剧增,服务器得到了广泛的应用,服务器在处理能力、稳定性、可靠性、可扩展性等方面有明显的优势。企业越来越依赖服务器运营。大多数服务器都成为了处理关键业务的设备,因此服务器健康与否,对业务处理会产生影响。本专利技术提出一种评估服务器健康状态的方法,主要根据服务器系统故障事件级别进行统计计算,评估服务器总体的健康状态,方便用户对服务器的健康状态有所了解,同时可采取相应的措施。
技术实现思路
本专利技术针对目前技术发展的需求和不足之处,提供一种评估服务器健康状态的方法。一种评估服务器健康状态的方法,根据服务器系统故障对业务处理产生的影响程度不同,对服务器系统故障事件划分不同级别,针对服务器系统故障事件级别进行分析,评估服务器总体的健康状态;具体步骤为:采集服务器系统故障事件,形成故障事件格式,存储入队列,查询故障事件信息,对故障事件信息进行归类,统计同类别故障事件的严重级别,根据故障事件严重级别占有的权重对服务器总体的健康状态进行评分。所述的方法中采集服务器系统故障事件,根据故障事件类型形成故障事件格式,存储入队列,查询故障事件信息,根据故障事件类型对故障事件信息进行归类。所述的方法中采集的故障事件类型包括CPU故障事件、内存故障事件、硬盘故障事件、网络故障事件、pcie故障事件。所述的方法中CPU故障事件被处理成ereport.cpu.tlb_ce格式,内存故障事件格式被处理成ereport.cpu.mem_ce格式,磁盘故障事件格式被处理成ereport.disk.read.uce.err格式,网络故障事件格式被处理成ereport.net.icmp_host_unreach格式,pcie故障事件格式被处理成ereport.pcie.rx_over格式。所述的方法中故障事件的严重级别分为trivial、minor、major三类,故障事件的严重级别的权重分配是:trivial事件发生时,当前评分=当前评分-当前评分*0.1%;minor事件发生时,当前评分=当前评分-当前评分*1%;major事件发生时,当前评分=当前评分-当前评分*10%。一种评估服务器健康状态的系统,包括故障事件采集处理模块和健康状态评分模块,其中故障事件采集处理模块采集服务器系统故障事件,形成故障事件格式,存储入队列,健康状态评分模块查询故障事件信息,对故障事件信息进行归类,统计同类别故障事件的严重级别,根据故障事件严重级别占有的权重对服务器总体的健康状态进行评分。所述的系统中故障事件采集处理模块根据故障事件类型形成故障事件格式,存储入队列。所述的系统中故障事件采集处理模块采集的故障事件类型包括CPU故障事件、内存故障事件、硬盘故障事件、网络故障事件、pcie故障事件。所述的系统中故障事件采集处理模块将CPU故障事件处理成ereport.cpu.tlb_ce格式,内存故障事件格式处理成ereport.cpu.mem_ce格式,磁盘故障事件格式处理成ereport.disk.read.uce.err格式,网络故障事件格式处理成ereport.net.icmp_host_unreach格式,pcie故障事件格式处理成ereport.pcie.rx_over格式。所述的系统中健康状态评分模块将故障事件的严重级别分为trivial、minor、major三类,故障事件的严重级别的权重分配是:trivial事件发生时,当前评分=当前评分-当前评分*0.1%;minor事件发生时,当前评分=当前评分-当前评分*1%;major事件发生时,当前评分=当前评分-当前评分*10%。本专利技术与现有技术相比具有的有益效果是:本专利技术提出一种评估服务器健康状态的方法,根据服务器系统故障对业务处理产生的影响程度不同,对服务器系统故障事件划分不同级别,针对服务器系统故障事件级别进行分析,评估服务器总体的健康状态,本专利技术主要根据服务器系统故障事件级别进行统计计算,不仅能够较为准确地评估服务器总体的健康状态,方便用户对服务器的健康状态有所了解,同时也方便用户采取相应的故障措施,避免因服务器造成较大损失。附图说明图1本专利技术方法流程示意图;图2本专利技术方法中服务器总体健康状态评分流程示意图。具体实施方式本专利技术提供一种评估服务器健康状态的方法,根据服务器系统故障对业务处理产生的影响程度不同,对服务器系统故障事件划分不同级别,针对服务器系统故障事件级别进行分析,评估服务器总体的健康状态;具体步骤为:采集服务器系统故障事件,形成故障事件格式,存储入队列,查询故障事件信息,对故障事件信息进行归类,统计同类别故障事件的严重级别,根据故障事件严重级别占有的权重对服务器总体的健康状态进行评分。同时提供与上述方法相对应的一种评估服务器健康状态的系统,包括故障事件采集处理模块和健康状态评分模块,其中故障事件采集处理模块采集服务器系统故障事件,形成故障事件格式,存储入队列,健康状态评分模块查询故障事件信息,对故障事件信息进行归类,统计同类别故障事件的严重级别,根据故障事件严重级别占有的权重对服务器总体的健康状态进行评分。为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,对本专利技术进一步详细说明。利用本专利技术方法及系统,故障事件采集处理模块从服务器中采集故障事件,对故障事件进行处理其中采集的故障事件包括CPU故障事件、内存故障事件、硬盘故障事件、网络故障事件、PCIE故障事件,根据上述故障事件类型,将故障事件形成故障事件格式,CPU故障事件格式被处理成ereport.cpu.tlb_ce格式,内存故障事件格式被处理成ereport.cpu.mem_ce格式;磁盘故障事件格式被处理成ereport.disk.read.uce.err格式,网络故障事件格式被处理成ereport.net.icmp_host_unreach格式;pcie故障事件格式被处理成ereport.pcie.rx_over格式,将故障事件按照其故障事件格式存入队列中,为健康状态评分做准备;健康状态评分模块查询故障信息,对故障信息进行归类,统计同类别故障事件的严重级别,根据故障事件严重级别占有的权重进行评分,其中将故障事件的严重级别分为trivial、minor、major三类,trivial等级为微不足道的故障事件可理解为初级故障、minor等级为影响一般的故障事件可理解为中级故障、major等级为影响严重的故障事件可理解为高级故障,故障事件的严重级别的权重分配是:trivial事件发生时,当前评分=当前评分-当前评分*0.1%;mino本文档来自技高网...

【技术保护点】
1.一种评估服务器健康状态的方法,其特征在于根据服务器系统故障对业务处理产生的影响程度不同,对服务器系统故障事件划分不同级别,针对服务器系统故障事件级别进行分析,评估服务器总体的健康状态;具体步骤为:采集服务器系统故障事件,形成故障事件格式,存储入队列,查询故障事件信息,对故障事件信息进行归类,统计同类别故障事件的严重级别,根据故障事件严重级别占有的权重对服务器总体的健康状态进行评分。

【技术特征摘要】
1.一种评估服务器健康状态的方法,其特征在于根据服务器系统故障对业务处理产生的影响程度不同,对服务器系统故障事件划分不同级别,针对服务器系统故障事件级别进行分析,评估服务器总体的健康状态;具体步骤为:采集服务器系统故障事件,形成故障事件格式,存储入队列,查询故障事件信息,对故障事件信息进行归类,统计同类别故障事件的严重级别,根据故障事件严重级别占有的权重对服务器总体的健康状态进行评分。2.根据权利要求1所述的方法,其特征在于采集服务器系统故障事件,根据故障事件类型形成故障事件格式,存储入队列,查询故障事件信息,根据故障事件类型对故障事件信息进行归类。3.根据权利要求2所述的方法,其特征在于采集的故障事件类型包括CPU故障事件、内存故障事件、硬盘故障事件、网络故障事件、pcie故障事件。4.根据权利要求3所述的方法,其特征在于CPU故障事件被处理成ereport.cpu.tlb_ce格式,内存故障事件格式被处理成ereport.cpu.mem_ce格式,磁盘故障事件格式被处理成ereport.disk.read.uce.err格式,网络故障事件格式被处理成ereport.net.icmp_host_unreach格式,pcie故障事件格式被处理成ereport.pcie.rx_over格式。5.根据权利要求1-4任一项所述的方法,其特征在于故障事件的严重级别分为trivial、minor、major三类,故障事件的严重级别的权重分配是:trivial事件发生时,当前评分=当前评分-当前评分*0.1%;minor事件发生时,当前评分=当前评分-当前评分*1%;major事件发生...

【专利技术属性】
技术研发人员:郭美思
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1