一种BMC健康状态监控方法、系统、终端及存储介质技术方案

技术编号:23190764 阅读:25 留言:0更新日期:2020-01-24 16:12
本发明专利技术提供一种BMC健康状态监控方法、系统、终端及存储介质,包括:建立独立于IPMI MAIN的服务器健康监控进程并在所述监控进程中建立独立的BMC健康监控线程;通过所述监控线程轮询获取BMC监控项目数据;将监控数据超过预设阈值的监控项目定位为异常项目;解析导致异常项目形成的异常程序,并输出所述异常程序信息。本发明专利技术可以在BMC系统自身发生故障时,通过故障日志收集的BMC告警信息更准确更高效的定位故障发生的位置,发生的原因以及处理建议,大大降低服务器的维护成本,提高产品竞争力。

A health monitoring method, system, terminal and storage medium for BMC

【技术实现步骤摘要】
一种BMC健康状态监控方法、系统、终端及存储介质
本专利技术涉及服务器测试
,具体涉及一种BMC健康状态监控方法、系统、终端及存储介质。
技术介绍
随着信息技术的飞速发展以及云计算和物联网的落地,用户对服务器的可靠性和信息处理能力有了更高的要求。与传统服务器相比,基于Purley平台的新一代服务器在计算性能和可靠性上与传统服务器相比具有很大的优势,并在对实时性、可靠性和可用性要求苛刻的领域中应用越来越广泛,而BMC作为服务器管理模块在服务器整个系统中担当着十分重要的角色,尤其是在服务器故障诊断方面十分重要。同时基于whitley平台的新一代服务器不但在管理和监控方面要求的更加精细准确,而且对于BMC管理模块自身的稳定性也有着极高的要求,因此BMC不但需要完成日常对服务器整体的健康监控,同时也要监控自身的资源占用,以便出现故障后能够及时的定位问题原因,对BMC自身小系统的故障诊断的准确度有了更高的要求。目前服务器BMC对自身小系统资源监控方面覆盖面积太窄,收集到的信息很多对故障定位没有帮助,并且收集到的信息不够详细,准确度也不够,容易产生误告警。对此需要对目前的BMC自身监控策略进行优化。
技术实现思路
针对现有技术的上述不足,本专利技术提供一种BMC健康状态监控方法、系统、终端及存储介质,以解决上述技术问题。第一方面,本专利技术提供一种BMC健康状态监控方法,包括:建立独立于IPMIMAIN的服务器健康监控进程并在所述监控进程中建立独立的BMC健康监控线程;通过所述监控线程轮询获取BMC监控项目数据;将监控数据超过预设阈值的监控项目定位为异常项目;解析导致异常项目形成的异常程序,并输出所述异常程序信息。进一步的,所述通过监控线程轮询获取BMC监控项目数据,包括:利用系统top命令轮询获取CPU使用率和内存使用率;利用df-h命令获取主要路径的挂载率;通过文件获取文件描述符的使用率。进一步的,所述将监控数据超过预设阈值的监控项目定位为异常项目,包括:采集预设周期时间段内的CPU使用率监控数据、内存使用率监控数据和文件描述符监控数据;分别将CPU使用率监控数据、内存使用率监控数据和文件描述符监控数据去掉最大值和最小值后再计算平均值,得到平均CPU使用率、平均内存使用率和平均文件描述符;将平均CPU使用率与CPU使用率阈值对比,将平均内存使用率与内存使用率阈值对比,将平均文件描述符与文件描述符阈值对比,将超过对应阈值的监控项目记录至日志文件。进一步的,所述解析导致异常项目形成的异常程序并输出所述异常程序信息,包括:若CPU使用率或内存使用率异常,则利用top命令和popen函数获取top命令的执行结果,并通过fgets指令解析所述执行结果得到占用率最高的多个进程信息;若挂载率异常,则使用df-h命令和popen函数获取发生异常的路径名字。第二方面,本专利技术提供一种BMC健康状态监控系统,包括:线程建立单元,配置用于建立独立于IPMIMAIN的服务器健康监控进程并在所述监控进程中建立独立的BMC健康监控线程;数据获取单元,配置用于通过所述监控线程轮询获取BMC监控项目数据;阈值评估单元,配置用于将监控数据超过预设阈值的监控项目定位为异常项目;故障解析单元,配置用于解析导致异常项目形成的异常程序,并输出所述异常程序信息。进一步的,所述数据获取单元包括:第一获取模块,配置用于利用系统top命令轮询获取CPU使用率和内存使用率;第二获取模块,配置用于利用df-h命令获取主要路径的挂载率;第三获取模块,配置用于通过文件获取文件描述符的使用率。进一步的,所述阈值评估单元包括:数据采集模块,配置用于采集预设周期时间段内的CPU使用率监控数据、内存使用率监控数据和文件描述符监控数据;加权平均模块,配置用于分别将CPU使用率监控数据、内存使用率监控数据和文件描述符监控数据去掉最大值和最小值后再计算平均值,得到平均CPU使用率、平均内存使用率和平均文件描述符;阈值比对模块,配置用于将平均CPU使用率与CPU使用率阈值对比,将平均内存使用率与内存使用率阈值对比,将平均文件描述符与文件描述符阈值对比,将超过对应阈值的监控项目记录至日志文件。进一步的,所述故障解析单元包括:第一解析模块,配置用于若CPU使用率或内存使用率异常,则利用top命令和popen函数获取top命令的执行结果,并通过fgets指令解析所述执行结果得到占用率最高的多个进程信息;第二解析模块,配置用于若挂载率异常,则使用df-h命令和popen函数获取发生异常的路径名字。第三方面,提供一种终端,包括:处理器、存储器,其中,该存储器用于存储计算机程序,该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。本专利技术的有益效果在于,本专利技术提供的BMC健康状态监控方法、系统、终端及存储介质,采用异步机制防止对其他功能模块造成影响,对此先建立一个独立的进程来同时监控BMC系统自身与服务器其他部件、模块健康状态,该进程独立于IPMIMAIN,方面对监控模块进行维护管理。进程中建立一个独立的线程来监控BMC小系统的CPU占用率、内存占用率、文件描述符使用率、主要路径挂载率,当某一项资源使用率过高则产生告警日志,为了能够更准确的定位故障原因,当产生CPU、内存告警时,同时记录当前CPU、内存占用率最高的三个进程的名字,便于进行故障分析;当产生主要路径挂载率过高的告警时,记录挂载率超过阀值的路径名。通过本文提出的服务器管理系统下基于linux监控BMC自身健康状态方法可以有效完成对BMC小系统自身的故障监控以及故障管理,更加准确的定位故障发生的位置,使用户可以更及时更有效的处理服务器管理过程中发生的故障。本专利技术可以在BMC系统自身发生故障时,通过故障日志收集的BMC告警信息更准确更高效的定位故障发生的位置,发生的原因以及处理建议,大大降低服务器的维护成本,提高产品竞争力。此外,本专利技术设计原理可靠,结构简单,具有非常广泛的应用前景。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一个实施例的方法的示意性流程图。图2是本专利技术一个实施例的系统的示意性框图。图3为本专利技术实施例提供的一种终端的结构示意图。具体实施方式为了使本
的人员更好地理解本专利技术中的技术方案,下面将结合本专利技术实施例中的附图,对本发本文档来自技高网
...

【技术保护点】
1.一种BMC健康状态监控方法,其特征在于,包括:/n建立独立于IPMI MAIN的服务器健康监控进程并在所述监控进程中建立独立的BMC健康监控线程;/n通过所述监控线程轮询获取BMC监控项目数据;/n将监控数据超过预设阈值的监控项目定位为异常项目;/n解析导致异常项目形成的异常程序,并输出所述异常程序信息。/n

【技术特征摘要】
1.一种BMC健康状态监控方法,其特征在于,包括:
建立独立于IPMIMAIN的服务器健康监控进程并在所述监控进程中建立独立的BMC健康监控线程;
通过所述监控线程轮询获取BMC监控项目数据;
将监控数据超过预设阈值的监控项目定位为异常项目;
解析导致异常项目形成的异常程序,并输出所述异常程序信息。


2.根据权利要求1所述的BMC健康状态监控方法,其特征在于,所述通过监控线程轮询获取BMC监控项目数据,包括:
利用系统top命令轮询获取CPU使用率和内存使用率;
利用df-h命令获取主要路径的挂载率;
通过文件获取文件描述符的使用率。


3.根据权利要求2所述的BMC健康状态监控方法,其特征在于,所述将监控数据超过预设阈值的监控项目定位为异常项目,包括:
采集预设周期时间段内的CPU使用率监控数据、内存使用率监控数据和文件描述符监控数据;
分别将CPU使用率监控数据、内存使用率监控数据和文件描述符监控数据去掉最大值和最小值后再计算平均值,得到平均CPU使用率、平均内存使用率和平均文件描述符;
将平均CPU使用率与CPU使用率阈值对比,将平均内存使用率与内存使用率阈值对比,将平均文件描述符与文件描述符阈值对比,将超过对应阈值的监控项目记录至日志文件。


4.根据权利要求2所述的BMC健康状态监控方法,其特征在于,所述解析导致异常项目形成的异常程序并输出所述异常程序信息,包括:
若CPU使用率或内存使用率异常,则利用top命令和popen函数获取top命令的执行结果,并通过fgets指令解析所述执行结果得到占用率最高的多个进程信息;
若挂载率异常,则使用df-h命令和popen函数获取发生异常的路径名字。


5.一种BMC健康状态监控系统,其特征在于,包括:
线程建立单元,配置用于建立独立于IPMIMAIN的服务器健康监控进程并在所述监控进程中建立独立的BMC健康监控线程;
数据获取单元,配置用于通过所述监控线程轮询获取B...

【专利技术属性】
技术研发人员:刘超逸
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1