一种故障预警判定的方法、装置、设备及存储介质制造方法及图纸

技术编号:19824337 阅读:46 留言:0更新日期:2018-12-19 15:37
本发明专利技术公开了一种故障预警判定的方法、装置、设备以及计算机可读存储介质,包括:实时监测服务器集群的运行状态,采集所述服务器集群的实时状态监测数据;根据所述实时状态监测数据判断是否有故障预警事件发生;若是,则对所述故障预警事件进行过滤,查找到源头故障预警事件后,将所述源头故障预警事件上报至运营管理人员。本发明专利技术公开的方法、装置、设备以及计算机可读存储介质,过滤故障预警事件中的冗余事件,便于运维人员定位服务器集群中故障源头,从而及时排除隐患,保证了服务器集群运行的稳定性。

【技术实现步骤摘要】
一种故障预警判定的方法、装置、设备及存储介质
本专利技术涉及服务器集群安全
,特别是涉及一种故障预警判断的方法、装置、设备以及计算机可读存储介质。
技术介绍
随着互联网的发展及企业信息化进程,越来越多企业逐渐采用服务器集群进行数据存储及处理,随着规模和数量的增长在一定程度上增加了集群发生故障的概率,对故障预警带来了挑战。在服务器集群中,故障的产生通常是多个故障现象同时产生,而这些故障的产生往往是由某个单一故障引起的,这些往往会对运维人员定位故障源头造成干扰,造成运营人员对服务器集群的故障排查时间拖延的问题,由于延长了服务器集群故障时间,大大降低了集群系统的可用性。综上所述可以看出,如何提高服务器集群故障检测效率是目前有待解决的问题。
技术实现思路
本专利技术的目的是提供一种故障预警判定的方法、装置、设备以及计算机可读存储介质,以解决现有技术中对服务器集群的故障排查效率低的问题。为解决上述技术问题,本专利技术提供一种故障预警判定的方法,包括:实时监测服务器集群的运行状态,采集所述服务器集群的实时状态监测数据;根据所述实时状态监测数据判断是否有故障预警事件发生;若是,则对所述故障预警事件进行过滤,查找到源头故障预警事件后,将所述源头故障预警事件上报至运营管理人员。优选地,所述实时监测服务器集群的运行状态,实时采集状态监测数据包括:通过多线程的监测方式,实时监测服务器集群的运行状态并采集所述服务器集群的实时运行状态数据。优选地,所述对所述故障预警事件进行过滤,查找到源头故障预警事件包括:根据预设的规则库,对各个故障预警事件之间的关联关系进行分析,过滤冗余故障预警事件,保留源头故障预警事件。优选地,所述对所述故障预警事件进行过滤,查找到源头故障预警事件后,将所述源头故障预警事件上报至运营管理人员包括:查找到源头故障预警事件后,利用预设预警方式通知运营管理人员;收集源头故障预警事件信息,并将所述源头故障预警事件信息记录至预警事件日志内,以便于所述运营管理人员根据所述预警事件日志对所述服务器集群进行评估。优选地,所述收集源头故障预警事件信息,并将所述源头故障预警事件信息记录至预警事件日志内后还包括:每隔预设时间间隔,向所述运营管理人员发送所述预警事件日志,以便于所述运营管理人员根据所述预警事件日志对所述服务器集群进行评估。本专利技术还提供了一种故障预警判定的装置,包括:监测模块,用于实时监测服务器集群的运行状态,采集所述服务器集群的实时状态监测数据;判断模块,用于根据所述实时状态监测数据判断是否有故障预警事件发生;查找模块,用于若是,则对所述故障预警事件进行过滤,查找到源头故障预警事件后,将所述源头故障预警事件上报至运营管理人员。优选地,所述监测模块具体用于:通过多线程的监测方式,实时监测服务器集群的运行状态并采集所述服务器集群的实时运行状态数据。优选地,所述查找模块具体用于:根据预设的规则库,对各个故障预警事件之间的关联关系进行分析,过滤冗余故障预警事件,保留源头故障预警事件。本专利技术还提供了一种故障预警判定的设备,包括:存储器,用于存储计算机程序;处理器,用于执行所述计算机程序时实现上述一种故障预警判定的方法的步骤。本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述一种故障预警判定的方法的步骤。本专利技术所提供的故障预警判定的方法,实施监测服务器集群的运行状态,并采集所述服务器集群的实时状态监测数据。对所述实时状态监测数据进行存储与跟踪分析;从而根据所述实时状态监测数据判断是否有故障预警事件发生;若有故障预警事件发生,则对所有的故障预警事件进行过滤,查找到源头故障预警事件,并将所述源头故障预警事件上报至所述服务器集群的运营管理人员,以便于所述运营管理人员定位故障源头,快速对源头故障进行维修,提高服务器集群运行的稳定性。附图说明为了更清楚的说明本专利技术实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术所提供的故障预警判定的方法的第一种具体实施例的流程图;图2为本专利技术所提供的故障预警判定的方法的第二种具体实施例的流程图;图3为本专利技术实施例提供的一种故障预警判定的装置的结构框图。具体实施方式本专利技术的核心是提供一种故障预警判定的方法、装置、设备以及计算机可读存储介质,通过查找服务器集群中的源头故障预警事件,使运营管理人员定位故障源头,从而提高服务器集群运行的稳定性。为了使本
的人员更好地理解本专利技术方案,下面结合附图和具体实施方式对本专利技术作进一步的详细说明。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,图1为本专利技术所提供的故障预警判定的方法的第一种具体实施例的流程图;具体操作步骤如下:步骤S101:实时监测服务器集群的运行状态,采集所述服务器集群的实时状态监测数据;在本实施例中,可以通过对服务器集群中各个服务器的软硬件信息进行获取并保持跟踪,对服务器集群的运行状态进行实时监测,从而获取实时状态监测数据。本实施例中可以采用多线程、非阻塞和模块化的监测方法对所述服务器集群的运行状态进行实时监测。步骤S102:根据所述实时状态监测数据判断是否有故障预警事件发生;对采集到的所述实时状态监测数据进行存储和分析,并且可以依据阈值、状态及快变等多种预警判定方法对所述实时状态监测数据进行判定。步骤S103:若是,则对所述故障预警事件进行过滤,查找到源头故障预警事件后,将所述源头故障预警事件上报至运营管理人员。当判断有故障预警事件发生时,将各个故障预警事件存储至存储器中,过滤所述故障预警事件中的冗余事件,查找出源头故障预警事件,并将所述故障预警事件上报至运营管理人员,从而使运营管理人员及时排除服务器集群中的故障隐患,保证了所述服务器集群运行的稳定性。基于上述实施例,在本实施例中,可以通过对各个故障预警事件之间的关联关系进行分析,过滤冗余故障预警事件,保留源头故障预警事件。请参考图2,图2为本专利技术所提供的故障预警判定的方法的第二种具体实施例的流程图;具体操作步骤如下:步骤S201:通过多线程的监测方式,实时监测服务器集群的运行状态并采集所述服务器集群的实时状态监测数据;步骤S202:对所述实时状态监测数据进行存储与跟踪分析,从而判断是否有故障预警事件发生;步骤S203:若发生故障预警事件,则根据预设的规则库,对各个故障预警事件之间的关联关系进行分析,过滤冗余故障预警事件,查找源头故障预警事件;步骤S204:查找到所述源头故障预警事件后,利用预设预警方式通知运营管理人员,以便于所述运营管理人员定位故障源头,排除所述源头故障事件;步骤S205:收集源头故障预警事件信息,并将所述源头故障预警事件信息记录至预警事件日志内;步骤S206:每隔预设时间间隔,向所述运营管理人员发送所述预警事件日志,以便于所述运营管理人员根据所述预警事件日志对所述服务器集群本文档来自技高网
...

【技术保护点】
1.一种故障预警判定的方法,其特征在于,包括:实时监测服务器集群的运行状态,采集所述服务器集群的实时状态监测数据;根据所述实时状态监测数据判断是否有故障预警事件发生;若是,则对所述故障预警事件进行过滤,查找到源头故障预警事件后,将所述源头故障预警事件上报至运营管理人员。

【技术特征摘要】
1.一种故障预警判定的方法,其特征在于,包括:实时监测服务器集群的运行状态,采集所述服务器集群的实时状态监测数据;根据所述实时状态监测数据判断是否有故障预警事件发生;若是,则对所述故障预警事件进行过滤,查找到源头故障预警事件后,将所述源头故障预警事件上报至运营管理人员。2.如权利要求1所述的方法,其特征在于,所述实时监测服务器集群的运行状态,实时采集状态监测数据包括:通过多线程的监测方式,实时监测服务器集群的运行状态并采集所述服务器集群的实时运行状态数据。3.如权利要求1所述的方法,其特征在于,所述对所述故障预警事件进行过滤,查找到源头故障预警事件包括:根据预设的规则库,对各个故障预警事件之间的关联关系进行分析,过滤冗余故障预警事件,保留源头故障预警事件。4.如权利要求3所述的方法,其特征在于,所述对所述故障预警事件进行过滤,查找到源头故障预警事件后,将所述源头故障预警事件上报至运营管理人员包括:查找到源头故障预警事件后,利用预设预警方式通知运营管理人员;收集源头故障预警事件信息,并将所述源头故障预警事件信息记录至预警事件日志内,以便于所述运营管理人员根据所述预警事件日志对所述服务器集群进行评估。5.如权利要求4所述的方法,其特征在于,所述收集源头故障预警事件信息,并将所述源头故障预警事件信息记录至...

【专利技术属性】
技术研发人员:胡汉顶贾伟
申请(专利权)人:郑州云海信息技术有限公司
类型:发明
国别省市:河南,41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1