一种应用服务故障的自动预测方法、装置、设备及介质制造方法及图纸

技术编号:20025361 阅读:23 留言:0更新日期:2019-01-06 04:21
本发明专利技术实施例公开了一种应用服务故障的自动预测方法、装置、设备及计算机可读存储介质。其中,方法包括利用预先建立的故障学习模型,分析采集的待预测应用服务工作过程中的硬件的状态参数数据值是否在正常工作范围内,若不在,则作为异常状况进行数据记录和计数处理;当发生异常状况总次数值超过次数阈值,则根据记录的数据、发生异常状况次数值及相对应的正常工作范围生成预测故障发生时间的故障预测报告。故障学习模型为对采集服务器上各应用服务在正常工作状态下的运行数据值进行学习,得到各应用服务在运行过程中的各状态参数的正常工作范围。本申请实现了对应用服务系统故障的准确预测,有利于提升系统可靠性,提升了应用软件的可靠性。

【技术实现步骤摘要】
一种应用服务故障的自动预测方法、装置、设备及介质
本专利技术实施例涉及服务器故障检测
,特别是涉及一种应用服务故障的自动预测方法、装置、设备及计算机可读存储介质。
技术介绍
随着互联网技术的快速发展,各行各业均离不开互联网,服务器作为网络节点,存储、处理网络上80%以上的数据和信息,其在各行各业中需求俨然很大。服务器作为管理资源在互联网中为用户提供服务的计算机设备,可包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。可见,服务器的在交付之前需要进行大量的除错,以保证服务器满足现实的高要求。由于业务系统的日渐庞大,系统的构造也日趋复杂,加之组件的动态增加,运行环境的变更,系统在线升级和在线修复等工作频繁,以及网络环境自身引入的复杂性都会导致系统可靠性的下降。应用服务一般指应用软件后台的服务支撑系统,只有服务正常才可以保证应用软件的正常使用。在大规模的并行系统中,应用服务故障已成为一种常态,大规模并行系统平均2天就会有一次故障,按照这种故障发生频率,以后更大的并行E级别系统故障的频率将会更加频繁。为了提高系统可靠性,准确预测系统的故障发生并及时解决是非常必要的,现有技术一般采用软件应用的高可用,但是,软件应用的高可用会大幅增加系统的成本。鉴于此,如何在不增加硬件成本的前提下,准确的预测应用服务的故障,以满足现实对业务系统高可靠性需求,是本领域技术人员亟待解决的问题。
技术实现思路
本专利技术实施例的目的是提供一种应用服务故障的自动预测方法、装置、设备及计算机可读存储介质,在不增加硬件成本的基础上,实现了对应用服务系统故障的准确预测,有利于提升系统可靠性,提升了应用软件的可靠性。为解决上述技术问题,本专利技术实施例提供以下技术方案:本专利技术实施例一方面提供了一种应用服务故障的自动预测方法,包括:获取待预测应用服务工作过程中的硬件的状态参数数据值;利用预先建立的故障学习模型,判断所述状态参数数据值是否在正常工作范围内;若否,则作为异常状况,进行数据记录和计数处理;当发生异常状况总次数值超过次数阈值,则根据记录的数据、发生异常状况次数值及相对应的正常工作范围生成故障预测报告;其中,所述故障学习模型为对采集服务器上各应用服务在正常工作状态下的运行数据值进行学习,得到各应用服务在运行过程中的各状态参数的正常工作范围;所述故障预测报告包括出现异常状况的硬件信息及异常状况出现次数和预测故障出现的时间。可选的,所述判断所述状态参数数据值是否在正常工作范围内之后,若否,则进行数据记录和计数处理包括:当所述状态参数数据值不在正常范围内,则判断所述状态参数数据值与相应的正常工作范围的偏离度是否超过偏离阈值;若是,则同时记录硬件的属性信息和所述状态参数数据值放在预设区域内,并作为异常状况进行计数;若否,则只对所述状态参数数据值进行数据记录和计数处理。可选的,在所述当发生异常状况总次数值超过次数阈值,则根据记录的数据、发生异常状况次数值及相对应的正常工作范围生成故障预测报告之后,还包括:根据所述故障预测报告进行故障严重级别的提示,所述故障严重级别包括严重、一般和轻微。可选的,当所述故障严重级别为严重时,进行报警。可选的,所述故障学习模型还包括:在预设时间段内对所述故障学习模型学习得到的各应用服务在运行过程中的各状态参数的正常工作范围进行有效性验证,以确保各应用服务在相应正常工作范围内的运行状态和工作时长满足预设条件。本专利技术实施例另一方面提供了一种应用服务故障的自动预测装置,包括:故障学习模块,用于对采集服务器上各应用服务在正常工作状态下的运行数据值进行学习,得到各应用服务在运行过程中的各状态参数的正常工作范围,以生成故障学习模型;应用服务状态信息获取模块,用于获取待预测应用服务工作过程中的硬件的状态参数数据值;故障分析模块,用于利用预先建立的故障学习模型,判断所述状态参数数据值是否在正常工作范围内;若否,则作为异常状况,进行数据记录和计数处理;故障预测模块,用于当发生异常状况总次数值超过次数阈值,则根据记录的数据、发生异常状况次数值及相对应的正常工作范围生成故障预测报告;所述故障预测报告包括出现异常状况的硬件信息及异常状况出现次数和预测故障出现的时间。可选的,所述故障分析模块包括:判断偏差程度子模块,用于当所述状态参数数据值不在正常范围内,则判断所述状态参数数据值与相应的正常工作范围的偏离度是否超过偏离阈值;判断结果执行模块,用于所述状态参数数据值与相应的正常工作范围的偏离度超过偏离阈值,则同时记录硬件的属性信息和所述状态参数数据值放在预设区域内,并作为异常状况进行计数;若所述状态参数数据值与相应的正常工作范围的偏离度不超过偏离阈值,则只对所述状态参数数据值进行数据记录和计数处理。可选的,所述故障学习模块还包括:验证子模块,用于在预设时间段内对所述故障学习模型学习得到的各应用服务在运行过程中的各状态参数的正常工作范围进行有效性验证,以确保各应用服务在相应正常工作范围内的运行状态和工作时长满足预设条件。本专利技术实施例还提供了一种应用服务故障的自动预测设备,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如前任一项所述应用服务故障的自动预测方法的步骤。本专利技术实施例最后还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有应用服务故障的自动预测程序,所述应用服务故障的自动预测程序被处理器执行时实现如前任一项所述应用服务故障的自动预测方法的步骤。本专利技术实施例提供了一种应用服务故障的自动预测方法,利用预先建立的故障学习模型,分析采集的待预测应用服务工作过程中的硬件的状态参数数据值是否在正常工作范围内,若不在,则作为异常状况进行数据记录和计数处理;当发生异常状况总次数值超过次数阈值,则根据记录的数据、发生异常状况次数值及相对应的正常工作范围生成预测故障发生时间的故障预测报告。故障学习模型为对采集服务器上各应用服务在正常工作状态下的运行数据值进行学习,得到各应用服务在运行过程中的各状态参数的正常工作范围。本申请提供的技术方案的优点在于,根据服务器上运行的应用服务运行状态信息自动学习的过程,分析得到未来某个服务可能会出现故障和出现故障的预测时间,从而可有效规避由于服务问题而造成的数据损失或者为了防止服务出现故障用增加硬件的成本来做自动互备。在不增加硬件成本的基础上,实现了对应用服务系统故障的准确预测,保证了用户数据不易丢失,提升用户的使用体验,有利于提升整个业务系统的可靠性和高可用性,提升了应用软件的可靠性。此外,本专利技术实施例还针对应用服务故障的自动预测方法提供了相应的实现装置、设备及计算机可读存储介质,进一步使得所述方法更具有实用性,所述装置、设备及计算机可读存储介质具有相应的优点。附图说明为了更清楚的说明本专利技术实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种应用服务故障的自动预测方法的流程示意图;图2为本文档来自技高网...

【技术保护点】
1.一种应用服务故障的自动预测方法,其特征在于,包括:获取待预测应用服务工作过程中的硬件的状态参数数据值;利用预先建立的故障学习模型,判断所述状态参数数据值是否在正常工作范围内;若否,则作为异常状况,进行数据记录和计数处理;当发生异常状况总次数值超过次数阈值,则根据记录的数据、发生异常状况次数值及相对应的正常工作范围生成故障预测报告;其中,所述故障学习模型为对采集服务器上各应用服务在正常工作状态下的运行数据值进行学习,得到各应用服务在运行过程中的各状态参数的正常工作范围;所述故障预测报告包括出现异常状况的硬件信息及异常状况出现次数和预测故障出现的时间。

【技术特征摘要】
1.一种应用服务故障的自动预测方法,其特征在于,包括:获取待预测应用服务工作过程中的硬件的状态参数数据值;利用预先建立的故障学习模型,判断所述状态参数数据值是否在正常工作范围内;若否,则作为异常状况,进行数据记录和计数处理;当发生异常状况总次数值超过次数阈值,则根据记录的数据、发生异常状况次数值及相对应的正常工作范围生成故障预测报告;其中,所述故障学习模型为对采集服务器上各应用服务在正常工作状态下的运行数据值进行学习,得到各应用服务在运行过程中的各状态参数的正常工作范围;所述故障预测报告包括出现异常状况的硬件信息及异常状况出现次数和预测故障出现的时间。2.根据权利要求1所述的应用服务故障的自动预测方法,其特征在于,所述判断所述状态参数数据值是否在正常工作范围内之后,若否,则进行数据记录和计数处理包括:当所述状态参数数据值不在正常范围内,则判断所述状态参数数据值与相应的正常工作范围的偏离度是否超过偏离阈值;若是,则同时记录硬件的属性信息和所述状态参数数据值放在预设区域内,并作为异常状况进行计数;若否,则只对所述状态参数数据值进行数据记录和计数处理。3.根据权利要求2所述的应用服务故障的自动预测方法,其特征在于,在所述当发生异常状况总次数值超过次数阈值,则根据记录的数据、发生异常状况次数值及相对应的正常工作范围生成故障预测报告之后,还包括:根据所述故障预测报告进行故障严重级别的提示,所述故障严重级别包括严重、一般和轻微。4.根据权利要求3所述的应用服务故障的自动预测方法,其特征在于,当所述故障严重级别为严重时,进行报警。5.根据权利要求1至4任意一项所述的应用服务故障的自动预测方法,其特征在于,所述故障学习模型还包括:在预设时间段内对所述故障学习模型学习得到的各应用服务在运行过程中的各状态参数的正常工作范围进行有效性验证,以确保各应用服务在相应正常工作范围内的运行状态和工作时长满足预设条件。6.一种应用服务故障的自动预测装置,其特征在于,包括:故障学习模块,用于对采集服务器上...

【专利技术属性】
技术研发人员:段国栋
申请(专利权)人:广东浪潮大数据研究有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1