用于预测计算机应用中的异常和故障的方法和装置制造方法及图纸

技术编号:11787663 阅读:95 留言:0更新日期:2015-07-29 11:41
本发明专利技术提供了用于预测计算机应用中的异常和故障的方法和装置。具体地,提供了一种用于预测计算机应用中的异常的方法,包括:在计算机应用运行期间,检测与计算机应用相关联的业务度量和故障单据,故障单据指示计算机应用可能出现了故障;基于与业务度量相关联的二阶差分的绝对值计算阈值,其中阈值使得当与业务度量相关联的二阶差分的绝对值超过阈值时,计算机应用被召回的召回率Rrecall最大化;基于业务度量获取计算机应用在下一时间段的预测度量;以及响应于与预测度量相关联的二阶差分的绝对值超过阈值,预测计算机应用在下一时间段的潜在异常。进一步,提供了基于上述预测异常的方法,预测可能出现的故障的方法。本发明专利技术还提供了相应的装置。

【技术实现步骤摘要】

本专利技术的各实施方式涉及对计算机应用的管理和维护,更具体地,涉及用于预测 计算机应用中的异常(anomaly)和故障(incident)的方法和装置。
技术介绍
随着计算机硬件和软件技术的发展,各种计算机应用已经能够为人们的生产和生 活提供诸多方面的支持。然而,计算机应用的功能的日益复杂化及其种类和数量的不断提 高,导致在管理和维护计算机应用时可能会出现诸多问题。例如,在一个或者多个物理设备 上可能会同时运行彼此独立的、或者存在依赖关系(例如,调用关系)的多个计算机应用, 如何确保这些计算机应用处于健康的运行状态已经成为目前的一个关注焦点。 通常的解决方案是,当计算机应用出现故障后,计算机应用的用户在一定的时间 间隔之后才能发现计算机应用出现问题,继而这些用户可以通过电话、电子邮件或者其他 方式,来向计算机应用的提供者报告这些问题。目前,已经发现与计算机应用相关联的业务度量(traffic metric)中的异常可能 会与计算机应用的故障之间具有某种关联关系。例如,网络连接的不断中断和重新连接可 能会表示例如网络适配器的故障。因而,如何预测在未来可能出现的异常,并进一步发现造 成异常的原因(例如,网络适配器的故障,等),已经成为一个亟待解决的问题。然而,目前 并不存在可以方便、准确地预测计算机应用中的异常和故障的方法。 应当注意,计算机应用的用户通常在发现业务异常之后提交故障单据(incident ticket),然而在异常和故障之间的关联关系并不明确。例如,用户的反馈通常会存在一定 的滞后;又例如,计算机应用的提供者的日常维护操作(例如,更新升级应用包,等)可能会 造成业务的某些异常(然而,此时用户所面临的异常并非由于故障所造成);又例如,人工 操作中的某些失误也可能会造成异常和故障之间的关联关系含混不清。因而,如何预测计 算机应用中的异常和故障成为一个关注焦点。
技术实现思路
因而,期望能够开发一种能够准确、高效地预测计算机应用中的异常的技术方案, 期望该技术方案可用充分考虑计算机应用的以往运行期间出现的业务度量中的异常与故 障单据之间的关系、以及计算机应用在以往运行期间真实出现的故障以及故障单据之间的 关系,来建立异常预测模型并通过选择适当的参数,使得该异常预测模型可以提供尽可能 准确的预测结果。另一方面,还期望能够开发出基于计算机应用中的潜在异常来进一步预 测计算机应用中的潜在故障的技术方案。 在本专利技术的一个实施方式中,提供了一种用于预测计算机应用中的异常的方法, 包括:在计算机应用运行期间,检测与计算机应用相关联的业务度量和故障单据,故障单据 指示计算机应用可能出现了故障;基于与业务度量相关联的二阶差分的绝对值计算阈值, 其中阈值使得当与业务度量相关联的二阶差分的绝对值超过阈值时,计算机应用被召回的 召回率R_all最大化,召回率R_all描述导致计算机应用被召回的故障单据的数量与故障 单据的总数的比例;基于业务度量获取计算机应用在下一时间段的预测度量;以及响应于 与预测度量相关联的二阶差分的绝对值超过阈值,预测计算机应用在下一时间段的潜在异 堂 巾。 在本专利技术的一个实施方式中,阈值使得当与业务度量相关联的二阶差分的绝对值 超过阈值时,计算机应用被召回的准确率R p^isim最大化,准确率RPMC;isim描述导致计算机 应用被召回的异常的数量与计算机应用的全部异常的数量的比例。 在本专利技术的一个实施方式中,提供了一种用于预测计算机应用中的异常的装置, 包括:检测模块,配置用于在计算机应用运行期间,检测与计算机应用相关联的业务度量和 故障单据,故障单据指示计算机应用可能出现了故障;计算模块,配置用于基于与业务度量 相关联的二阶差分的绝对值计算阈值,其中阈值使得当与业务度量相关联的二阶差分的绝 对值超过阈值时,计算机应用被召回的召回率!? MC;all最大化,召回率!?MC;all描述导致计算机 应用被召回的故障单据的数量与故障单据的总数的比例;获取模块,配置用于基于业务度 量获取计算机应用在下一时间段的预测度量;以及预测模块,配置用于响应于与预测度量 相关联的二阶差分的绝对值超过阈值,预测计算机应用在下一时间段的潜在异常。 在本专利技术的一个实施方式中,阈值使得当与业务度量相关联的二阶差分的绝对值 超过阈值时,计算机应用被召回的准确率R p^isim最大化,准确率RPMC;isim描述导致计算机 应用被召回的异常的数量与计算机应用的全部异常的数量的比例。 在本专利技术的一个实施方式中,提供了一种用于预测计算机应用中的故障的方法, 包括:在计算机应用运行期间检测与计算机应用相关联的异常和故障单据;基于异常和故 障单据建立故障预测模型,故障预测模型描述异常和故障单据之间的关联规则;根据上文 的方法,预测计算机应用在下一时间段期间的潜在异常;以及基于故障预测模型和潜在异 常,预测计算机应用在下一时间段的潜在故障。 在本专利技术的一个实施方式中,一种用于预测计算机应用中的故障的装置,包括:检 测模块,配置用于在计算机应用运行期间检测与计算机应用相关联的异常和故障单据;建 立模块,配置用于基于异常和故障单据建立故障预测模型,故障预测模型描述异常和故障 单据之间的关联规则;异常预测模块,包括上文的用于预测计算机应用中的异常的装置,配 置用于预测计算机应用在下一时间段期间的潜在异常;以及故障预测模块,配置用于基于 故障预测模型和潜在异常,预测计算机应用在下一时间段的潜在故障。 采用本专利技术所述的方法和装置,可以在充分考虑在计算机应用以往的运行期间的 历史业务度量以及故障单据的情况下,以更为快速、准确的方式预测计算机应用在未来的 运行期间可能出现的异常和故障。【附图说明】 通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其 他目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号 通常代表相同部件。 图1示出了适于用来实现本专利技术实施方式的示例性计算机系统/服务器12的框 图; 图2A-图2B分别示意性示出了在计算机应用运行期间可能出现的业务度量中的 异常的图示; 图3示意性示出了根据本专利技术一个实施方式的用于预测计算机应用中的异常和 故障的技术方案的架构图; 图4示意性示出了根据本专利技术一个实施方式的用于预测计算机应用中的异常的 方法的流程图; 图5A-图5C示意性示出了根据本专利技术一个实施方式的计算与业务度量相关联的 二阶差分的绝对值的示意图; 图6示意性示出了根据本专利技术一个实施方式的基于与业务度量相关联的二阶差 分的绝对值计算阈值的图示; 图7示意性示出了根据本专利技术一个实施方式的用于预测计算机应用中的故障的 方法的流程图;以及 图8A-图8B分别示意性示出了根据本专利技术一个实施方式的用于预测计算机应用 中的异常的装置的示意图以及根据本专利技术一个实施方式的用于预测计算机应用中的故障 的装置的示意图。【具体实施方式】 下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开 的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方 式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的 范围完整地传达本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/CN104809051.html" title="用于预测计算机应用中的异常和故障的方法和装置原文来自X技术">用于预测计算机应用中的异常和故障的方法和装置</a>

【技术保护点】
一种用于预测计算机应用中的异常的方法,包括:在所述计算机应用运行期间,检测与所述计算机应用相关联的业务度量和故障单据,所述故障单据指示所述计算机应用可能出现了故障;基于与所述业务度量相关联的二阶差分的绝对值计算阈值,其中所述阈值使得当与所述业务度量相关联的二阶差分的绝对值超过所述阈值时,所述计算机应用被召回的召回率Rrecall最大化,所述召回率Rrecall描述导致所述计算机应用被召回的故障单据的数量与所述故障单据的总数的比例;基于所述业务度量获取所述计算机应用在下一时间段的预测度量;以及响应于与所述预测度量相关联的二阶差分的绝对值超过所述阈值,预测所述计算机应用在所述下一时间段的潜在异常。

【技术特征摘要】

【专利技术属性】
技术研发人员:李峰陈玮晔刘蓉李起成梅立军李少春孙伟李峻荣
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1