故障事件管理中的事件相关性制造技术

技术编号:35437212 阅读:13 留言:0更新日期:2022-11-03 11:46
一种用于在故障事件管理中预测事件相关性的成本降低的方法包括:一个或多个处理器接收故障事件集合中的多个候选相关事件组。该方法还包括:对于每个候选相关事件组,一个或多个处理器预测解决相应的相关事件组相较于单独解决相应的相关组中的所有事件的资源成本降低。该方法还包括:一个或多个处理器分析针对多个候选相关事件组的所预测的资源成本降低。该方法还包括:一个或多个处理器基于对所预测的资源成本降低的分析来选择候选相关组。预测的资源成本降低的分析来选择候选相关组。预测的资源成本降低的分析来选择候选相关组。

【技术实现步骤摘要】
【国外来华专利技术】故障事件管理中的事件相关性


[0001]本专利技术一般涉及故障事件管理领域,尤其涉及在故障事件管理中预测事件相关性的成本降低。

技术介绍

[0002]数据中心、系统管理和网络管理包括故障事件管理和根本原因分析,以解决和管理故障事件。当在数据中心中发生故障或非常规事件时,例如以警报的形式向事件管理器发送通知。在事件管理器处,事件可以被消除重复、相关和丰富。可以基于规则引擎来处理事件,或者事件可以提示生成帮助台的门票。为了降低操作成本,已知使共同发生的警报相关,以便允许操作者仅对一个问题进行处理。
[0003]对于事件相关性,事件捕获用于相关性的事件信息。该信息取决于感兴趣的事件域,并且取决于相关性的分析类型。事件信息可以包括事件时间、类型、资源、相关的对象、受影响的应用、注释、指令等。
[0004]事件可以源自许多不同的源,并且可以跨源进行比较。事件相关性可以包括用于移除被认为不相关的事件的事件过滤、用于组合类似事件的事件聚合、以及用于合并相同事件的精确副本的事件消除重复。然后,根本原因分析可以分析事件之间的依赖性,以检测某些事件是否可以被其他事件解释。
[0005]在事件管理中,将多个事件相关在一起以减少操作者诊断和解决问题所需的工作量是有益的。存在能够自动推断事件之间的关系并执行这种类型的相关性的现有系统。
[0006]通常,操作团队将想要在使用推断以执行事件相关之前审阅这些推断以验证准确性。当存在大量推断时,团队将花费很长时间来审阅所有这些推断。
[0007]在许多情况下,大量的推断尽管准确,但在减少解决问题所需的工作量方面可能对操作团队没有太多益处。相反,其中的一些推断可以提供解决问题所需的努力的实质减少。在没有指示每个推断的益处的机制的情况下,团队可能浪费时间来检查价值低的推断。

技术实现思路

[0008]本专利技术的各方面公开了一种用于在故障事件管理中预测事件相关性的成本降低的方法、计算机程序产品和系统。该方法包括一个或多个处理器接收故障事件集合中的多个候选相关事件组。该方法还包括:对于每个候选相关事件组,一个或多个处理器预测解决相应的相关事件组相较于单独解决相应的相关组中的所有事件的资源成本降低。该方法还包括一个或多个处理器分析针对多个候选相关事件组所预测的资源成本降低。该方法还包括一个或多个处理器基于对所预测的资源成本降低的分析来选择候选相关组。
[0009]本专利技术的实施例可以提供量化部署相关性的成本效益的优点。该方法可以获得相关性的成本效益的预测,从而导致对审阅故障事件的多个相关性的优化。
[0010]在进一步的方面,针对事件组的每个候选相关性预测资源成本降低进一步包括:一个或多个处理器预测作为组解决相关事件组的第一资源成本;一个或多个处理器预测单
独解决组中的事件的成本之和的第二资源成本;以及一个或多个处理器计算第一预测资源成本和第二预测资源成本的差以获得所预测的资源成本降低。
[0011]分析预测资源成本降低可以进一步包括:通过所预测的资源成本降低对候选相关事件组进行排序,这在候选相关组是离散的事件组时提供了优点。
[0012]候选相关组可以是具有包括事件子组的重叠事件的组。分析所预测的资源成本降低可以包括:计算事件子组的组合预测成本降低,以及将结果与整个事件组的所预测的成本降低进行比较。
[0013]可以针对事件或事件组将资源成本测量为以下的组中的一个或多个:解决所需的人员时间;要解决的资源停机时间;以及要解决的服务成本损失。
[0014]在附加的方面,预测第一资源成本可以应用第一机器学习模型,该第一机器学习模型被训练为基于定义相关性的特征的输入向量来预测用于解决相关事件组的资源成本,这可以提供使预测基于解决相关的事件的历史成本的优点。输入向量可以采用以下的组中的一个或多个的形式定义相关性的特征:组中的事件的严重性;组中的每个事件的源;组中的事件的数量;受影响的资源的数量;组发生的时间模式;组的持续时间;组中的词的频率;与组中的拓扑的资源相匹配的事件的连接程度。进一步地,该方法可以向第一机器学习模型提供解决相关事件组的资源成本的反馈以用于该模型的继续训练。
[0015]在附加的方面,预测第二资源成本可以应用第二机器学习模型,该第二机器学习模型被训练为基于定义个体事件的特征的输入向量来预测用于解决个体事件的资源成本。输入向量可以采用以下的组中的一个或多个的形式定义个体事件的特征:事件发生的时间;事件的严重性;事件的位置;事件的描述。进一步地,该方法可以向第二机器学习模型提供解决个体事件的资源成本的反馈以用于模型的继续训练。
[0016]故障事件集合中的事件组的多个候选相关性可以由相关性系统提供,并基于事件之间的不同的所发现的推断。
[0017]本专利技术的另一个方面公开了一种用于故障事件管理中预测事件相关性的成本降低的方法、计算机程序产品和系统。该方法包括:提供第一机器学习模型,该第一机器学习模型被训练为基于定义相关事件组的特征的输入向量来预测用于解决相关组的资源成本;以及提供第二机器学习模型,该第二机器学习模型被训练为基于定义个体事件的特征的输入向量来预测用于解决个体事件的资源成本。该方法还包括:对于事件组的所发现的相关性,一个或多个处理器应用第一机器学习模型以预测用于作为相关组解决事件组的资源成本,以及一个或多个处理器应用第二机器学习模型以预测用于作为个体事件解决事件组的资源成本。该方法还包括:一个或多个处理器预测解决事件组的相关性相较于单独解决组中的所有事件的总资源成本的资源成本降低。
[0018]提供被训练为基于定义相关事件组的特征的输入向量来预测用于解决相关组的资源成本的第一机器学习模型可以包括:基于包括相关事件组的资源成本反馈的已解决相关组事件分析,训练第一机器学习模型。提供被训练为基于定义个体事件的特征的输入向量来预测用于解决个体事件的资源成本的第二机器学习模型可以包括:基于包括个体事件的资源成本反馈的已解决事件分析,训练第二机器学习模型。
[0019]本专利技术的另一方面公开了一种用于在故障事件管理中预测事件相关性的成本降低的方法、计算机程序产品和系统。该方法包括:一个或多个处理器训练第一机器学习模型
以基于定义相关事件组的特征的输入向量来预测用于解决相关组的资源成本。该方法还包括:一个或多个处理器训练第二机器学习模型以基于定义个体事件的特征的输入向量来预测用于解决个体事件的资源成本。该方法还包括:一个或多个处理器提供第一机器学习模型以用于预测用于作为输入相关组解决事件组的资源成本。该方法还包括:一个或多个处理器提供第二机器学习模型以用于预测用于作为个体事件解决输入相关组中的事件组的资源成本。该方法还包括:一个或多个处理器预测作为相关组解决相关事件组相较于单独解决组中的所有事件的总资源成本的资源成本降低。
[0020]训练第一机器学习模型以预测用于解决相关事件组的资源成本可以基于包括相关事件组的资源成本反馈的已解决相关组事件分析,并且训练第二机器学习模型以预测用于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法,包括:由一个或多个处理器接收故障事件集合中的多个候选相关事件组;对于每个候选相关事件组,由一个或多个处理器预测解决相应的相关事件组相比较于单独解决相应的相关组中的所有事件的资源成本降低;由一个或多个处理器分析针对所述多个候选相关事件组的所预测的资源成本降低;以及由一个或多个处理器基于对所预测的资源成本降低的分析来选择候选相关组。2.根据权利要求1所述的方法,其中,预测用于解决事件组的每个候选相关性的资源成本降低进一步包括:由一个或多个处理器预测作为组解决所述相关事件组的第一资源成本;由一个或多个处理器将第二资源成本预测为单独解决所述组中的所述事件的成本的总和;以及由一个或多个处理器计算所述第一预测资源成本与所述第二预测资源成本之差,以确定所预测的资源成本降低。3.根据权利要求1所述的方法,其中,分析所预测的资源成本降低进一步包括:由一个或多个处理器通过所预测的资源成本降低来对所述候选相关事件组进行排序。4.根据权利要求1所述的方法,其中,所述候选相关组是离散的事件组或者是具有包括事件子组的重叠事件的组。5.根据权利要求4所述的方法,其中,分析所预测的资源成本降低进一步包括:由一个或多个处理器计算事件子组的组合预测成本降低;以及由一个或多个处理器将所述结果与整个事件组的所预测的成本降低进行比较。6.根据权利要求2所述的方法,其中,针对事件或事件组,所述资源成本被测量为从由以下各项组成的组中选择的一项或多项:解决所需的人员时间,要解决的资源停机时间,以及要解决的服务损失成本。7.根据权利要求2所述的方法,其中,预测第一资源成本进一步包括:由一个或多个处理器应用第一机器学习模型,所述第一机器学习模型被训练为基于定义所述相关性的特征的输入向量预测用于解决相关事件组的资源成本。8.根据权利要求7所述的方法,其中,所述输入向量以从由以下各项组成的组中选择的一项或多项的形式定义所述相关性的特征:所述组中的事件的严重性,所述组中的每个事件的源,所述组中的事件的数量,受影响的资源的数量,所述组发生的时间模式,所述组的持续时间,所述组中的词的频率,以及所述组中的与拓扑的资源相匹配的事件的连接程度。9.根据权利要求7所述的方法,还包括:由一个或多个处理器向所述第一机器学习模型提供解决相关事件组的资源成本的反馈以用于所述模型的继续训练。10.根据权利要求2所述的方法,其中,预测第二资源成本进一步包括:由一个或多个处理器应用第二机器学习模型,所述第二机器学习模型被训练为基于定义个体事件的特征的输入向量预测用于解决所述个体事件的资源成本。11.根据权利要求10所述的方法,其中,所述输入向量以从由以下各项组成的组中选择的一项或多项的形式定义所述个体事件的特征:所述事件发生的时间;所述事件的严重性;
所述事件的位置;所述事件的描述。12.根据权利要求10所述的方法,还包括:由一个或多个处理器向所述第二机器学习模型提供解决个体事件的资源成本的反馈以用于所述模型的继续训练。13.根据权利要求1所述的方法,其中,故障事件集合中的事件组的所述多个候选相关性由相关性系统提供,并且基于事件之间的不同的所发现的推断。14.一种计算机系统,包括:一个或多个计算机处理器;一个或多个计算机可读存储介质;以及在所述计算机可读存储介质上存储的用于由所述一个或多个处理器中的至少一个处理器执行的程序指令,所述程序指令包括:用于接收故障事件集合中的多个候选相关事件组的程序指令;用于针对每个候选相关事件组,预测解决相应的相关事件组相较于单独解决相应的相关组中的所有事件的资源成本降低的程序指令;用于分析针对所述多个候选相关事件组的所预测的资源成本降低的程序指令;以及用于基于对所预测的资源成本降低的分析来选择候选相关组的程序指令。15.根据权利要求14所述的计算机系统,其中,用于预测用于解决事件组的每个候选相关性的资源成本降低的程序指令进一步包括用于以下操作的程序指令:预测...

【专利技术属性】
技术研发人员:P
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1