故障事件管理中的事件相关性制造技术

技术编号：35437212 阅读：13 留言：0更新日期：2022-11-03 11:46

一种用于在故障事件管理中预测事件相关性的成本降低的方法包括：一个或多个处理器接收故障事件集合中的多个候选相关事件组。该方法还包括：对于每个候选相关事件组，一个或多个处理器预测解决相应的相关事件组相较于单独解决相应的相关组中的所有事件的资源成本降低。该方法还包括：一个或多个处理器分析针对多个候选相关事件组的所预测的资源成本降低。该方法还包括：一个或多个处理器基于对所预测的资源成本降低的分析来选择候选相关组。预测的资源成本降低的分析来选择候选相关组。预测的资源成本降低的分析来选择候选相关组。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】故障事件管理中的事件相关性

[0001]本专利技术一般涉及故障事件管理领域，尤其涉及在故障事件管理中预测事件相关性的成本降低。

技术介绍

[0002]数据中心、系统管理和网络管理包括故障事件管理和根本原因分析，以解决和管理故障事件。当在数据中心中发生故障或非常规事件时，例如以警报的形式向事件管理器发送通知。在事件管理器处，事件可以被消除重复、相关和丰富。可以基于规则引擎来处理事件，或者事件可以提示生成帮助台的门票。为了降低操作成本，已知使共同发生的警报相关，以便允许操作者仅对一个问题进行处理。
[0003]对于事件相关性，事件捕获用于相关性的事件信息。该信息取决于感兴趣的事件域，并且取决于相关性的分析类型。事件信息可以包括事件时间、类型、资源、相关的对象、受影响的应用、注释、指令等。
[0004]事件可以源自许多不同的源，并且可以跨源进行比较。事件相关性可以包括用于移除被认为不相关的事件的事件过滤、用于组合类似事件的事件聚合、以及用于合并相同事件的精确副本的事件消除重复。然后，根本原因分析可以分析事件之间的依赖性，以检测某些事件是否可以被其他事件解释。
[0005]在事件管理中，将多个事件相关在一起以减少操作者诊断和解决问题所需的工作量是有益的。存在能够自动推断事件之间的关系并执行这种类型的相关性的现有系统。
[0006]通常，操作团队将想要在使用推断以执行事件相关之前审阅这些推断以验证准确性。当存在大量推断时，团队将花费很长时间来审阅所有这些推断。
[0007]在许多情况下，...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法，包括：由一个或多个处理器接收故障事件集合中的多个候选相关事件组；对于每个候选相关事件组，由一个或多个处理器预测解决相应的相关事件组相比较于单独解决相应的相关组中的所有事件的资源成本降低；由一个或多个处理器分析针对所述多个候选相关事件组的所预测的资源成本降低；以及由一个或多个处理器基于对所预测的资源成本降低的分析来选择候选相关组。2.根据权利要求1所述的方法，其中，预测用于解决事件组的每个候选相关性的资源成本降低进一步包括：由一个或多个处理器预测作为组解决所述相关事件组的第一资源成本；由一个或多个处理器将第二资源成本预测为单独解决所述组中的所述事件的成本的总和；以及由一个或多个处理器计算所述第一预测资源成本与所述第二预测资源成本之差，以确定所预测的资源成本降低。3.根据权利要求1所述的方法，其中，分析所预测的资源成本降低进一步包括：由一个或多个处理器通过所预测的资源成本降低来对所述候选相关事件组进行排序。4.根据权利要求1所述的方法，其中，所述候选相关组是离散的事件组或者是具有包括事件子组的重叠事件的组。5.根据权利要求4所述的方法，其中，分析所预测的资源成本降低进一步包括：由一个或多个处理器计算事件子组的组合预测成本降低；以及由一个或多个处理器将所述结果与整个事件组的所预测的成本降低进行比较。6.根据权利要求2所述的方法，其中，针对事件或事件组，所述资源成本被测量为从由以下各项组成的组中选择的一项或多项：解决所需的人员时间，要解决的资源停机时间，以及要解决的服务损失成本。7.根据权利要求2所述的方法，其中，预测第一资源成本进一步包括：由一个或多个处理器应用第一机器学习模型，所述第一机器学习模型被训练为基于定义所述相关性的特征的输入向量预测用于解决相关事件组的资源成本。8.根据权利要求7所述的方法，其中，所述输入向量以从由以下各项组成的组中选择的一项或多项的形式定义所述相关性的特征：所述组中的事件的严重性，所述组中的每个事件的源，所述组中的事件的数量，受影响的资源的数量，所述组发生的时间模式，所述组的持续时间，所述组中的词的频率，以及所述组中的与拓扑的资源相匹配的事件的连接程度。9.根据权利要求7所述的方法，还包括：由一个或多个处理器向所述第一机器学习模型提供解决相关事件组的资源成本的反馈以用于所述模型的继续训练。10.根据权利要求2所述的方法，其中，预测第二资源成本进一步包括：由一个或多个处理器应用第二机器学习模型，所述第二机器学习模型被训练为基于定义个体事件的特征的输入向量预测用于解决所述个体事件的资源成本。11.根据权利要求10所述的方法，其中，所述输入向量以从由以下各项组成的组中选择的一项或多项的形式定义所述个体事件的特征：所述事件发生的时间；所述事件的严重性；
所述事件的位置；所述事件的描述。12.根据权利要求10所述的方法，还包括：由一个或多个处理器向所述第二机器学习模型提供解决个体事件的资源成本的反馈以用于所述模型的继续训练。13.根据权利要求1所述的方法，其中，故障事件集合中的事件组的所述多个候选相关性由相关性系统提供，并且基于事件之间的不同的所发现的推断。14.一种计算机系统，包括：一个或多个计算机处理器；一个或多个计算机可读存储介质；以及在所述计算机可读存储介质上存储的用于由所述一个或多个处理器中的至少一个处理器执行的程序指令，所述程序指令包括：用于接收故障事件集合中的多个候选相关事件组的程序指令；用于针对每个候选相关事件组，预测解决相应的相关事件组相较于单独解决相应的相关组中的所有事件的资源成本降低的程序指令；用于分析针对所述多个候选相关事件组的所预测的资源成本降低的程序指令；以及用于基于对所预测的资源成本降低的分析来选择候选相关组的程序指令。15.根据权利要求14所述的计算机系统，其中，用于预测用于解决事件组的每个候选相关性的资源成本降低的程序指令进一步包括用于以下操作的程序指令：预测...

【专利技术属性】
技术研发人员：P，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人