告警关联规则挖掘方法、系统、计算机设备及存储介质技术方案

技术编号:37370287 阅读:8 留言:0更新日期:2023-04-27 07:15
本发明专利技术提供一种告警关联规则挖掘方法、系统、计算机设备及存储介质,涉及数据分析处理领域,该方法包括:通过融合资源关系图和预存储的告警数据来构建跨域告警关联分析知识图谱;从知识图谱抽取三元组以生成问答对训练样本;基于图神经网络强化的RNNLogic算法进行关联规则学习,并生成最终关联规则;输出最终关联规则中带有推理路径解释的关联规则;获取新的告警数据,筛选与新的告警数据相关的子知识图谱和最终关联规则,生成带权重的规则树来进行根告警推理。本发明专利技术提供的技术方案通过采用知识图谱实现告警关联,通过带推理路径的规则挖掘算法,提高了规则的可解释性,并且通过图神经网络解决了跨域知识表示问题。神经网络解决了跨域知识表示问题。神经网络解决了跨域知识表示问题。

【技术实现步骤摘要】
告警关联规则挖掘方法、系统、计算机设备及存储介质


[0001]本专利技术涉及数据分析处理领域,尤其涉及一种告警关联规则挖掘方法、一种告警关联规则挖掘系统、一种计算机设备以及一种计算机可读存储介质。

技术介绍

[0002]随着云网平台的云化部署,其业务应用层与物理资源层完全解耦,软件化后的业务网元运行在通用的物理资源(包括服务器、存储、交换机等)上,在云网平台运维过程中,物理资源往往由诸多网元共享。这些网元每天会产生大量的告警,导致故障点不明确,跨域故障定位难度大、所需时间长。然而云化部署技术通过必要的软件编程也为网络智能运维带来了新机遇,运营商可以结合人工智能前沿技术实现数据挖掘,来应对云网平台的跨域排障挑战,从而更加灵活精准地从海量告警数据中分辨出重要的根告警(根源告警)。
[0003]以往业界主要是采用基于Apriori或FP

growth的传统数据挖掘算法进行告警关联分析。这类算法旨在发现支持度大于支持度阈值且置信度大于置信度阈值的频繁告警项集,然后以此生成告警关联规则,但是由于各域告警分布不均,此类方法在使用时面临阈值设置困难、事务项集划分不明等问题,因而生成的规则有效性差。目前有研究引入拓扑模型作为过滤条件来优化事务项集划分和规则生成工作,但是关联规则的可解释性还有待进一步加强。

技术实现思路

[0004]为了至少部分解决现有技术中存在的频繁项集的参数敏感性问题、规则可解释性差、无法实现复杂跨域告警关联分析的技术问题而完成了本专利技术。
[0005]根据本专利技术的一方面,提供一种告警关联规则挖掘方法,所述方法包括以下步骤:S1、通过融合资源关系图和预存储的告警数据、生成三元组来构建跨域告警关联分析知识图谱,所述三元组记作(h,r,t),其中h为头实体,t为尾实体并且r为关系;S2、从所述跨域告警关联分析知识图谱随机抽取三元组以生成问答对训练样本,所述问答对训练样本的查询记作q=(h,r,?,并且答案记作a=t;S3、基于图神经网络RGCN强化的RNNLogic算法针对所述知识问答对训练样本进行关联规则学习,并生成最终关联规则;S4、输出所述最终关联规则中带有推理路径解释的解释性关联规则;S5、获取新的告警数据,筛选与所述新的告警数据相关的跨域告警关联分析子知识图谱和最终关联规则,生成带权重的规则树来进行根告警推理。
[0006]可选地,在步骤S1中:所述三元组包括资源关系图三元组、告警数据三元组以及告警标题三元组,所述资源关系图三元组基于所述资源关系图生成,所述资源关系图三元组中的头实体和尾实体分别包括业务、集群、物理机、逻辑主机,并且所述资源关系图三元组中的关系包括部署、包含、拥有、连接;所述告警数据三元组基于所述预存储的告警数据生成,并且包括以下三元组:告警标题

资源名称

资源名称值、告警标题

所属业务

业务系统、告警标题

归属地域

大区中心以及告警标题

所属中心

数据中心;所述告警标题三元
组通过如下方式生成:按照告警发生时间升序排列所述预存储的告警数据,寻找所述预存储的告警数据中的每个告警的与该告警两跳内拓扑相连的另一告警,生成告警的告警标题

关系

另一告警的告警标题三元组;并且所述三元组还包括与所述资源关系图三元组、所述告警数据三元组和所述告警标题三元组各自的关系为逆关系的反向三元组,所述反向三元组记作(h,r
‑1,t),其中r
‑1为逆关系。
[0007]可选地,所述资源关系图通过拓扑信息构建。
[0008]可选地,步骤S3包括以下步骤:S31、对于所述问答对训练样本中的每一个,基于查询q=(h,r,?,使用规则生成器生成用于回答所述查询的关联规则;S32、将所述关联规则输入到因果推理器,得到所述查询的候选答案并计算所述候选答案的候选答案分数,并且更新所述因果推理器,得到更新的因果推理器;S33、基于所述候选答案分数计算每个关联规则的关联规则分数,从所述关联规则中按照所述关联规则分数从大到小的顺序选取K个关联规则,利用所述K个关联规则更新所述规则生成器,得到更新的规则生成器,其中,K为正整数,所述K的取值范围为所述三元组中所述关系的种类数的5倍至15倍;S34、利用所述更新的规则生成器,生成新的关联规则,将所述新的关联规则输入到所述更新的因果推理器,重复执行上述步骤S31和S33,获得所述最终关联规则,所述最终关联规则记作h

r
t。
[0009]可选地,在步骤S31中,利用循环神经网络LSTM生成所述关联规则。
[0010]可选地,在步骤S32中,所述候选答案分数包括规则得分和图谱表示得分,所述图谱表示得分基于所述图神经网络RGCN计算得到。
[0011]可选地,在步骤S4中,通过从所述最终关联规则中筛选出关系为引起、引起
‑1(即,引起的逆关系)、共现和共现
‑1(即,共现的逆关系)的所有关联规则以及对应的关联规则分数来获得所述解释性关联规则。
[0012]可选地,步骤S5包括以下步骤:S51、基于所述新的告警数据,筛选出所述最终关联规则h

r
t中h、t涉及所述新的告警数据中的告警标题的所有子关联规则及其关联规则分数;S52、基于所述跨域告警关联分析知识图谱,以所述新的告警数据的告警标题h、t为初始节点,在所述初始节点与对应的设备名称、业务、大区节点之间插入边,然后根据所述子关联规则涉及的关系名称为所述设备名称、所述业务、所述大区节点扩展相应的邻居节点,得到所述跨域告警关联分析子知识图谱;S53、将所述跨域告警关联分析子知识图谱上按照所述子关联规则能够从h推到t的路径数作为所述子关联规则的命中次数,并基于所述命中次数计算所述子关联规则h

r
t的权重;S54、绘制告警关系,得到规则树,所述规则树中入度为0的告警是根告警,并将所述根告警的加权的出度作为所述根告警的权重。
[0013]根据本专利技术的另一方面,提供一种告警关联规则挖掘系统,所述系统包括:跨域告警关联分析知识图谱构建模块,其通过融合资源关系图和预存储的告警数据、生成三元组来构建跨域告警关联分析知识图谱,所述三元组记作(h,r,t),其中h为头实体,t为尾实体并且r为关系;问答对训练样本生成模块,其从所述跨域告警关联分析知识图谱随机抽取三元组以生成问答对训练样本,所述问答对训练样本的查询记作q=(h,r,?,并且答案记作a=t;关联规则学习模块,其基于图神经网络RGCN强化的RNNLogic算法针对所述知识问答对训练样本进行关联规则学习,并生成最终关联规则;解释性关联规则输出模块,其输出所述最终关联规则中带有推理路径解释的解释性关联规则;以及根源告警定位模块(根告警定位模块),其根据获取的新的告警数据,筛选与所述新的告警数据相关的跨域告警关联本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种告警关联规则挖掘方法,其特征在于,包括以下步骤:S1、通过融合资源关系图和预存储的告警数据、生成三元组来构建跨域告警关联分析知识图谱,所述三元组记作(h,r,t),其中h为头实体,t为尾实体并且r为关系;S2、从所述跨域告警关联分析知识图谱随机抽取三元组以生成问答对训练样本,所述问答对训练样本的查询记作q=(h,r,?),并且答案记作a=t;S3、基于图神经网络RGCN强化的RNNLogic算法针对所述知识问答对训练样本进行关联规则学习,并生成最终关联规则;S4、输出所述最终关联规则中带有推理路径解释的解释性关联规则;S5、获取新的告警数据,筛选与所述新的告警数据相关的跨域告警关联分析子知识图谱和最终关联规则,生成带权重的规则树来进行根告警推理。2.根据权利要求1所述的告警关联规则挖掘方法,其特征在于,在步骤S1中:所述三元组包括资源关系图三元组、告警数据三元组以及告警标题三元组,所述资源关系图三元组基于所述资源关系图生成,所述资源关系图三元组中的头实体和尾实体分别包括业务、集群、物理机、逻辑主机,并且所述资源关系图三元组中的关系包括部署、包含、拥有、连接;所述告警数据三元组基于所述预存储的告警数据生成,并且包括以下三元组:告警标题

资源名称

资源名称值、告警标题

所属业务

业务系统、告警标题

归属地域

大区中心以及告警标题

所属中心

数据中心;所述告警标题三元组通过如下方式生成:按照告警发生时间升序排列所述预存储的告警数据,寻找所述预存储的告警数据中的每个告警的与该告警两跳内拓扑相连的另一告警,生成告警的告警标题

关系

另一告警的告警标题三元组;并且所述三元组还包括与所述资源关系图三元组、所述告警数据三元组和所述告警标题三元组各自的关系为逆关系的反向三元组,所述反向三元组记作(h,r
‑1,t),其中r
‑1为逆关系。3.根据权利要求1或2所述的告警关联规则挖掘方法,其特征在于,所述资源关系图通过拓扑信息构建。4.根据权利要求1或2所述的告警关联规则挖掘方法,其特征在于,步骤S3包括以下步骤:S31、对于所述问答对训练样本中的每一个,基于查询q=(h,r,?),使用规则生成器生成用于回答所述查询的关联规则;S32、将所述关联规则输入到因果推理器,得到所述查询的候选答案并计算所述候选答案的候选答案分数,并且更新所述因果推理器,得到更新的因果推理器;S33、基于所述候选答案分数计算每个关联规则的关联规则分数,从所述关联规则中按照所述关联规则分数从大到小的顺序选取K个关联规则,利用所述K个关联规则更新所述规则生成器,得到更新的规则生成器,所述K的取值范围为所述三元组中所述关系的种类数的5倍至15倍;S34、利用所述更新的规则生成器,生成新的关联规则,将所述新的关联规则输入到所述更新的因果推理器,重复执...

【专利技术属性】
技术研发人员:赵慧英程新洲谢志普黄兵明汪悦王鑫李洁
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1