基于子图匹配和分布式查询的运维故障诊断分析方法技术

技术编号:32672794 阅读:15 留言:0更新日期:2022-03-17 11:27
本发明专利技术公开了基于子图匹配和分布式查询的运维故障诊断分析方法,包括1)基于子图匹配的方法,建立知识图谱的故障处置措施检索模型;2)基于图结构和语义信息的相似度计算,对结果子图进行排序,得到最优的查询结果;3)基于Top

【技术实现步骤摘要】
基于子图匹配和分布式查询的运维故障诊断分析方法


[0001]本专利技术涉及智能检索分析领域,特别涉及基于子图匹配和分布式查询的运维故障诊断分析方法。

技术介绍

[0002]随着人工智能的不断发展,以知识图谱为基础的智能检索分析方法逐渐运用于搜索引擎、教育、医疗、智能电网等领域。通过抽取技术从各个领域的数据中抽取实体、属性、关系等语义信息,并通过知识融合、知识加工等技术构建知识库,然后通过实体间的匹配分析实现用户所需的检索分析服务。同时,知识图谱采用本体术语和语义表达的格式,有规范且标准的概念模型,能很好地解决电网系统积累的大量多源异构的运行数据,包括数字、文字、图像等;而且,知识图谱通过语义链接功能增强数据之间的关联关系,可使数据表达更加规范,结构化更强,能很好地适应智能问答、智能检索、辅助决策等技术的运用场景,同时对电网知识的检索分析也适用。
[0003]本方法面向的国网公司运维数据分散且规模庞大,数据量已达到ZB级规模,已构建的智能运维知识图谱从复杂结构网络中中采集数据,呈现出数据中心分散、数据网络复杂且数据规模大的特征,这些特征使得用户难以快速获取满意的查询结果。针对以上特征,如何实现快速高效的知识图谱查询是当前系统亟待解决的问题。传统的知识图谱查询工作通常简单的将知识图谱查询建模成子图匹配问题,但在实际应用中存在诸多不足。
[0004]首先,传统的知识图谱查询模型大多要求查询结果与用户查询精确匹配,但是由于知识图谱存在噪声数据,这些模型会遗漏用户感兴趣的查询结果,存在可用性差的问题。
[0005]其次,为了加快查询速度,传统的知识图谱查询算法普遍采用图索引技术,但是本项目中的智能运维知识图谱的数据规模大,为其建立图索引需耗费高昂的时间和空间开销。
[0006]最后,由于智能运维知识图谱网络复杂且规模庞大,所以需要采用分布式的方式实现查询过程,然而传统的分布式图数据处理平台未针对知识图谱查询的执行过程进行优化,存在执行效率低下的问题。

技术实现思路

[0007]本专利技术的目的是克服现有技术缺陷,提供基于子图匹配和分布式查询的运维故障诊断分析方法,以期通过在子图匹配、检索算法、分布式处理等方向的优化,解决了现有技术的可用性问题与效率问题。
[0008]本专利技术的目的是这样实现的:一种基于子图匹配和分布式查询的运维故障诊断分析方法,包括以下步骤:
[0009]步骤1)基于子图匹配的方法,建立知识图谱的故障处置措施检索模型:在既存的运维知识图谱中,通过定义检索图

匹配子图

子检索划分

进行子检索

连接子检索结果五个步骤构建基于知识图谱的运维故障处置措施检索模型;
[0010]步骤2)根据知识图谱中査询图和结果图的拓扑结构特征,基于图结构和语义信息的相似度计算,对结果子图进行排序,得到最优的查询结果:对查询图谱与结果子图进行基于图结构的相似度计算,对图谱之间的语义信息通过语义特征描述进行语义相似度计算;
[0011]通过将基于图结构的相似度计算与基于语义信息的相似度计算进行线性叠加得到各个子图最终的综合得分Score,并且通过Score对结果子图进行排序得到最优的查询结果,从而得到最优的k个结果图;
[0012]步骤3)基于Top

k查询模型进行优化,使用分布式查询方法加快查询速度,在分布式图数据处理平台上分别从作业调度和数据存储两个方面优化分布式知识图谱查询的执行效率:基于Top

k查询模型进行优化,利用分布式环境的计算能力加快查询速度,并在分布式图数据处理平台上,分别从作业调度和数据存储两个方面优化分布式知识图谱查询的执行效率;
[0013]步骤4)对运维告警数据进行分级并且筛选相关网元属性:根据大量告警数据中不同级别的问题信息,优先抓取重要和关键告警,并对故障信息进行分级;在出现故障信息,根据告警分级初步判定该故障信息的处理级别,以及受影响的业务,通过网元归属关系查找性能系统网元归属关系和用户容量报表,根据故障网元筛选出归属关系、登记用户数和覆盖范围属性;
[0014]步骤5)基于大规模智能运维知识图谱,将每种故障的处理步骤规则化:基于大规模智能运维知识图谱,依据历年故障数据库中的信息将每种故障的处理步骤规则化;
[0015]步骤6)在基于步骤1)、2)、3)知识图谱平台的智能运维决策分析模块中,直接调用“实体—关系—实体”对象,最终形成一键运维故障诊断分析报表:通过大规模智能运维知识图谱,确定实体—关系—实体对象,输出故障诊断说明;故障诊断知识转化采用自动化手段,在基于知识图谱平台的智能运维决策分析原型模块中,直接调用“实体—关系—实体”对象,最终形成一键故障诊断分析报表。
[0016]作为本专利技术的进一步限定,所述步骤1)具体包括:
[0017]步骤1.1)定义检索图:对于检索图Q=(E
Q
,R
Q
),包含点集合E
Q
和边集合R
Q
,其中,每一个检索点都对应一个具体的实体描述,边表示任意两个点之间的关系;
[0018]步骤1.2)匹配子图:对于给定的知识图谱G=(E
G
,R
G
,E
G
)和检索子图Q=(E
Q
,R
Q
),匹配子图的目的是在图谱G中找到子图Q的匹配子图φ(Q),φ将子图Q中的点E
Q
映射到图谱G中的点φ(E
G
)中,将子图Q中的边R
Q
映射到图谱G中的边φ(R
G
)中,即将图谱G中满足相关映射函数的子图定义为匹配子图φ(Q);
[0019]步骤1.3)子检索划分:将检索图划分为多个顶点数目少,边特征单一的子检索图降低检索难度,将子检索图划分为两层树的结构,使每个自检索图包含一个根节点,一层子节点和边;通过逐层的匹配得到子检索的检索结果进而得到检索图的检索结果;
[0020]步骤1.4)进行子检索:对于步骤1.3)中的子检索图,将子检索图分解成最小生成树,输入数据图与划分后的子检索图,初始化子检索结果集D
i
与匹配点对集合T为空,由根节点生成备选匹配点对集合T,对于集合T,如果T中包含子检索图Q的所有节点,计算图的边是否符合标准,将符合判断标准的结果存入子检索结果集D
i
,在完成所有匹配后最终得到结果集D
i

[0021]步骤1.5)连接子检索结果:对于步骤1.4)得到的子检索结果,将所有子检索得结
果连接到一起,生成匹配子图;当且仅当Q
i
、Q
j
两个子检索有共同顶点时,进行检索结果的连接;子检索结果的连接的基本过程如下:初始化子检索结果集D,对于划分的子检索集Q
i
∈(Q1,Q2,

Q
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于子图匹配和分布式查询的运维故障诊断分析方法,其特征在于,包括以下步骤:步骤1)基于子图匹配的方法,建立知识图谱的故障处置措施检索模型:在既存的运维知识图谱中,通过定义检索图

匹配子图

子检索划分

进行子检索

连接子检索结果五个步骤构建基于知识图谱的运维故障处置措施检索模型;步骤2)根据知识图谱中査询图和结果图的拓扑结构特征,基于图结构和语义信息的相似度计算,对结果子图进行排序,得到最优的查询结果:对查询图谱与结果子图进行基于图结构的相似度计算,对图谱之间的语义信息通过语义特征描述进行语义相似度计算;通过将基于图结构的相似度计算与基于语义信息的相似度计算进行线性叠加得到各个子图最终的综合得分Score,并且通过Score对结果子图进行排序得到最优的查询结果,从而得到最优的k个结果图;步骤3)基于Top

k查询模型进行优化,使用分布式查询方法加快查询速度,在分布式图数据处理平台上分别从作业调度和数据存储两个方面优化分布式知识图谱查询的执行效率:基于Top

k查询模型进行优化,利用分布式环境的计算能力加快查询速度,并在分布式图数据处理平台上,分别从作业调度和数据存储两个方面优化分布式知识图谱查询的执行效率;步骤4)对运维告警数据进行分级并且筛选相关网元属性:根据大量告警数据中不同级别的问题信息,优先抓取重要和关键告警,并对故障信息进行分级;在出现故障信息,根据告警分级初步判定该故障信息的处理级别,以及受影响的业务,通过网元归属关系查找性能系统网元归属关系和用户容量报表,根据故障网元筛选出归属关系、登记用户数和覆盖范围属性;步骤5)基于大规模智能运维知识图谱,将每种故障的处理步骤规则化:基于大规模智能运维知识图谱,依据历年故障数据库中的信息将每种故障的处理步骤规则化;步骤6)在基于步骤1)、2)、3)知识图谱平台的智能运维决策分析模块中,直接调用“实体

关系

实体”对象,最终形成一键运维故障诊断分析报表:通过大规模智能运维知识图谱,确定实体

关系

实体对象,输出故障诊断说明;故障诊断知识转化采用自动化手段,在基于知识图谱平台的智能运维决策分析原型模块中,直接调用“实体

关系

实体”对象,最终形成一键故障诊断分析报表。2.根据权利要求1所述的基于子图匹配和分布式查询的运维故障诊断分析方法,其特征在于,所述步骤1)具体包括:步骤1.1)定义检索图:对于检索图Q=(E
Q
,R
Q
),包含点集合E
Q
和边集合R
Q
,其中,每一个检索点都对应一个具体的实体描述,边表示任意两个点之间的关系;步骤1.2)匹配子图:对于给定的知识图谱G=(E
G
,R
G
,E
G
)和检索子图Q=(E
Q
,R
Q
),匹配子图的目的是在图谱G中找到子图Q的匹配子图φ(Q),φ将子图Q中的点E
Q
映射到图谱G中的点φ(E
G
)中,将子图Q中的边R
Q
映射到图谱G中的边φ(R
G
)中,即将图谱G中满足相关映射函数的子图定义为匹配子图φ(Q);步骤1.3)子检索划分:将检索图划分为多个顶点数目少,边特征单一的子检索图降低检索难度,将子检索图划分为两层树的结构,使每个自检索图包含一个根节点,一层子节点和边;通过逐层的匹配得到子检索的检索结果进而得到检索图的检索结果;
步骤1.4)进行子检索:对于步骤1.3)中的子检索图,将子检索图分解成最小生成树,输入数据图与划分后的子检索图,初始化子检索结果集D
i
与匹配点对集合T为空,由根节点生成备选匹配点对集合T,对于集合T,如果T中包含子检索图Q的所有节点,计算图的边是否符合标准,将符合判断标准的结果存入子检索结果集D
i
,在完成所有匹配后最终得到结果集D
i
;步骤1.5)连接子检索结果:对于步骤1.4)得到的子检索结果,将所有子检索得结果连接到一起,生成匹配子图;当且仅当Q
...

【专利技术属性】
技术研发人员:顾昊旻陆宏波袁以友高德荃来风刚赵子岩徐浩曲延盛王云霄
申请(专利权)人:国家电网有限公司信息通信分公司国网山东省电力公司信息通信公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1