知识抽取方法、装置、设备、介质和程序产品制造方法及图纸

技术编号:32365538 阅读:14 留言:0更新日期:2022-02-20 03:39
本公开提供了一种知识抽取方法,涉及金融领域和数据处理技术领域,该知识抽取方法包括:响应于接收到目标搜索语句,根据目标搜索语句从历史搜索语句数据库中确定与目标搜索语句具有关联关系的历史搜索语句;根据目标搜索语句和所述历史搜索语句,从预先配置完成的运维知识库中确定粗排知识集;以及根据对目标搜索语句以及历史搜索语句进行融合而生成的搜索词向量,从粗排知识集中抽取目标知识文档。本公开还提供了一种知识抽取装置、一种电子设备、一种可读存储介质和一种计算机程序产品。品。品。

【技术实现步骤摘要】
知识抽取方法、装置、设备、介质和程序产品


[0001]本公开涉及金融领域和数据处理
,更具体地,涉及一种知识抽取方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]随着社会经济的发展,数据中心等算力基础设施建设成为重中之重。运维作为数据中心的重要环节,是保证数据中心平稳运行的重要支撑。运维属于技术信息密集型的领域,有知识范围广、领域多、问题杂、入门难、深入难和传承难的特点。目前,如何解决运维领域的知识积累、搜索和传播等问题存在很大困难。
[0003]在日常运维过程中,产生了大量有价值的系统文档、预案、问题解决方案、制度法规和操作手册等,而大部分文档分散在各类专家手中或是存储在类似confluence的工具中。
[0004]在实现本公开构思的过程中,专利技术人发现通过与专家沟通获得知识的方法存在效率不高的问题;而通过confluence类工具抽取知识的方法存在准确率不高的问题。

技术实现思路

[0005]有鉴于此,本公开提供了一种知识抽取方法、一种知识抽取装置、一种电子设备、一种可读存储介质和一种计算机程序产品。
[0006]根据本公开的第一个方面,提供了一种知识抽取方法,包括:
[0007]响应于接收到目标搜索语句,根据上述目标搜索语句从历史搜索语句数据库中确定与上述目标搜索语句具有关联关系的历史搜索语句;
[0008]根据上述目标搜索语句和所述历史搜索语句,从预先配置完成的运维知识库中确定粗排知识集;以及
[0009]根据对上述目标搜索语句以及上述历史搜索语句进行融合而生成的搜索词向量,从上述粗排知识集中抽取目标知识文档。
[0010]根据本公开的实施例,其中,上述根据上述目标搜索语句从历史搜索语句数据库中确定与上述目标搜索语句具有关联关系的历史搜索语句包括:
[0011]根据上述目标搜索语句,从上述历史搜索语句数据库中确定候选历史搜索语句;
[0012]将上述目标搜索语句和上述候选搜索语句输入预先训练完成的神经网络模型,输出相似度结果;
[0013]在上述相似度结果满足预设条件的情况下,将上述候选搜索语句确定为上述历史搜索语句。
[0014]根据本公开的实施例,其中,上述根据上述目标搜索语句,从上述历史搜索语句数据库中确定候选历史搜索语句包括:
[0015]获取上述目标搜索语句的接收时间;
[0016]根据上述接收时间对上述历史搜索语句数据库中的搜索语句进行排序,生成排序
结果;
[0017]根据上述排序结果确定上述候选历史搜索语句。
[0018]根据本公开的实施例,其中,上述根据上述目标搜索语句和所述历史搜索语句,从预先配置完成的运维知识库中确定粗排知识集包括:
[0019]基于上述目标搜索语句和所述历史搜索语句,分别利用多种召回算法从上述运维知识库中确定与每种召回算法分别对应的初始知识集;
[0020]根据多个上述初始知识集,生成上述粗排知识集。
[0021]根据本公开的实施例,其中,上述初始知识集中的知识文档具有基于召回算法计算得到的分值;
[0022]上述根据多个上述初始知识集,生成上述粗排知识集包括:
[0023]对多个上述初始知识集中知识文档的分值进行归一化处理,生成归一化初始知识集;
[0024]对多个上述归一化初始知识集中的知识文档进行去重处理,生成去重初始知识集;
[0025]对多个上述去重初始知识集中的知识文档按照上述分值进行排序,生成上述粗排知识集。
[0026]根据本公开的实施例,其中,上述根据对所述目标搜索语句以及上述历史搜索语句进行融合成而生成的融合向量,从上述粗排知识集中抽取目标知识文档包括:
[0027]分别对上述目标搜索语句和上述历史搜索语句进行词嵌入处理,生成与目标搜索语句相对应的第一搜索词向量和与上述历史搜索语句相对应的第二搜索词向量;
[0028]对上述第一搜索词向量和上述第二搜索词向量进行融合,生成上述搜索词向量;
[0029]根据上述搜索词向量从上述粗排知识集中抽取目标知识文档。
[0030]根据本公开的实施例,知识抽取方法还包括:
[0031]获取原始运维知识文档;
[0032]对上述原始运维知识文档中的运维知识语句进行切词处理,生成多个原始运维知识词;
[0033]根据上述多个原始运维知识词生成运维知识图谱,其中,上述运维知识图谱包括节点和边,上述节点表示上述原始运维知识词,上述节点具有词权重,上述边表示由上述边连接的节点在上述运维知识语句中的前后关系。
[0034]根据本公开的实施例,知识抽取方法还包括:
[0035]对上述原始运维知识文档中的运维知识语句计算节点权重。
[0036]根据本公开的实施例,其中,上述根据上述目标搜索语句以及上述历史搜索语句,从上述粗排知识集中抽取目标知识文档包括:
[0037]从上述运维知识图谱中确定与上述粗排知识集中的知识文档对应的词权重;
[0038]根据上述粗排知识集中的知识文档和上述词权重生成粗排知识向量集;
[0039]对上述搜索词向量与上述精排知识集中的知识文档向量和所述词权重进行相似度计算,生成精排知识集;
[0040]从上述精排知识中确定上述目标知识文档。
[0041]根据本公开的第二个方面,提供了一种知识抽取装置,包括:
[0042]第一确定模块,用于响应于接收到目标搜索语句,根据上述目标搜索语句从历史搜索语句数据库中确定与上述目标搜索语句具有关联关系的历史搜索语句;
[0043]第二确定模块,用于根据上述目标搜索语句和所述历史搜索语句,从预先配置完成的运维知识库中确定粗排知识集;以及
[0044]抽取模块,用于根据对上述目标搜索语句以及上述历史搜索语句进行融合成而生成的搜索词向量,从上述粗排知识集中抽取目标知识文档。
[0045]根据本公开的第三个方面,提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个指令,其中,当上述一个或多个指令被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如上所述的方法。
[0046]根据本公开的第四个方面,提供了一种计算机可读存储介质,其上存储有可执行指令,上述可执行指令被处理器执行时使处理器实现如上所述的方法。
[0047]根据本公开的第五个方面,提供了一种计算机程序产品,上述计算机程序产品包括计算机可执行指令,上述计算机可执行指令在被执行时用于实现如上所述的方法。
[0048]根据本公开的实施例,因为采用了根据目标搜索语句确定与目标搜索语句相关的历史搜索语句,然后根据目标搜索语句和历史搜索语句,对运维知识库中的知识进行粗筛选,再根据对目标搜索语句和历史搜索语句进行融合而生成的搜索词向量,从粗排知识集中抽取目标知识文档的技术方案,针对相似问题进行融合搜索,突出搜索重点,实现了提高本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识抽取方法,包括:响应于接收到目标搜索语句,根据所述目标搜索语句从历史搜索语句数据库中确定与所述目标搜索语句具有关联关系的历史搜索语句;根据所述目标搜索语句和所述历史搜索语句,从预先配置完成的运维知识库中确定粗排知识集;以及根据对所述目标搜索语句以及所述历史搜索语句进行融合而生成的搜索词向量,从所述粗排知识集中抽取目标知识文档。2.根据权利要求1所述的方法,其中,所述根据所述目标搜索语句从历史搜索语句数据库中确定与所述目标搜索语句具有关联关系的历史搜索语句包括:根据所述目标搜索语句,从所述历史搜索语句数据库中确定候选历史搜索语句;将所述目标搜索语句和所述候选历史搜索语句输入预先训练完成的神经网络模型,输出相似度结果;在所述相似度结果满足预设条件的情况下,将所述候选历史搜索语句确定为所述历史搜索语句。3.根据权利要求2所述的方法,其中,所述根据所述目标搜索语句,从所述历史搜索语句数据库中确定候选历史搜索语句包括:获取所述目标搜索语句的接收时间;根据所述接收时间对所述历史搜索语句数据库中的搜索语句进行排序,生成排序结果;根据所述排序结果确定所述候选历史搜索语句。4.根据权利要求1所述的方法,其中,所述根据所述目标搜索语句和所述历史搜索语句,从预先配置完成的运维知识库中确定粗排知识集包括:基于所述目标搜索语句和所述历史搜索语句,分别利用多种召回算法从所述运维知识库中确定与每种召回算法分别对应的初始知识集;根据多个所述初始知识集,生成所述粗排知识集。5.根据权利要求4所述的方法,其中,所述初始知识集中的知识文档具有基于召回算法计算得到的分值;所述根据多个所述初始知识集,生成所述粗排知识集包括:对多个所述初始知识集中知识文档的分值进行归一化处理,生成归一化初始知识集;对多个所述归一化初始知识集中的知识文档进行去重处理,生成去重初始知识集;对多个所述去重初始知识集中的知识文档按照所述分值进行排序,生成所述粗排知识集。6.根据权利要求1所述的方法,其中,所述根据对所述目标搜索语句以及所述历史搜索语句进行融合成而生成的融合向量,从所述粗排知识集中抽取目标知识文档包括:分别对所述目标搜索语句和所述历史搜索语句进行词嵌入处理,生成与目标...

【专利技术属性】
技术研发人员:崔林
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1