一种基于问题图迭代检索的知识图谱问答方法技术

技术编号:29934309 阅读:38 留言:0更新日期:2021-09-04 19:08
本发明专利技术公开了一种基于问题图迭代检索的知识图谱问答方法,其特点在于采用图迭代检索来生成问题图的方法,实现知识图谱的问答,具体包括:输入问题中包含的实体来定位知识图谱中的对应节点并构建初始问题图,通过检索模块来选择和问题图中节点以及问题具有较高关联度的相邻节点并将其加入问题图中;在迭代多次得到一个最终的问题图后,通过节点分类方法从问题图中找出可能的答案节点等步骤。本发明专利技术与现有技术相比具有缩小问答检索的范围,答案检索的反应速度快,问答准确率高,进一步提高知识图谱问答的响应时间,从而避免了因图谱检索造成的大量开销,有效提升了问答方法的效果,使用的体验度好。使用的体验度好。使用的体验度好。

【技术实现步骤摘要】
一种基于问题图迭代检索的知识图谱问答方法


[0001]本专利技术涉及知识图谱问答
,尤其是一种基于问题图迭代检索的知识图谱问答方法。

技术介绍

[0002]知识图谱问答是当前计算机自然语言的研究热点之一,在学术界与工业界都具有非常广泛的应用,知识图谱问答的研究和应用将对社会生活产生巨大的影响。如何在一个大规模知识图谱上实现智能问答,是当前急需解决的一个问题,阻碍了知识图谱问答技术在实际生活中的落地应用。采用深度学习技术来实现具有高度智能化的知识图谱问答,是目前的主流。
[0003]现有技术的知识图谱问答方法通常通过对于知识图谱的关键字检索来实现,然而由于知识图谱的图谱数据一般非常巨大,同时会存在许多的无用信息,这会导致在图谱问答的过程中会出现许多噪音相关的问题。同时由于知识图谱中存储的数据量过大,使用传统的检索方法会产生巨大的性能开销,导致答案检索的反应速度大大降低。随着知识图谱的规模越来越大,由此导致的答案检索困难以及大量存在的噪音问题会对问答的效果产生较大的负面影响,影响在实际中的使用体验。如何解决图谱中存在的噪音问题,提升问答方法的效果以及如何缩小问答检索的范围,提高知识图谱问答的响应时间,是目前大规模知识图谱问答实现中的两大难点。

技术实现思路

[0004]本专利技术的目的是针对现有技术的不足而设计的一种基于问题图迭代检索的知识图谱问答方法,采用图迭代检索来生成问题图的方法,实现知识图谱的问答,较好的消除了图谱中大量噪音,将答案查找范围限制在最终生成的问题图中,缩小问答检索的范围,答案检索的反应速度快,从而避免了因图谱检索造成的大量开销,有效提升了问答方法的效果,进一步提高知识图谱问答的响应时间,使用的体验度好。
[0005]实现本专利技术目的的具体技术方案是:一种基于问题图迭代检索的知识图谱问答方法,其特点是采用图迭代检索来生成问题图的方法,实现知识图谱的问答,该方法包括以下具体步骤:步骤1:从输入问题中识别出现的实体,这个实体可以是一个单独的词或者一个连续的文本片段。
[0006]步骤2:通过对知识图谱中节点名的模糊查询,找到实体在图谱中对应的节点,将查找到的节点作为问题图的初始节点。
[0007]步骤3:检索问题图中节点的相邻节点,通过预训练模型来计算这些相邻节点与问题的关联程度,将关联度达到阈值的节点加入问题图中,该步骤需迭代多次。
[0008]步骤4:对最终形成的问题图中的节点进行答案预测。
[0009]所述步骤1使用开源NER工具LAC完成从输入问题中识别出现的实体。
[0010]所述步骤3中的计算相邻节点与问题关联程度的算法,采用预训练语言模型Bert来实现,通过拼接问题文本与相邻节点文本信息如节点名称并输入Bert语言模型中,计算出相邻节点与问题的关联程度。
[0011]本专利技术与现有技术相比具有缩小问答检索的范围,答案检索的反应速度快,问答准确率高,进一步提高知识图谱问答的响应时间,从而避免了因图谱检索造成的大量开销,有效提升了问答方法的效果,使用的体验度好。
附图说明
[0012]图1为本专利技术流程图;图 2为实施例1操作流程图。
具体实施方式
[0013]参阅附图1,本专利技术采用图迭代检索来生成问题图的方法,实现知识图谱的问答,该方法具体包括下述步骤:步骤1:输入问题并从问题中识别出现的实体;步骤2:通过对知识图谱中节点名的模糊查询,找到实体在图谱中对应的节点,并将其作为问题图的初始节点;步骤3:检索问题图中节点的相邻节点,通过预训练模型来计算这些相邻节点与问题的关联程度,并将关联度达到阈值的节点加入问题图中;步骤4:对步骤3进行n次迭代处理,并对最终形成的问题图中的节点进行答案预测,返回置信度最高的预测节点,其中n≥3。
[0014]所述步骤1从输入问题中识别出现的实体,使用开源NER工具LAC完成。
[0015]所述步骤2通过对知识图谱中节点名的模糊查询,找到实体再图谱中对应的节点,采用正则表达式来实现该模糊查询过程。
[0016]所述步骤3采用预训练语言模型Bert实现,通过拼接问题文本与相邻节点名称文本名称并输入Bert语言模型中,计算出相邻节点与问题的关联程度。
[0017]所述步骤4对问题图中的节点进行答案预测,通过拼接问题文本语义特征以及当前问题图节点名称文本语义特征,并输入三层神经网络,计算当前问题图节点是答案的置信度,所述问题文本语义特征以及节点名称语义特征采用预训练模型Bert获得。
[0018]本专利技术通过采用一种图迭代检索技术来生成问题图,最大程度的减少答案检索过程中可能产生的噪音问题并将检索范围限制在知识图谱的子图范围内,大幅度减少需要检索的数据量,相对于其他方法具有更高的问答效率和更高的问答准确率。
[0019]结合以下具体实施例和附图,对本专利技术作进一步的详细说明。
[0020]实施例1参阅附图2,下面以MSR系列路由器中SA接口的“未连接”状态是什么意思的提问进行知识图谱的问答:1)构建初始的问题图1

1:输入问题实体识别与知识谱图节点对齐;1

2:使用NER工具LAC来实现对于问题中存在实体的识别与抽取,筛选出其中识别
置信度高于0.5的实体;1

3:采用模糊匹配的方法从知识图谱中查找与识别的问题实体相关的图谱节点,用于构建初始的问题图。
[0021]2)迭代检索2

1:第一次迭代检索后问题图在获得初始问题图后,计算问题图中所有节点的相邻节点与问题的关联度,该关联度通过拼接问题文本与当前节点名称以及相邻节点名称三个部分形成新的文本并输入到Bert预训练模型中计算得到,将关联置信度大于0.5的相邻节点加入问题图中构成新的问题图。
[0022]2‑
2:第二次迭代检索重复2

1步骤的迭代检索,将关联置信度大于0.5的相邻节点加入问题图中更新的问题图。
[0023]2‑
3:第三次迭代检索重复2

1步骤的迭代检索,将关联置信度大于0.5的相邻节点加入问题图中更新的问题图。
[0024]上述检索过程将迭代进行多次,最终形成的问题图中的节点将用于答案节点预测。
[0025]3)答案节点预测对最终形成的问题图中的所有节点进行答案节点预测,该预测过程首先拼接节点名称信息以及问题文本,并输入到预训练模型Bert中得到一个节点与问题之间的关联度,接下来拼接该关联度置信度与节点文本语义特征以及问题文本语义特征形成一个特征数组并输入到三层神经网络中去通过网络计算,得到最终的答案预测置信度。
[0026]本专利技术只需要在知识图谱的基础上,通过使用问答训练集来训练图迭代检索模块以及节点分类模块,就可以实现基于知识图谱的问答。
[0027]以上实施例只是对本专利技术的技术方案和有益效果进行了详细说明,并非用以限制本专利技术专利,凡在本专利技术的原则范围内所做的任何修改、补充和等同的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于问题图迭代检索的知识图谱问答方法,其特征在于采用图迭代检索来生成问题图的方法,实现知识图谱的问答,该方法具体包括下述步骤:步骤1:输入问题并从问题中识别出现的实体;步骤2:通过对知识图谱中节点名的模糊查询,找到实体在图谱中对应的节点,并将其作为问题图的初始节点;步骤3:检索问题图中节点的相邻节点,通过预训练模型来计算这些相邻节点与问题的关联程度,并将关联度达到阈值的节点加入问题图中;步骤4:对步骤3进行n次迭代处理,并对最终形成的问题图中的节点进行答案预测,返回置信度最高的预测节点,其中n≥3。2.根据权利要求1所述基于问题图迭代检索的知识图谱问答方法,其特征在于所述步骤1从输入问题中识别出现的实体,使用开源NER工具LAC完成。3.根据权利要求1所...

【专利技术属性】
技术研发人员:张帆陶思雨赵前李倩倩戚瑶瑶
申请(专利权)人:上海电气集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1