一种基于深度学习的知识图谱复杂问答系统及方法技术方案

技术编号：38350682 阅读：11 留言：0更新日期：2023-08-05 17:24

本发明专利技术涉及一种基于深度学习的知识图谱复杂问答系统，包括基于多头注意力机制的信息抽取模型、逐跳关系预测模型和知识图谱；所述基于多头注意力机制的信息抽取模型抽取输入文本的实体和关系；所述逐跳关系预测模型，将多关系KBQA中的关系预测模型拆分为停止决策模型和路径相似度计算模型，采用延伸和聚合操作分别解决链式问题与多实体问题；基于逐跳关系预测模型输出数据，对知识图谱进行查找、推理获取相应的答案。本发明专利技术问答系统具有更高的效率，更强的专业性和准确性。更强的专业性和准确性。更强的专业性和准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的知识图谱复杂问答系统及方法

[0001]本专利技术涉及智能问答领域，具体涉及一种基于深度学习的知识图谱复杂问答系统及方法。

技术介绍

[0002]近年来，作为实现Web 3.0知识互联的基础，大量高质量、覆盖大量知识的知识图谱被构建出来，为知识搜索提供了有力的支撑，也已经成为互联网认知智能服务的基础设施。谷歌公司提出知识图谱的初衷，是对搜索引擎提供语义支持，以此来提高搜索引擎的质量，为用户提供细粒度的知识，满足用户日益增长的信息需求。传统的搜索方式，仍然是基于关键字匹配的方式搜索的相关信息，并没有具备“理解”问题的能力，即没有涉及深层次的语义理解。并且，知识图谱中往往包含了海量的知识条目，且条目之间存在着复杂的拓扑结构关系，对于普通用户而言，如何从一个庞大复杂的知识图谱中搜索自己所需要的知识，是一个很大的挑战。
[0003]为了能够降低用户检索知识图谱的门槛，并且能够精确地、细粒度地返回用户所询的相关信息，知识图谱问答(Knowledge Base Question Answering，KBQA)——一种高级的信息检索方式、桥接人类用户与机器智能进行信息交换的接口——被研究者们提出。问答系统旨在理解用户所提出的问题意图，并将自然语言问题转化为标准的结构化查询，通过在知识图谱上执行结构化查询，而得到知识图谱中的相关实体、属性值等信息，作为问题的答案返回给用户，以此来方便用户检索知识图谱来获取所需要的知识。问答系统将问题理解、知识查询、推理答案等具体实现细节都隐藏在内部，而对外提供简单的使用接口...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的知识图谱复杂问答系统，其特征在于，包括基于多头注意力机制的信息抽取模型、逐跳关系预测模型和知识图谱；所述基于多头注意力机制的信息抽取模型抽取输入文本的实体和关系；所述逐跳关系预测模型，将多关系KBQA中的关系预测模型拆分为停止决策模型和路径相似度计算模型，采用延伸和聚合操作分别解决链式问题与多实体问题；基于逐跳关系预测模型输出数据，对知识图谱进行查找、推理获取相应的答案。2.根据权利要求1所述的一种基于深度学习的知识图谱复杂问答系统，其特征在于，所基于多头注意力机制的信息抽取模型包括RNN共享编码层、SR子模型和O子模型；所述SR子模型抽取出输入文本中主实体S的同时，并给出主实体对应的关系R；所述O子模型则根据RNN共享编码层输出的张量、SR抽取的主实体及对应的关系，输出客实体O。3.根据权利要求2所述的一种基于深度学习的知识图谱复杂问答系统，其特征在于，所述SR子模型包括一层自注意力机制层、带6层残差学习的膨胀卷积层及两层全连接层；所述输入文本通过RNN共享编码层输出的张量，依次通过自注意力机制层、带6层残差学习的膨胀卷积层及两层全连接层，得到每个主实体S及S对应的所有关系R。4.根据权利要求2所述的一种基于深度学习的知识图谱复杂问答系统，其特征在于，所述O子模型包括多头注意力机制、带6层残差学习的膨胀卷积层及两层全连接层。5.根据权利要求1所述的一种基于深度学习的知识图谱复杂问答系统，其特征在于，所述停止决策模型，用于判断当前路径是否应该执行延伸操作，进行下一跳的路径转移，其输入是问题文本序列和当前的路径序列，输出为真或假，具体如下：构建孪生网络的结构，使用共享权重的预训练语言模型BERT来分别对问题Q和候选路径P编码表示，对BERT输出的隐层向量表示取平均，作为问题和候选路径的向量表示H
Q
和H
P
，如下式所示：H
Q
＝Meanpooling(BERT(x
Q
))x
Q
＝[[CLS],q1,
…
,q
n
,[SEP]]H
P
＝Meanpooling(BERT(x
P
))x
P
＝[[CLS],p1,
…
,p
m
,[SEP]]其中，q1,
…
,q
n
为问题序列，p1,
…
,p
m
为候选路径序列，CLS用于下游的分类任务，SEP用于隔开两个句子；对于实体的类型词语集合R，将其经过预训练词向量Embedding层编码后的矩阵分别做最大池化和平均池化操作，得到两个向量表示和如下列公式所示：H
R
＝Embedding(R)R＝[r1,r2…
r
i
]]其中，R为实体的类型词语集合；注意力机制交互层...

【专利技术属性】
技术研发人员：林钊，李强，赵峰，庄莉，王秋琳，宋立华，
申请(专利权)人：国网信息通信产业集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人