基于语义块的知识图谱问答方法及装置制造方法及图纸

技术编号：26342581 阅读：14 留言：0更新日期：2020-11-13 20:35

本发明专利技术涉及一种基于语义块的知识图谱问答方法及装置，包括获取问句，并通过预设的知识图谱生成上下文字典；将上下文字典输入到预训练的图神经网络模型中，生成语义块序列，根据语义块序列构建语义查询图；根据知识图谱对语义查询图进行解析，输出结果。本发明专利技术通过构造问句的上下文词典附加到图神经网络中，有效解决了隐式实体和关系挑战，改进了语义解析的效果。通过构建的语义查询图生成问题的逻辑形式，能够快速的在知识库中检索出答案。结合基于规则的准确度和基于深度学习的覆盖度，通过构建语义块的形式改进问句中的约束条件和多意图组合，使得问题语义块的解析不依赖于问答输出的逻辑形式，具有较强的适应性。

全部详细技术资料下载

【技术实现步骤摘要】
基于语义块的知识图谱问答方法及装置
本专利技术属于语言
，具体涉及一种基于语义块的知识图谱问答方法及装置。
技术介绍
语义解析的作用是能够让计算机理解自然语言中的语义信息，用来在知识库中匹配相对应的语义类型。在基于知识图谱的自然语言问答的研究中，语义解析是非常重要的一个步骤，更精准的语义理解能够使计算机识别问句意图并返回相应的答案。随着神经网络和知识图谱的广泛应用，基于知识图谱的自然语言问答被深入研究。知识图谱问答需要计算机理解自然语言的语义信息，其核心在于问句语义和知识语义的理解和相似度计算。近年来，随着深度学习在自然语言处理领域的快速发展及其在问答任务上的良好表现，利用深度神经网络来改进面向知识图谱的问答成为研究的主要方向。现在大多数的问答场景都是依据领域而建，相比于通用问答场景，聚焦于领域能够提高问答的准确性。领域知识图谱问答一般围绕领域相关问题进行，问题的理解可以划分为三个子任务：实体链接、关系识别以及逻辑和数字操作相关的约束条件标识。在现有的知识图谱问答中还存在以下几个解析问题：1、隐式实体和关系，领域问答场景较固定，在进行问答时，会省略一些实体和关系，默认为这就是领域中的上下文信息。2、约束条件，知识图谱中存在大量时间、排序、聚合等约束条件，对问句的语义理解造成了困难。3、多意图组合，问题一般由多个意图组合而成，每个意图表示了对预期结果的一种限定，特定领域的问答意图较集中，通过不同的组合方式来实现复杂的问题意图，如何通过拆分意图来实现语义解析也是一个大的问题。...

【技术保护点】
1.一种基于语义块的知识图谱问答方法，其特征在于，包括：/n获取问句，并通过预设的知识图谱生成上下文字典；/n将所述上下文字典输入到预训练的图神经网络模型中，生成语义块序列，根据所述语义块序列构建语义查询图；/n根据所述知识图谱对所述语义查询图进行解析，输出结果。/n

【技术特征摘要】
1.一种基于语义块的知识图谱问答方法，其特征在于，包括：
获取问句，并通过预设的知识图谱生成上下文字典；
将所述上下文字典输入到预训练的图神经网络模型中，生成语义块序列，根据所述语义块序列构建语义查询图；
根据所述知识图谱对所述语义查询图进行解析，输出结果。

2.根据权利要求1所述的方法，其特征在于，所述通过预设的知识图谱生成上下文字典，之前还包括：对问句进行预处理；
所述对问句进行预处理，包括：
采用WordNet将所述问句中的所有词转换为对应的语义词；
基于实体链接方法，得到所述问句中的候选实体类别集合，并获取实体；
对所述实体进行处理，得到候选实体类别中元素之间的关系；
建立候选实体类别中元素之间的关系集合。

3.根据权利要求2所述的方法，其特征在于，所述通过预设的知识图谱生成上下文字典，包括：
通过问句得到所述问句关联的候选实体类别；
通过知识图谱得到与候选实体类别中元素之间的关系集合，得到带有上下文信息的问题表示。

4.根据权利要求3所述的方法，其特征在于，
采用图编码器将输入的上下文字典编码为向量表示；
采用序列解码器将所述向量表示生成语义块序列。

5.根据权利要求4所述的方法，其特征在于，所述图编码器包括：
节点嵌入层，用于生成节点向量；其中，所述节点包括：问句中的单词组成的词典、候选实体类别词典；
图嵌入层，用于采用max-pooling方式生成问句图的向量表示。

6.根据权...

【专利技术属性】
技术研发人员：高留杰，张世琨，赵文，常磊磊，
申请(专利权)人：北京北大软件工程股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人