基于语义块的知识图谱问答方法及装置制造方法及图纸

技术编号:26342581 阅读:14 留言:0更新日期:2020-11-13 20:35
本发明专利技术涉及一种基于语义块的知识图谱问答方法及装置,包括获取问句,并通过预设的知识图谱生成上下文字典;将上下文字典输入到预训练的图神经网络模型中,生成语义块序列,根据语义块序列构建语义查询图;根据知识图谱对语义查询图进行解析,输出结果。本发明专利技术通过构造问句的上下文词典附加到图神经网络中,有效解决了隐式实体和关系挑战,改进了语义解析的效果。通过构建的语义查询图生成问题的逻辑形式,能够快速的在知识库中检索出答案。结合基于规则的准确度和基于深度学习的覆盖度,通过构建语义块的形式改进问句中的约束条件和多意图组合,使得问题语义块的解析不依赖于问答输出的逻辑形式,具有较强的适应性。

【技术实现步骤摘要】
基于语义块的知识图谱问答方法及装置
本专利技术属于语言
,具体涉及一种基于语义块的知识图谱问答方法及装置。
技术介绍
语义解析的作用是能够让计算机理解自然语言中的语义信息,用来在知识库中匹配相对应的语义类型。在基于知识图谱的自然语言问答的研究中,语义解析是非常重要的一个步骤,更精准的语义理解能够使计算机识别问句意图并返回相应的答案。随着神经网络和知识图谱的广泛应用,基于知识图谱的自然语言问答被深入研究。知识图谱问答需要计算机理解自然语言的语义信息,其核心在于问句语义和知识语义的理解和相似度计算。近年来,随着深度学习在自然语言处理领域的快速发展及其在问答任务上的良好表现,利用深度神经网络来改进面向知识图谱的问答成为研究的主要方向。现在大多数的问答场景都是依据领域而建,相比于通用问答场景,聚焦于领域能够提高问答的准确性。领域知识图谱问答一般围绕领域相关问题进行,问题的理解可以划分为三个子任务:实体链接、关系识别以及逻辑和数字操作相关的约束条件标识。在现有的知识图谱问答中还存在以下几个解析问题:1、隐式实体和关系,领域问答场景较固定,在进行问答时,会省略一些实体和关系,默认为这就是领域中的上下文信息。2、约束条件,知识图谱中存在大量时间、排序、聚合等约束条件,对问句的语义理解造成了困难。3、多意图组合,问题一般由多个意图组合而成,每个意图表示了对预期结果的一种限定,特定领域的问答意图较集中,通过不同的组合方式来实现复杂的问题意图,如何通过拆分意图来实现语义解析也是一个大的问题。
技术实现思路
有鉴于此,本专利技术的目的在于克服现有技术的不足,提供一种基于语义块的知识图谱问答方法及装置,以解决现有技术中语义解析的问题。为实现以上目的,本专利技术采用如下技术方案:一种基于语义块的知识图谱问答方法,包括:获取问句,并通过预设的知识图谱生成上下文字典;将所述上下文字典输入到预训练的图神经网络模型中,生成语义块序列,根据所述语义块序列构建语义查询图;根据所述知识图谱对所述语义查询图进行解析,输出结果。进一步的,所述通过预设的知识图谱生成上下文字典,之前还包括:对问句进行预处理;所述对问句进行预处理,包括:采用WordNet将所述问句中的所有词转换为对应的语义词;基于实体链接方法,得到所述问句中的候选实体类别集合,并获取实体;对所述实体进行处理,得到候选实体类别中元素之间的关系;建立候选实体类别中元素之间的关系集合。进一步的,所述通过预设的知识图谱生成上下文字典,包括:通过问句得到所述问句关联的候选实体类别;通过知识图谱得到与候选实体类别中元素之间的关系集合,得到带有上下文信息的问题表示。进一步的,采用图编码器将输入的上下文字典编码为向量表示;采用序列解码器将所述向量表示生成语义块序列。进一步的,所述图编码器包括:节点嵌入层,用于生成节点向量;其中,所述节点包括:问句中的单词组成的词典、候选实体类别词典;图嵌入层,用于采用max-pooling方式生成问句图的向量表示。进一步的,所述序列解码器采用:双向RNN模型,所述双向RNN模型每次迭代生成一个语义块,最终形成语义块序列。进一步的,所述序列解码器包括:语义块解码控制器,用于预测语义块序列中每个语义块包含名称、实体类型和输入参数三个部分的内容,采用Beam搜索,结合生成的语义块中的参数类型,与得到的语义块的输出类型进行匹配,得到可以匹配的语义块来确定序列在当前时刻的输出。进一步的,所述语义块包括以下模式:实体模式、关系模式、属性模式、排序模式、聚合模式、集合模式。本申请实施例提供一种基于语义块的知识图谱问答装置,包括:获取模块,用于获取问句,并通过预设的知识图谱生成上下文字典;生成模块,用于将所述上下文字典输入到预训练的图神经网络模型中,生成语义块序列,根据所述语义块序列构建语义查询图;输出模块,用于根据所述知识图谱对所述语义查询图进行解析,输出结果。进一步的,所述通过预设的知识图谱生成上下文字典,之前还包括:预处理模块,用于对问句进行预处理;所述对问句进行预处理,包括:采用WordNet将所述问句中的所有词转换为对应的语义词;基于实体链接方法,得到所述问句中的候选实体类别集合,并获取实体;对所述实体进行处理,得到候选实体类别中元素之间的关系;建立候选实体类别中元素之间的关系集合。本专利技术采用以上技术方案,能够达到的有益效果包括:本专利技术提供一种基于语义块的知识图谱问答方法,获取问句,并通过预设的知识图谱生成上下文字典;将上下文字典输入到预训练的图神经网络模型中,生成语义块序列,根据语义块序列构建语义查询图;根据知识图谱对语义查询图进行解析,输出结果。本专利技术适用于自然语言处理中的自然语言问答和检索。相比于传统语义方法,本申请将问句的语义解析建模为图到序列的编码器-解码器任务,通过构建语义块的形式改进问句中的约束条件和多意图组合,使得问题语义块的解析不依赖于问答输出的逻辑形式,具有较强的适应性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术基于语义块的知识图谱问答方法的步骤示意图;图2为本专利技术基于语义块的知识图谱问答方法的流程示意图;图3为本专利技术基于语义块的知识图谱问答方法的另一种流程示意图;图4为本专利技术基于语义块的知识图谱问答方法的另一种流程示意图;图5为本专利技术基于语义块的知识图谱问答装置的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将对本专利技术的技术方案进行详细的描述。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本专利技术所保护的范围。下面结合附图介绍本申请实施例中提供的一个具体的基于语义块的知识图谱问答方法。如图1所示,本申请实施例中提供的基于语义块的知识图谱问答方法,包括:S101,获取问句,并通过预设的知识图谱生成上下文字典;首先预设知识图谱,获取一个问句,问句可以是中文也可以是英文,借助知识图谱生成问句的上下文字典。S102,将所述上下文字典输入到预训练的图神经网络模型中,生成语义块序列,根据所述语义块序列构建语义查询图;将上下文字典作为附加信息输入到图神经网络中,得到网络的输出用以生成表示问题意图的语义块序列,从而构造语义查询图。S103,根据所述知识图谱对本文档来自技高网
...

【技术保护点】
1.一种基于语义块的知识图谱问答方法,其特征在于,包括:/n获取问句,并通过预设的知识图谱生成上下文字典;/n将所述上下文字典输入到预训练的图神经网络模型中,生成语义块序列,根据所述语义块序列构建语义查询图;/n根据所述知识图谱对所述语义查询图进行解析,输出结果。/n

【技术特征摘要】
1.一种基于语义块的知识图谱问答方法,其特征在于,包括:
获取问句,并通过预设的知识图谱生成上下文字典;
将所述上下文字典输入到预训练的图神经网络模型中,生成语义块序列,根据所述语义块序列构建语义查询图;
根据所述知识图谱对所述语义查询图进行解析,输出结果。


2.根据权利要求1所述的方法,其特征在于,所述通过预设的知识图谱生成上下文字典,之前还包括:对问句进行预处理;
所述对问句进行预处理,包括:
采用WordNet将所述问句中的所有词转换为对应的语义词;
基于实体链接方法,得到所述问句中的候选实体类别集合,并获取实体;
对所述实体进行处理,得到候选实体类别中元素之间的关系;
建立候选实体类别中元素之间的关系集合。


3.根据权利要求2所述的方法,其特征在于,所述通过预设的知识图谱生成上下文字典,包括:
通过问句得到所述问句关联的候选实体类别;
通过知识图谱得到与候选实体类别中元素之间的关系集合,得到带有上下文信息的问题表示。


4.根据权利要求3所述的方法,其特征在于,
采用图编码器将输入的上下文字典编码为向量表示;
采用序列解码器将所述向量表示生成语义块序列。


5.根据权利要求4所述的方法,其特征在于,所述图编码器包括:
节点嵌入层,用于生成节点向量;其中,所述节点包括:问句中的单词组成的词典、候选实体类别词典;
图嵌入层,用于采用max-pooling方式生成问句图的向量表示。


6.根据权...

【专利技术属性】
技术研发人员:高留杰张世琨赵文常磊磊
申请(专利权)人:北京北大软件工程股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1