通用领域知识图谱的知识问答方法、终端设备及存储介质技术

技术编号:29298007 阅读:9 留言:0更新日期:2021-07-17 01:06
本发明专利技术涉及通用领域知识图谱的知识问答方法、终端设备及存储介质,该方法中包括:S1:从知识图谱中提取数据并构建知识数据库;S2:接收查询问句,并对查询问句进行清洗;S3:对查询问句内包含的所有查询要素进行识别;S4:对识别到的查询要素进行筛查;S5:构建多个要素模板,根据要素模板将查询要素生成对应的查询语句,并根据查询语句中包含的查询要素的类型的数量设定查询语句的优先度;S6:按照各查询语句的优先度由高到低的顺序依次执行查询语句;S7:对所有查询结果进行筛查,将筛查后的最终结果最为查询问句的答案。本发明专利技术建立了一套区别于意图模板的提取模式,适用于不同领域的问题查询,通用性强,准确性高。准确性高。准确性高。

Knowledge question answering method, terminal equipment and storage medium of general domain knowledge atlas

【技术实现步骤摘要】
通用领域知识图谱的知识问答方法、终端设备及存储介质


[0001]本专利技术涉及知识图谱领域,尤其涉及一种通用领域知识图谱的知识问答方法、终端设备及存储介质。

技术介绍

[0002]随着互联网上信息的爆炸式增长,人们对信息检索的需求越来越大,如何快速、精确、可靠地从大量的、模态多样化的信息中搜索到用户需要的信息,成为一个迫切且需要解决的问题。
[0003]目前技术上已经实现的基于知识图谱问答系统均为基于意图模板的,其只针对某一专一领域的知识图谱的问答系统,通过分析用户的提问方式,总结问句类型,结合专门构建的对应知识图谱,提取出问题的意图模板,再根据问句的意图数据训练意图识别模型,搭配足够的意图模板查询图谱即可得到答案。
[0004]现有基于知识图谱问答系统的优点为:查询响应速度快、准确率高、可以回答复杂查询,同时缺点也相当明显:要满足用户的各种问法、需要人工建立庞大的意图模板库,这个过程已经是很耗精力的,若要迁移到其他图谱的,则又需要重新分析问法设计模板,这样依赖的成本之高、难度之大,基本等同于重新开发一个问答系统,且需要足够的场景数据和意图标签作为支撑,上述原因使得知识性问答系统的构建变得异常困难。因此设计一个查询模板通用、图谱领域通用的基于知识图谱的问答系统是急需的。

技术实现思路

[0005]为了解决上述问题,本专利技术提出了一种通用领域知识图谱的知识问答方法、终端设备及存储介质。
[0006]具体方案如下:
[0007]一种通用领域知识图谱的知识问答方法,包括以下步骤:
[0008]S1:从知识图谱中提取数据并构建知识数据库;
[0009]S2:接收查询问句,并对查询问句进行清洗;
[0010]S3:对查询问句内包含的所有查询要素进行识别;
[0011]S4:对识别到的查询要素进行筛查,删除重复的查询要素;
[0012]S5:构建多个要素模板,不同要素模板由不同的查询要素的类型组成,根据要素模板将查询要素生成对应的查询语句,并根据查询语句中包含的查询要素的类型的数量设定查询语句的优先度;
[0013]S6:按照各查询语句的优先度由高到低的顺序依次执行查询语句,当查询结果为空或报错时,继续执行同优先度的查询语句,当无同优先度的查询语句时,执行次一级优先度的查询语句,当无次一级优先度的查询语句时结束查询;当查询结果为非空时,继续执行同优先度的查询语句,当无同优先度的查询语句时结束查询;
[0014]S7:对所有查询结果进行筛查,将筛查后的最终结果最为查询问句的答案。
[0015]进一步的,步骤S1中提取数据程包括提取知识图谱中的标签、属性名称、通用属性的值和节点间的关系。
[0016]进一步的,步骤S1中知识数据库的构建方法为:根据提取的数据生成键值对关系,以键值对关系构建知识数据库,以键作为知识数据库内的查询要素。
[0017]进一步的,步骤S3中的识别过程使用的模型包括命名实体识别模型和分类模型,其中标签、属性名称和节点间的关系对应的查询要素的识别按照分类模型进行识别。
[0018]进一步的,步骤S3中识别结束后还包括将识别到的查询要素与知识数据库进行数据对齐,即将识别到的查询要素用知识数据库中的相同或相似知识替换。
[0019]进一步的,数据对齐的具体过程为:建立知识库数据中命名实体、标签、属性名称和节点间的关系四类查询要素对应的四个树形数据图,根据查询要素的类型从对应的树形数据图中筛选出与该查询要素最相似的知识,并使用其对查询要素进行替换。
[0020]进一步的,步骤S4的筛查方法为:如果两个查询要素在查询问句中的范围有重叠,则删除字符长度较短的查询要素。
[0021]进一步的,步骤S7中对所有查询结果进行筛查的方法为:计算每个查询结果对应的查询问句中的查询要素与查询问句中的疑问词之间的距离,同时计算查询结果对应的查询问句中的查询要素的排序与查询语句中各识别要素的排序的一致程度,距离越近和一直程度越高的查询结果为最终结果。
[0022]一种通用领域知识图谱的知识问答终端设备,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本专利技术实施例上述的方法的步骤。
[0023]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本专利技术实施例上述的方法的步骤。
[0024]本专利技术采用如上技术方案,建立了一套区别于意图模板的提取模式,该模式可完全自主执行全过程,不需人工干涉,适用于不同领域的问题查询,通用性强,准确性高。
附图说明
[0025]图1所示为本专利技术实施例一的流程图。
具体实施方式
[0026]为进一步说明各实施例,本专利技术提供有附图。这些附图为本专利技术揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理。配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本专利技术的优点。
[0027]现结合附图和具体实施方式对本专利技术进一步说明。
[0028]实施例一:
[0029]本专利技术实施例提供了一种通用领域知识图谱的知识问答方法,如图1所示,其为本专利技术实施例所述的通用领域知识图谱的知识问答方法的流程图,所述方法包括以下步骤:
[0030]S1:从知识图谱中提取数据并构建知识数据库。
[0031]知识图谱中至少包含了标签、属性名称、属性的值、节点间的关系等数据。
[0032]该实施例中通过提取知识图谱中的标签、属性名称、属性的值和节点间的关系,并
据此生成键值对关系,以键值对关系构建知识数据库,以键作为知识数据库内的查询要素。
[0033]由于提取的数据不统一,因此,还需要对其进行清洗,具体为:对各个键值对的值进行大小写统一、字数统一、格式统一、无用信息去除、去重和同义词生成等操作,在其他实施例中也可以采用其他处理方式,在此不做限制。
[0034]最终构建的知识数据库用于查询时使用。
[0035]S2:接收查询问句,并对查询问句进行清洗。
[0036]查询问句的清洗包括大小写统一字数统一、格式统一和无用信息去除等,在其他实施例中也可以采用其他处理方式,在此不做限制。
[0037]S3:对查询问句内包含的所有查询要素进行识别。
[0038]该实施例中采用命名实体识别模型和分类模型两种模型对查询要素进行识别,其中命名实体识别模型用于识别实体,如人名、地名等等,实体在知识数据库内通常作为属性的值存储,分类模型用于识别标签、属性名称和节点间的关系对应的查询要素的识别。
[0039]命名实体识别模型和分类模型可以采用现有模型进行预训练生成,也可以自行构建,在此不做限制。常用的命名实体识别模型如bert

crf、textcnn、fasttext等。
[0040]由于识别到的查询要素本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种通用领域知识图谱的知识问答方法,其特征在于,包括以下步骤:S1:从知识图谱中提取数据并构建知识数据库;S2:接收查询问句,并对查询问句进行清洗;S3:对查询问句内包含的所有查询要素进行识别;S4:对识别到的查询要素进行筛查,删除重复的查询要素;S5:构建多个要素模板,不同要素模板由不同的查询要素的类型组成,根据要素模板将查询要素生成对应的查询语句,并根据查询语句中包含的查询要素的类型的数量设定查询语句的优先度;S6:按照各查询语句的优先度由高到低的顺序依次执行查询语句,当查询结果为空或报错时,继续执行同优先度的查询语句,当无同优先度的查询语句时,执行次一级优先度的查询语句,当无次一级优先度的查询语句时结束查询;当查询结果为非空时,继续执行同优先度的查询语句,当无同优先度的查询语句时结束查询;S7:对所有查询结果进行筛查,将筛查后的最终结果最为查询问句的答案。2.根据权利要求1所述的通用领域知识图谱的知识问答方法,其特征在于:步骤S1中提取数据程包括提取知识图谱中的标签、属性名称、通用属性的值和节点间的关系。3.根据权利要求1所述的通用领域知识图谱的知识问答方法,其特征在于:步骤S1中知识数据库的构建方法为:根据提取的数据生成键值对关系,以键值对关系构建知识数据库,以键作为知识数据库内的查询要素。4.根据权利要求1所述的通用领域知识图谱的知识问答方法,其特征在于:步骤S3中的识别过程使用的模型包括命名实体识别模型和分类模型,其中标签、属性名称和节点间的关系对应的查询要素的识别按照分类模型进行识别。5...

【专利技术属性】
技术研发人员:洪万福熊朝阳
申请(专利权)人:厦门渊亭信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1