一种基于知识图谱的答案生成方法、装置及电子设备制造方法及图纸

技术编号:33626471 阅读:11 留言:0更新日期:2022-06-02 01:12
本申请提供了一种基于知识图谱的答案生成方法、装置及电子设备,答案生成方法包括:获取目标问题文本;基于训练好的问题分类模型,确定目标问题文本的问题类型;基于知识图谱和问题类型,确定问题类型在知识图谱中对应的目标答案模板,并根据目标答案模板确定目标问题文本的目标答案。本申请对目标问题文本的语句形式没有限制,通过训练好的问题分类模型可以确定出目标问题文本的问题类型,进而通过问题类型在知识图谱中搜索出对应的目标答案模板,以生成目标答案,这样,可以快速的生成目标答案,提高目标问题查询检索的效率以及准确性。提高目标问题查询检索的效率以及准确性。提高目标问题查询检索的效率以及准确性。

【技术实现步骤摘要】
一种基于知识图谱的答案生成方法、装置及电子设备


[0001]本申请涉及自然语言处理
,尤其是涉及一种基于知识图谱的答案生成方法、装置及电子设备。

技术介绍

[0002]目前市场上,传统的搜索引擎是基于专业的查询语句中的关键词的搜索方式进行搜索的,缺乏对自然语言的语义分析和语义理解,已经越来越难以满足人们的需求,而在当前核电等某些专业领域的生产过程中,业务人员对信息查询搜索是通过输入专业的查询语句,去数据库中检索答案。这种方式需要首先对查询人员要做专业的培训,使其了解专业查询语句的语法,且查询专利语句的数据库只有一个,查询条件有限,而跨库搜索的步骤又较复杂,导致了信息查询检索的效率低下,且准确率低。

技术实现思路

[0003]有鉴于此,本申请的目的在于提供一种基于知识图谱的答案生成方法、装置及电子设备,通过对目标问题文本的语句形式没有限制,通过训练好的问题分类模型可以确定出目标问题文本的问题类型,进而通过问题类型在知识图谱中搜索出对应的目标答案模板,以生成目标答案,这样,可以快速的生成目标答案,提高目标问题查询检索的效率以及准确性。
[0004]本申请主要包括以下几个方面:
[0005]第一方面,本申请实施例提供了一种知识图谱的答案生成方法,所述答案生成方法包括:
[0006]获取目标问题文本,其中,所述目标问题文本为自然语言类型的问题文本;
[0007]基于训练好的问题分类模型,确定所述目标问题文本的问题类型;
[0008]基于知识图谱和所述问题类型,确定所述问题类型在所述知识图谱中对应的目标答案模板,并根据所述目标答案模板确定所述目标问题文本的目标答案。
[0009]在一种可能的实施方式中,通过以下方式获取训练好的问题分类模型,包括:
[0010]获取多个样本问题文本,并对每个所述样本问题文本进行问题类型的分类;
[0011]针对每个所述问题类型对应的所述样本问题文本进行分词处理,得到该样本问题文本对应的至少一个样本词汇;
[0012]根据每个所述样本问题文本对应的至少一个的所述样本词汇的词频,确定每个所述样本问题文本的样本向量;
[0013]基于每个所述样本问题文本的所述样本向量,对构建好的初始问题分类模型进行训练,确定训练好的问题分类模型。
[0014]在一种可能的实施方式中,所述根据每个所述样本问题文本对应的至少一个的所述样本词汇的词频,确定每个所述样本问题文本的样本向量,包括:
[0015]根据每个所述样本问题文本对应的至少一个的所述样本词汇的词频,确定每个所
述样本问题文本的初始样本向量;
[0016]根据每个所述样本词汇的词频的在对应的所述样本问题文本中的占比,对所述初始样本向量进行权重调节,确定每个所述样本问题的样本向量。
[0017]在一种可能的实施方式中,所述基于知识图谱和所述问题类型,确定所述问题类型在所述知识图谱中对应的目标答案模板,并根据所述目标答案模板确定所述目标问题文本的目标答案,包括:
[0018]基于所述问题类型,从知识图谱中的多个答案模板中确定所述目标问题文本对应的目标答案模板;
[0019]根据所述目标答案模板与所述目标问题文本中的文本实际值,确定所述目标问题文本的目标答案。
[0020]在一种可能的实施方式中,所述目标答案包括目标答案框架以及目标答案细节数据。
[0021]第二方面,本申请实施例还提供了一种基于知识图谱的答案生成装置,所述答案生成装置包括:
[0022]获取模块,用于获取目标问题文本,其中,所述目标问题文本为自然语言类型的问题文本;
[0023]第一确定模块,用于基于训练好的问题分类模型,确定所述目标问题文本的问题类型;
[0024]第二确定模块,用于基于知识图谱和所述问题类型,确定所述问题类型在所述知识图谱中对应的目标答案模板,并根据所述目标答案模板确定所述目标问题文本的目标答案。
[0025]在一种可能的实施方式中,所述确定模块是通过以下方式获取训练好的问题分类模型,包括:
[0026]获取多个样本问题文本,并对每个所述样本问题文本进行问题类型的分类;
[0027]针对每个所述问题类型对应的所述样本问题文本进行分词处理,得到该样本问题文本对应的至少一个样本词汇;
[0028]根据每个所述样本问题文本对应的至少一个的所述样本词汇的词频,确定每个所述样本问题文本的样本向量;
[0029]基于每个所述样本问题文本的所述样本向量,对构建好的初始问题分类模型进行训练,确定训练好的问题分类模型。
[0030]在一种可能的实施方式中,所述第二确定模块包括:
[0031]第一确定单元,用于基于所述问题类型,从知识图谱中的多个答案模板中确定所述目标问题文本对应的目标答案模板;
[0032]第二确定单元,用于根据所述目标答案模板与所述目标问题文本中的文本实际值,确定所述目标问题文本的目标答案。
[0033]第三方面,本申请实施例还提供一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如上述的答案生成方法的步骤。
[0034]第四方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述的答案生成方法的步骤。
[0035]本申请实施例提供的基于知识图谱的答案生成方法、装置及电子设备,与现有技术中的信息检索方法相比,本申请对目标问题文本的语句形式没有限制,通过训练好的问题分类模型可以确定出目标问题文本的问题类型,进而通过问题类型在知识图谱中搜索出对应的目标答案模板,以生成目标答案,这样,可以快速的生成目标答案,提高目标问题查询检索的效率以及准确性。
[0036]为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0037]为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0038]图1示出了本申请实施例所提供的一种基于知识图谱的答案生成方法的流程图;
[0039]图2示出了本申请实施例所提供的另一种基于知识图谱的答案生成方法的流程图;
[0040]图3示出了本申请实施例所提供的一种基于知识图谱的答案生成装置的结构示意图;
[0041]图4示出了本申请实施例所提供的另一种基于知识图谱的答案生成装置的结构示意图;
[0042]图5示出了本申请实施例所提供的一种电子设备的结构示意图;
[0043]图6示出本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的答案生成方法,其特征在于,所述答案生成方法包括:获取目标问题文本,其中,所述目标问题文本为自然语言类型的问题文本;基于训练好的问题分类模型,确定所述目标问题文本的问题类型;基于知识图谱和所述问题类型,确定所述问题类型在所述知识图谱中对应的目标答案模板,并根据所述目标答案模板确定所述目标问题文本的目标答案。2.根据权利要求1所述的答案生成方法,其特征在于,通过以下方式获取训练好的问题分类模型,包括:获取多个样本问题文本,并对每个所述样本问题文本进行问题类型的分类;针对每个所述问题类型对应的所述样本问题文本进行分词处理,得到该样本问题文本对应的至少一个样本词汇;根据每个所述样本问题文本对应的至少一个的所述样本词汇的词频,确定每个所述样本问题文本的样本向量;基于每个所述样本问题文本的所述样本向量,对构建好的初始问题分类模型进行训练,确定训练好的问题分类模型。3.根据权利要求2所述的答案生成方法,其特征在于,所述根据每个所述样本问题文本对应的至少一个的所述样本词汇的词频,确定每个所述样本问题文本的样本向量,包括:根据每个所述样本问题文本对应的至少一个的所述样本词汇的词频,确定每个所述样本问题文本的初始样本向量;根据每个所述样本词汇的词频的在对应的所述样本问题文本中的占比,对所述初始样本向量进行权重调节,确定每个所述样本问题的样本向量。4.根据权利要求1所述的答案生成方法,其特征在于,所述基于知识图谱和所述问题类型,确定所述问题类型在所述知识图谱中对应的目标答案模板,并根据所述目标答案模板确定所述目标问题文本的目标答案,包括:基于所述问题类型,从知识图谱中的多个答案模板中确定所述目标问题文本对应的目标答案模板;根据所述目标答案模板与所述目标问题文本中的文本实际值,确定所述目标问题文本的目标答案。5.根据权利要求4所述的答案生成方法,其特征在于,所述目标答案包括目标答...

【专利技术属性】
技术研发人员:张展卫婕吕明陈燕辉
申请(专利权)人:北京中科五极数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1