目标答案获取方法、装置、电子设备及存储介质制造方法及图纸

技术编号:35343904 阅读:16 留言:0更新日期:2022-10-26 12:08
本发明专利技术提供一种目标答案获取方法、装置、电子设备及存储介质,该方法包括:基于知识图谱的三元组,生成文本形式的证据库;基于所述证据库中的语句,构成各所述语句对应的第一问题及所述第一问题对应的证据链;其中,所述证据链用于获取所述第一问题对应的答案;基于用户输入的目标问题、所述第一问题及所述第一问题对应的证据链,获取所述目标问题对应的目标答案。本发明专利技术实施例能够适应推理复杂的真实场景,提高了推理类问答的准确率。提高了推理类问答的准确率。提高了推理类问答的准确率。

【技术实现步骤摘要】
目标答案获取方法、装置、电子设备及存储介质


[0001]本专利技术涉及自然语言处理
,尤其涉及一种目标答案获取方法、装置、电子设备及存储介质。

技术介绍

[0002]问答任务是自然语言处理中非常重要的研究任务,其中,推理类问答任务是问答任务中的难点。
[0003]推理类问答任务包括一类专注于推理的证据库问答任务,该问答任务需要建立具有文本数据库查询功能的模型,以由模型通过查询文本形式的证据库问答数据集,获取并输出用户所输入问题对应的答案。
[0004]目前,证据库问答数据集的构建通常基于少量的实体和实体间的关系,证据库问答数据集的数据量小,仅适用于推理简单的场景,在推理复杂的真实场景下,推理类问答的准确率低。

技术实现思路

[0005]本专利技术提供一种目标答案获取方法、装置、电子设备及存储介质,用以解决现有技术中推理类问答的准确率低的缺陷。
[0006]本专利技术提供一种目标答案获取方法,包括:
[0007]基于知识图谱的三元组,生成文本形式的证据库;
[0008]基于所述证据库中的语句,构成各所述语句对应的第一问题及所述第一问题对应的证据链;
[0009]其中,所述证据链用于获取所述第一问题对应的答案;
[0010]基于用户输入的目标问题、所述第一问题及所述第一问题对应的证据链,获取所述目标问题对应的目标答案。
[0011]根据本专利技术提供的一种目标答案获取方法,在所述基于所述证据库中的语句,构成各所述语句对应的第一问题及所述第一问题对应的证据链之前,还包括:
[0012]基于所述知识图谱的问答对和程序查询语言,生成文本形式的证据文本推理语句;
[0013]其中,所述程序查询语言用于表征所述知识图谱的问答对中问题与答案之间的映射关系;
[0014]所述基于所述证据库中的语句,构成各所述语句对应的第一问题及所述第一问题对应的证据链,包括:
[0015]基于所述证据库中的语句,构成各所述语句对应的第一问题;
[0016]基于所述证据库中的语句,获取与各所述语句相匹配的所述证据文本推理语句;
[0017]基于与同一语句相匹配的至少一个所述证据文本推理语句,构成所述第一问题对应的证据链。
[0018]根据本专利技术提供的一种目标答案获取方法,所述基于用户输入的目标问题、所述第一问题及所述第一问题对应的证据链,获取所述目标问题对应的目标答案,包括:
[0019]将所述目标问题、所述第一问题及所述第一问题对应的证据链作为编解码模块的输入;
[0020]获取所述编解码模块的输出作为所述目标答案。
[0021]根据本专利技术提供的一种目标答案获取方法,所述编解码模块是经过知识蒸馏的编解码模块。
[0022]根据本专利技术提供的一种目标答案获取方法,所述基于知识图谱的三元组,生成文本形式的证据库,包括:
[0023]将所述知识图谱的三元组作为预训练模型的输入;
[0024]基于所述预训练模型的输出,生成所述证据库;
[0025]其中,所述预训练模型是经过文本生成datatotext的方式训练过的模型。
[0026]本专利技术还提供一种目标答案获取装置,包括:
[0027]生成模块,用于基于知识图谱的三元组,生成文本形式的证据库;
[0028]构成模块,用于基于所述证据库中的语句,构成各所述语句对应的第一问题及所述第一问题对应的证据链;
[0029]其中,所述证据链用于获取所述第一问题对应的答案;
[0030]获取模块,用于基于用户输入的目标问题、所述第一问题及所述第一问题对应的证据链,获取所述目标问题对应的目标答案。
[0031]根据本专利技术提供的一种目标答案获取装置,所述生成模块,还用于基于所述知识图谱的问答对和程序查询语言,生成文本形式的证据文本推理语句;
[0032]其中,所述程序查询语言用于表征所述知识图谱的问答对中问题与答案之间的映射关系;
[0033]所述构成模块,具体用于基于所述证据库中的语句,构成各所述语句对应的第一问题;
[0034]所述构成模块,还具体用于基于所述证据库中的语句,获取与各所述语句相匹配的所述证据文本推理语句;并基于与同一语句相匹配的至少一个所述证据文本推理语句,构成所述第一问题对应的证据链。
[0035]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述目标答案获取方法。
[0036]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述目标答案获取方法。
[0037]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述目标答案获取方法。
[0038]本专利技术实施例提供的目标答案获取方法、装置、电子设备及存储介质,基于知识图谱的三元组,生成文本形式的证据库,相较于目前证据库的构建通常基于少量的实体和实体间的关系,由于知识图谱中实体和实体间关系的数量大,故本专利技术生成的证据库的数据量大,基于该复杂真实的证据库中的语句,构成第一问题及用于获取第一问题的答案的证
据链,再基于用户输入的目标问题、第一问题及对应的证据链,就可以获取目标问题对应的目标答案,能够适应推理复杂的真实场景,提高了推理类问答的准确率。
附图说明
[0039]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0040]图1是本专利技术提供的目标答案获取方法的流程示意图;
[0041]图2是本专利技术提供的目标答案获取装置的结构示意图之一;
[0042]图3是本专利技术提供的目标答案获取装置的结构示意图之二;
[0043]图4是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0044]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0045]下面对本专利技术涉及的相关知识介绍如下:
[0046]问答任务是自然语言处理中非常重要的一个研究任务,推理类问答是问答任务中的难点问题,涉及到多种推理知识,需要知识系统作为支撑。
[0047]目前知识系统包括三类:1)结构化的知识图谱;2)数值化的预训练语言模型;3)非结构化的文本知识库。上述三种知识系统有各自的特点,具体地,在知识类型和丰富程度上,知识图谱由人工半自本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标答案获取方法,其特征在于,包括:基于知识图谱的三元组,生成文本形式的证据库;基于所述证据库中的语句,构成各所述语句对应的第一问题及所述第一问题对应的证据链;其中,所述证据链用于获取所述第一问题对应的答案;基于用户输入的目标问题、所述第一问题及所述第一问题对应的证据链,获取所述目标问题对应的目标答案。2.根据权利要求1所述的目标答案获取方法,其特征在于,在所述基于所述证据库中的语句,构成各所述语句对应的第一问题及所述第一问题对应的证据链之前,还包括:基于所述知识图谱的问答对和程序查询语言,生成文本形式的证据文本推理语句;其中,所述程序查询语言用于表征所述知识图谱的问答对中问题与答案之间的映射关系;所述基于所述证据库中的语句,构成各所述语句对应的第一问题及所述第一问题对应的证据链,包括:基于所述证据库中的语句,构成各所述语句对应的第一问题;基于所述证据库中的语句,获取与各所述语句相匹配的所述证据文本推理语句;基于与同一语句相匹配的至少一个所述证据文本推理语句,构成所述第一问题对应的证据链。3.根据权利要求2所述的目标答案获取方法,其特征在于,所述基于用户输入的目标问题、所述第一问题及所述第一问题对应的证据链,获取所述目标问题对应的目标答案,包括:将所述目标问题、所述第一问题及所述第一问题对应的证据链作为编解码模块的输入;获取所述编解码模块的输出作为所述目标答案。4.根据权利要求3所述的目标答案获取方法,其特征在于,所述编解码模块是经过知识蒸馏的编解码模块。5.根据权利要求1至4中任一项所述的目标答案获取方法,其特征在于,所述基于知识图谱的三元组,生成文本形式的证据库,包括:将所述知识图谱的三元组作为预训练...

【专利技术属性】
技术研发人员:何世柱赵军刘康朱敏郡
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1