图谱问答方法及装置、设备、存储介质制造方法及图纸

技术编号:38392276 阅读:8 留言:0更新日期:2023-08-05 17:45
本申请提供了图谱问答方法及装置、设备、存储介质;所述方法包括:通过已训练的K元匹配模型,将第一查询问题作为整体进行向量化处理,得到第一向量;其中,K大于0;通过所述K元匹配模型,确定所述第一向量分别与各个候选K元组的第二向量之间的第一相似度;其中,所述第二向量通过所述K元匹配模型预先将所述候选K元组作为整体进行向量化处理得到;以及从各个所述候选K元组中选出所述第一相似度满足条件的候选K元组作为目标K元组;将所述目标K元组中的实体作为答案输出。如此,能够快速确定出问题答案,效率更高。效率更高。效率更高。

【技术实现步骤摘要】
图谱问答方法及装置、设备、存储介质


[0001]本申请涉及信息处理技术,涉及但不限于一种图谱问答方法及装置、设备、存储介质。

技术介绍

[0002]数字信息化时代积累了大量的结构化和非结构化的信息,随着互联网技术及信息数字化的发展,结构化信息的知识库的规模越来越大。
[0003]知识图谱(Knowledge Graph,KG)作为下一代搜索引擎、问答系统等智能应用的基础设施,其中包含了大量的事实。例如某知识图谱中包含接近千亿级的事实,它们庞大的数量和复杂的数据结构使普通用户难以访问其中的大量宝贵知识。那么如何充分利用知识图谱中的知识成为当前的热门话题。
[0004]知识图谱有专门的结构,需要特定化的查询语言进行搜索,对于普通用户来说,掌握这些查询语言的成本太高,不易于获取知识图谱中的知识。为了解决这一问题,基于知识图谱的问答(KGQA)被提出。它的目标是针对终端用户的自然语言问题,通过对问题进行语义理解和解析,转换为结构化查询(例如SPARQL),进而利用知识库进行查询推理,在结果中返回KG中的实体和/或谓词作为答案。其中,如何更加快速地确定出问题的答案,是一个热门问题。

技术实现思路

[0005]有鉴于此,本申请提供的图谱问答方法及装置、设备、存储介质,能够更加快速地确定出问题的答案,查找效率更高。
[0006]根据本申请实施例的一个方面,提供一种图谱问答方法,包括:通过已训练的K元匹配模型,将第一查询问题作为整体进行向量化处理,得到第一向量;其中,K大于0;通过所述K元匹配模型,确定所述第一向量分别与各个候选K元组的第二向量之间的第一相似度;其中,所述第二向量通过所述K元匹配模型预先将所述候选K元组作为整体进行向量化处理得到;以及从各个所述候选K元组中选出所述第一相似度满足条件的候选K元组作为目标K元组;将所述目标K元组中的实体作为答案输出。
[0007]本申请实施例提供的图谱问答装置,包括:K元向量转化模块,用于将所述第一查询问题作为整体进行向量化处理,得到第一向量;以及将所述候选K元组作为整体进行向量化处理,得到第二向量;K元匹配模块,用于确定所述第一向量分别与各个所述候选K元组的第二向量之间的第一相似度;以及从各个所述候选K元组中选出所述第一相似度满足条件的候选K元组作为与所述第一查询问题相匹配的目标K元组;其中,K大于0;输出模块,用于将所述目标K元组中的实体作为答案输出。
[0008]本申请实施例提供的电子设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本申请实施例所述的方法。
[0009]本申请实施例提供的计算机可读存储介质,其上存储有计算机程序,该计算机程
序被处理器执行时实现本申请实施例提供的所述的方法。
[0010]在本申请实施例中,是将第一查询问题和各个不同的候选K元组直接输入到K元匹配模型中,将第一查询问题作为整体进行向量化处理,得到第一向量,并与通过K元匹配模型预先对各个候选K元组作为整体进行向量化处理得到的第二向量进行整体匹配(计算向量之间的相似度),从而确定出目标K元组;这种图谱问答的实现方法,不需要对第一查询问题和候选K元组中的各个元素分别进行向量化处理,也不需要对各个元素向量化处理后得到的向量进行一一匹配,即不需要采用多个处理模块;而仅需一个向量转化模块即可得到对应的整体向量,再对整体向量进行匹配即可,涉及的处理模块少,操作步骤简单直接,处理速度快,从而能够提高查找效率。
[0011]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
[0012]此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本申请的实施例,并与说明书一起用于说明本申请的技术方案。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0013]附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
[0014]图1为本申请实施例提供的一种图谱问答方法的实现流程示意图;
[0015]图2为本申请实施例提供的一种K元匹配模型训练方法的流程示意图;
[0016]图3为本申请实施例提供的一种K元匹配模型训练方法的流程示意图;
[0017]图4为本申请实施例提供的一种K元匹配模型训练方法的流程示意图;
[0018]图5为本申请实施例提供的一种图谱问答模型训练方法示意图;
[0019]图6为本申请实施例图谱问答装置的结构示意图;
[0020]图7为本申请实施例提供的电子设备的结构示意图。
具体实施方式
[0021]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请的具体技术方案做进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。
[0022]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
[0023]在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
[0024]本申请实施例提供一种图谱问答方法,该方法应用于电子设备,该电子设备在实
施的过程中可以为各种类型的具有信息处理能力的设备,例如所述电子设备可以是终端或服务器;其中,终端可以包括手机、平板电脑、笔记本电脑等各种具有操作系统的硬件设备;服务器可以包括一个独立运行的服务器,或者分布式服务器,或者由多个服务器组成的服务器集群。该方法所实现的功能可以通过电子设备中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该电子设备至少包括处理器和存储介质。
[0025]图1为本申请实施例提供的图谱问答方法的实现流程示意图,如图1所示,该方法可以包括以下步骤101至步骤104:
[0026]步骤101,通过已训练的K元匹配模型将第一查询问题作为整体进行向量化处理,得到第一向量;其中,K大于0。
[0027]在本申请中,对于K元匹配模型具体是几元模型不做限定,K可以是3、4、5或其他任意值。在一些实施例中,K的取值为3。
[0028]在一些实施例中,可以利用transformer模块将第一查询问题作为整体进行向量化处理。
[0029]这里,对三元组进行解释:知识在知识库中的存在形式为三元组形式(S,P,O),其中S表示头实体,O表示尾实体,P表示头实体和尾实体之间的谓语关系。如对于第一查询问题本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图谱问答方法,其特征在于,所述方法包括:通过已训练的K元匹配模型,将第一查询问题作为整体进行向量化处理,得到第一向量;其中,K大于0;通过所述K元匹配模型,确定所述第一向量分别与各个候选K元组的第二向量之间的第一相似度;其中,所述第二向量通过所述K元匹配模型预先将所述候选K元组作为整体进行向量化处理得到;以及从各个所述候选K元组中选出所述第一相似度满足条件的候选K元组作为目标K元组;将所述目标K元组中的实体作为答案输出。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:对第二查询问题进行数据增强,得到N个扩展查询问题;其中,所述第二查询问题与所述N个扩展查询问题的语义相同;N大于0;将所述第二查询问题和所述N个扩展查询问题均作为不同的样本查询问题,基于各个所述样本查询问题和所述第二查询问题对应的样本K元组,对初始K元匹配模型进行训练,得到所述已训练的K元匹配模型。3.根据权利要求2所述的方法,其特征在于,所述样本K元组包括正样本K元组和负样本K元组;其中,所述正样本K元组与所述第二查询问题之间的相似度大于第一阈值;所述负样本K元组与所述第二查询问题之间的相似度小于第二阈值;所述第一阈值大于或等于所述第二阈值;所述基于各个所述样本查询问题和所述第二查询问题对应的样本K元组,对初始K元匹配模型进行训练,包括:将所述样本查询问题作为整体、所述正样本K元组作为整体、所述负样本K元组作为整体分别进行向量化处理,得到各自对应的K元向量;确定所述样本查询问题的K元向量与所述正样本K元组的K元向量之间的第二相似度,以及所述样本查询问题的K元向量与所述负样本K元组的K元向量之间的第三相似度;根据所述第二相似度和所述第三相似度,确定所述初始K元匹配模型的第一损失函数;根据所述第一损失函数,对所述初始K元匹配模型进行反向训练;如此迭代,直至达到截止条件,得到所述已训练的K元匹配模型。4.根据权利要求3所述的方法,其特征在于,K大于1;所述根据所述第一损失函数,对所述初始K元匹配模型进行反向训练,包括:对所述样本查询问题中的第一头实体和第一关系分别进行向量化处理,得到各自对应的第三向量;对所述正样本K元组中的第二头实体、第二关系和第一尾实体分别进行向量化处理,得到各自对应的第四向量;以及,对所述负样本K元组中的第三头实体、第三关系和第二尾实体分别进行向量化处理,得到各自对应的第五向量;对所述样本查询问题中的第一关系对应的第三向量、所述正样本K元组中的第二关系对应的第四向量和所述负样本K元组中的第三关系对应的第五向量分别进行增强处理,得到所述样本查询问题的一元向量、所述正样本K元组的一元向量和所述负样本K元组的一元向量;根据所述样本查询问题的一元向量、所述正样本K元组的一元向量和所述负样本K元组
的一元向量,对所述初始K元匹配模型进行反向训练;如此迭代,直至达到截止条件,得到所述已训练的K元匹配模型。5.根据权利要求4所述的方法,其特征在于,所述根据所述样本查询问题的一元向量、所述正样本K元组的一元向量和所述负样本K元组的一元向量,对所述初始K元匹配模型进行反向训练,包括:确定所述样本查询问题的一元向量与所述正样本K元组的一元向量之间的第四相似度,以及所述样本查询问题的一元向量与所述负样本K元组的一元向量之间的第五相似度;根据所述第四相似度和所述第五相似度,确定所述初始K元匹配模型的第二损失函数;根据所述第一损失函数和所述第二损失函数,对所述初始K元匹配模型进行反向训练。6.根据权利要求4所述的方法,其特征在于,所述对所述样本查询问题中的第一关系对应的第三向量、所述正样本K元组中的第二关系对应的第四向量和所述负样本K元组中的第三关系对应的第五向量分别进行增强处理,得到所述样本查询问题的一元向量、所述正样本K元组的一元向量和所述负样本K元组的一元向量,包括:对所述第一头实体对应的第三向量、所述第二头实体对应的第四向量、所述第一尾实体对应的第四向量、所述第三头实体对应的第五向量和所述第二尾实体对应的第五向量分别进行噪声添加,得到各自对应的第一更新向量;联合...

【专利技术属性】
技术研发人员:马翠花孟繁宇邓超
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1