图谱问答方法及装置、设备、存储介质制造方法及图纸

技术编号：38392276 阅读：10 留言：0更新日期：2023-08-05 17:45

本申请提供了图谱问答方法及装置、设备、存储介质；所述方法包括：通过已训练的K元匹配模型，将第一查询问题作为整体进行向量化处理，得到第一向量；其中，K大于0；通过所述K元匹配模型，确定所述第一向量分别与各个候选K元组的第二向量之间的第一相似度；其中，所述第二向量通过所述K元匹配模型预先将所述候选K元组作为整体进行向量化处理得到；以及从各个所述候选K元组中选出所述第一相似度满足条件的候选K元组作为目标K元组；将所述目标K元组中的实体作为答案输出。如此，能够快速确定出问题答案，效率更高。效率更高。效率更高。

全部详细技术资料下载

【技术实现步骤摘要】
图谱问答方法及装置、设备、存储介质

[0001]本申请涉及信息处理技术，涉及但不限于一种图谱问答方法及装置、设备、存储介质。

技术介绍

[0002]数字信息化时代积累了大量的结构化和非结构化的信息，随着互联网技术及信息数字化的发展，结构化信息的知识库的规模越来越大。
[0003]知识图谱(Knowledge Graph，KG)作为下一代搜索引擎、问答系统等智能应用的基础设施，其中包含了大量的事实。例如某知识图谱中包含接近千亿级的事实，它们庞大的数量和复杂的数据结构使普通用户难以访问其中的大量宝贵知识。那么如何充分利用知识图谱中的知识成为当前的热门话题。
[0004]知识图谱有专门的结构，需要特定化的查询语言进行搜索，对于普通用户来说，掌握这些查询语言的成本太高，不易于获取知识图谱中的知识。为了解决这一问题，基于知识图谱的问答(KGQA)被提出。它的目标是针对终端用户的自然语言问题，通过对问题进行语义理解和解析，转换为结构化查询(例如SPARQL)，进而利用知识库进行查询推理，在结果中返回KG中的实体和/或谓词作为答案。其中，如何更加快速地确定出问题的答案，是一个热门问题。

技术实现思路

[0005]有鉴于此，本申请提供的图谱问答方法及装置、设备、存储介质，能够更加快速地确定出问题的答案，查找效率更高。
[0006]根据本申请实施例的一个方面，提供一种图谱问答方法，包括：通过已训练的K元匹配模型，将第一查询问题作为整体进行向量化处理，得到第一向量；其中，K大于0；通过所述K元匹配...

【技术保护点】

【技术特征摘要】
1.一种图谱问答方法，其特征在于，所述方法包括：通过已训练的K元匹配模型，将第一查询问题作为整体进行向量化处理，得到第一向量；其中，K大于0；通过所述K元匹配模型，确定所述第一向量分别与各个候选K元组的第二向量之间的第一相似度；其中，所述第二向量通过所述K元匹配模型预先将所述候选K元组作为整体进行向量化处理得到；以及从各个所述候选K元组中选出所述第一相似度满足条件的候选K元组作为目标K元组；将所述目标K元组中的实体作为答案输出。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：对第二查询问题进行数据增强，得到N个扩展查询问题；其中，所述第二查询问题与所述N个扩展查询问题的语义相同；N大于0；将所述第二查询问题和所述N个扩展查询问题均作为不同的样本查询问题，基于各个所述样本查询问题和所述第二查询问题对应的样本K元组，对初始K元匹配模型进行训练，得到所述已训练的K元匹配模型。3.根据权利要求2所述的方法，其特征在于，所述样本K元组包括正样本K元组和负样本K元组；其中，所述正样本K元组与所述第二查询问题之间的相似度大于第一阈值；所述负样本K元组与所述第二查询问题之间的相似度小于第二阈值；所述第一阈值大于或等于所述第二阈值；所述基于各个所述样本查询问题和所述第二查询问题对应的样本K元组，对初始K元匹配模型进行训练，包括：将所述样本查询问题作为整体、所述正样本K元组作为整体、所述负样本K元组作为整体分别进行向量化处理，得到各自对应的K元向量；确定所述样本查询问题的K元向量与所述正样本K元组的K元向量之间的第二相似度，以及所述样本查询问题的K元向量与所述负样本K元组的K元向量之间的第三相似度；根据所述第二相似度和所述第三相似度，确定所述初始K元匹配模型的第一损失函数；根据所述第一损失函数，对所述初始K元匹配模型进行反向训练；如此迭代，直至达到截止条件，得到所述已训练的K元匹配模型。4.根据权利要求3所述的方法，其特征在于，K大于1；所述根据所述第一损失函数，对所述初始K元匹配模型进行反向训练，包括：对所述样本查询问题中的第一头实体和第一关系分别进行向量化处理，得到各自对应的第三向量；对所述正样本K元组中的第二头实体、第二关系和第一尾实体分别进行向量化处理，得到各自对应的第四向量；以及，对所述负样本K元组中的第三头实体、第三关系和第二尾实体分别进行向量化处理，得到各自对应的第五向量；对所述样本查询问题中的第一关系对应的第三向量、所述正样本K元组中的第二关系对应的第四向量和所述负样本K元组中的第三关系对应的第五向量分别进行增强处理，得到所述样本查询问题的一元向量、所述正样本K元组的一元向量和所述负样本K元组的一元向量；根据所述样本查询问题的一元向量、所述正样本K元组的一元向量和所述负样本K元组
的一元向量，对所述初始K元匹配模型进行反向训练；如此迭代，直至达到截止条件，得到所述已训练的K元匹配模型。5.根据权利要求4所述的方法，其特征在于，所述根据所述样本查询问题的一元向量、所述正样本K元组的一元向量和所述负样本K元组的一元向量，对所述初始K元匹配模型进行反向训练，包括：确定所述样本查询问题的一元向量与所述正样本K元组的一元向量之间的第四相似度，以及所述样本查询问题的一元向量与所述负样本K元组的一元向量之间的第五相似度；根据所述第四相似度和所述第五相似度，确定所述初始K元匹配模型的第二损失函数；根据所述第一损失函数和所述第二损失函数，对所述初始K元匹配模型进行反向训练。6.根据权利要求4所述的方法，其特征在于，所述对所述样本查询问题中的第一关系对应的第三向量、所述正样本K元组中的第二关系对应的第四向量和所述负样本K元组中的第三关系对应的第五向量分别进行增强处理，得到所述样本查询问题的一元向量、所述正样本K元组的一元向量和所述负样本K元组的一元向量，包括：对所述第一头实体对应的第三向量、所述第二头实体对应的第四向量、所述第一尾实体对应的第四向量、所述第三头实体对应的第五向量和所述第二尾实体对应的第五向量分别进行噪声添加，得到各自对应的第一更新向量；联合...

【专利技术属性】
技术研发人员：马翠花，孟繁宇，邓超，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人