一种结合内部与外部知识图谱的安全多跳问答方法及系统技术方案

技术编号:38148762 阅读:9 留言:0更新日期:2023-07-13 09:12
本发明专利技术提供了一种结合内部与外部知识图谱的安全多跳问答方法及系统,属于多跳问答领域,根据内部知识图谱与外部知识图谱进行联合训练,构建联合表示学习子系统;基于所述联合表示学习子系统,获取实体表示与关系表示;基于所述内部知识图谱,通过语言编码模型与序列编码模型,构建问题编码解码子系统;获取多跳推理路径;基于所述多跳推理路径,以及,所述联合表示学习子系统所获取的所述实体表示与所述关系表示,构建安全知识检索子系统;当从私人端向所述安全知识检索子系统输入多跳问题,获取所述多跳问题对应的正确答案。通过本发明专利技术提供的方法,不仅可以在保证隐私的情况下实现在多个知识图谱上完成问答推理,还可以提高查询效率。询效率。询效率。

【技术实现步骤摘要】
一种结合内部与外部知识图谱的安全多跳问答方法及系统


[0001]本专利技术属于多跳问答领域,具体涉及一种结合内部与外部知识图谱的安全多跳问答方法及系统。

技术介绍

[0002]知识图谱(Knowledge Graph)通过三元组的形式结构化存储海量的信息,将互联网数据表达成客观可认知的语义表示,具有强大的语义表达能力。基于知识图谱的问答系统利用其丰富的结构化信息,通过理解用户的自然语言问题,给出准确的答案,在医疗、金融、电商等多个领域都显示出了重要的应用价值。而在实际应用场景中,用户更倾向于表达复杂的多跳问题,因此多跳问答的研究是一项重要的任务。
[0003]而私人构建的知识图谱往往是不完整的,这是由于构建知识图谱本身是一件极具挑战性的工作,例如本体设计,知识标注都需要专家知识作为支撑,训练知识抽取模型需要一定的成本。因此针对用户的复杂问题进行推理时容易受到很大的限制,例如当单一知识图谱中不包含能够定位答案的正确推理路径或用户所期待的答案时,依赖单一知识图谱很难得到正确的答案。

技术实现思路

[0004]鉴于上述问题,本专利技术实施例提供了一种结合内部与外部知识图谱的安全多跳问答方法、系统、电子设备及存储介质,以便克服上述问题或者至少部分地解决上述问题。
[0005]本专利技术实施例第一方面,提供了一种结合内部与外部知识图谱的安全多跳问答方法,所述方法包括:
[0006]根据内部知识图谱与外部知识图谱进行联合训练,构建联合表示学习子系统;
[0007]基于所述联合表示学习子系统,获取实体表示与关系表示;其中,所述实体表示包括所述内部知识图谱的内部实体表示与所述外部知识图谱的外部实体表示,所述关系表示包括所述内部知识图谱的内部关系表示与所述外部知识图谱的外部关系表示;
[0008]基于所述内部知识图谱,通过语言编码模型与序列编码模型,构建问题编码解码子系统;
[0009]基于所述问题编码解码子系统,获取多跳推理路径;
[0010]基于所述多跳推理路径,以及,所述联合表示学习子系统所获取的所述实体表示与所述关系表示,构建安全知识检索子系统;
[0011]当从私人端向所述安全知识检索子系统输入多跳问题,获取所述多跳问题对应的正确答案。
[0012]可选地,所述根据内部知识图谱与外部知识图谱进行联合训练,构建联合表示学习子系统,包括:
[0013]获取所述内部知识图谱的内部关系列表,以及所述外部知识图谱的外部关系列表;
[0014]基于所述内部关系列表与所述外部关系列表,获取公有关系列表;
[0015]基于所述公有关系列表,通过正交普鲁克问题构建联合表示学习子系统。
[0016]可选地,所述基于所述联合表示学习子系统,获取实体表示与关系表示,包括:
[0017]基于所述联合表示学习子系统,构建实体与公有关系的约束条件;
[0018]基于所述约束条件,获取关系生成因子;
[0019]基于所述关系生成因子,获取计算关系嵌入矩阵;
[0020]基于所述关系嵌入矩阵与所述约束条件进行训练,获取所述实体表示与所述关系表示。
[0021]可选地,所述基于所述内部知识图谱,通过语言编码模型与序列编码模型,构建问题编码解码子系统,包括:
[0022]基于所述内部知识图谱,获取问答训练数据;
[0023]基于所述问答训练数据,抽取自然语言问题与对应的主题实体及答案;
[0024]基于所述自然语言问题,通过所述语言编码模型与所述序列编码模型,获取所述自然语言问题的预测路径;
[0025]基于所述主题实体及所述答案,以所述内部知识图谱中的最短路径为弱监督标签,生成所述主题实体与所述答案的关系序列;其中,在所述内部知识图谱中存在多个相同最短路径的情况下,以出现频率最高的所述最短路径为所述弱监督标签;
[0026]基于所述预测路径与所述关系序列,更新所述语言编码模型与所述序列编码模型;
[0027]基于更新后的所述语言编码模型与所述序列编码模型,构建所述问题编码解码子系统。
[0028]可选地,基于所述多跳推理路径,以及,所述联合表示学习子系统所获取的所述实体表示与所述关系表示,构建安全知识检索子系统,包括:
[0029]对所述实体表示与所述关系表示进行乘积量化压缩,获取乘积量化码书;
[0030]基于所述实体表示,获取所述实体表示对应的倒排索引;
[0031]基于所述倒排索引,获取所述倒排索引对应向量列表集合;
[0032]基于所述多跳推理路径,以及所述向量列表集合、所述倒排索引、所述乘积量化码书,构建所述安全知识检索子系统。
[0033]可选地,当从私人端向所述安全知识检索子系统输入多跳问题时,所述安全知识检索子系统输出所述多跳问题对应的正确答案,包括:
[0034]基于所述安全知识检索子系统,将所述多跳问题转化为多个查询向量;
[0035]通过对所述多个查询向量进行距离计算与非对称距离计算,获取多个所述查询向量对应的最近邻实体嵌入表示;
[0036]基于所述最近邻实体嵌入表示,获取所述正确答案。
[0037]本专利技术实施例第二方面,提供了一种结合内部与外部知识图谱的安全多跳问答系统,所述系统包括:
[0038]第一构建模块,用于根据内部知识图谱与外部知识图谱进行联合训练,构建联合表示学习子系统;
[0039]第一获取模块,用于基于所述联合表示学习子系统,获取实体表示与关系表示;其
中,所述实体表示包括所述内部知识图谱的内部实体表示与所述外部知识图谱的外部实体表示,所述关系表示包括所述内部知识图谱的内部关系表示与所述外部知识图谱的外部关系表示;
[0040]第二构建模块,用于基于所述内部知识图谱,通过语言编码模型与序列编码模型,构建问题编码解码子系统;
[0041]第二获取模块,用于基于所述问题编码解码子系统,获取多跳推理路径;
[0042]第三构建模块,用于基于所述多跳推理路径,以及,所述联合表示学习子系统所获取的所述实体表示与所述关系表示,构建安全知识检索子系统;
[0043]第三获取模块,用于当从私人端向所述安全知识检索子系统输入多跳问题,获取所述多跳问题对应的正确答案。
[0044]可选地,第一构建模块,包括:
[0045]第一构建子模块,用于获取所述内部知识图谱的内部关系列表,以及所述外部知识图谱的外部关系列表;
[0046]基于所述内部关系列表与所述外部关系列表,获取公有关系列表;
[0047]基于所述公有关系列表,通过正交普鲁克问题构建联合表示学习子系统。
[0048]可选地,第一获取模块,包括:
[0049]第一获取子模块,用于基于所述联合表示学习子系统,构建实体与公有关系的约束条件;
[0050]基于所述约束条件,获取关系生成因子;
[0051]基于所述关系生成因子,获取计本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种结合内部与外部知识图谱的安全多跳问答方法,其特征在于,所述方法包括:根据内部知识图谱与外部知识图谱进行联合训练,构建联合表示学习子系统;基于所述联合表示学习子系统,获取实体表示与关系表示;其中,所述实体表示包括所述内部知识图谱的内部实体表示与所述外部知识图谱的外部实体表示,所述关系表示包括所述内部知识图谱的内部关系表示与所述外部知识图谱的外部关系表示;基于所述内部知识图谱,通过语言编码模型与序列编码模型,构建问题编码解码子系统;基于所述问题编码解码子系统,获取多跳推理路径;基于所述多跳推理路径,以及,所述联合表示学习子系统所获取的所述实体表示与所述关系表示,构建安全知识检索子系统;当从私人端向所述安全知识检索子系统输入多跳问题,获取所述多跳问题对应的正确答案。2.根据权利要求1所述的方法,其特征在于,所述根据内部知识图谱与外部知识图谱进行联合训练,构建联合表示学习子系统,包括:获取所述内部知识图谱的内部关系列表,以及所述外部知识图谱的外部关系列表;基于所述内部关系列表与所述外部关系列表,获取公有关系列表;基于所述公有关系列表,通过正交普鲁克问题构建联合表示学习子系统。3.根据权利要求1所述的方法,其特征在于,所述基于所述联合表示学习子系统,获取实体表示与关系表示,包括:基于所述联合表示学习子系统,构建实体与公有关系的约束条件;基于所述约束条件,获取关系生成因子;基于所述关系生成因子,获取计算关系嵌入矩阵;基于所述关系嵌入矩阵与所述约束条件进行训练,获取所述实体表示与所述关系表示。4.根据权利要求1所述的方法,其特征在于,所述基于所述内部知识图谱,通过语言编码模型与序列编码模型,构建问题编码解码子系统,包括:基于所述内部知识图谱,获取问答训练数据;基于所述问答训练数据,抽取自然语言问题与对应的主题实体及答案;基于所述自然语言问题,通过所述语言编码模型与所述序列编码模型,获取所述自然语言问题的预测路径;基于所述主题实体及所述答案,以所述内部知识图谱中的最短路径为弱监督标签,生成所述主题实体与所述答案的关系序列;其中,在所述内部知识图谱中存在多个相同最短路径的情况下,以出现频率最高的所述最短路径为所述弱监督标签;基于所述预测路径与所述关系序列,更新所述语言编码模型与所述序列编码模型;基于更新后的所述语言编码模型与所述序列编码模型,构建所述问题编码解码子系统。5.根...

【专利技术属性】
技术研发人员:王平辉蔡林熹
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1