System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种知识图谱补全模型简化方法及系统技术方案_技高网

一种知识图谱补全模型简化方法及系统技术方案

技术编号:41236964 阅读:2 留言:0更新日期:2024-05-09 23:50
本发明专利技术涉及一种知识图谱补全模型简化方法,具体为:首先将原始知识图谱中的初始元素映射到统一的语义空间中进行初始化处理,得到初始元素在语义空间中对应的初始向量;然后基于构建的坍缩知识图谱,对原始知识图谱进行处理,得到锚实体A以及第二概念集合;其次以锚实体、第二概念集合以及初始关系集合,生成词表;最后通过目标架构框架,基于词表,以及锚实体与目标实体的距离向量,对目标实体进行更新,生成目标实体向量,并通过对三元组中的缺失元素进行推理,输出推理结果。应用本说明书实施例提供的方法,可以实现在降低知识图谱补全模型参数规模的情况下,尽可能保障知识图谱补全模型的性能,实现对传统知识图谱补全模型的简化。

【技术实现步骤摘要】

本专利技术涉及数据处理,尤其涉及一种知识图谱补全模型简化方法。


技术介绍

1、知识图谱(即knowledge graph,kg)是真实世界知识的集合,表示为一组(h,r,t)形式的三元组,其中,三元组中h、r、t分别表示头实体、关系类型和尾实体。

2、随着知识图谱的不断发展,在各种知识驱动的人工智能应用和场景中,知识图谱做出了重大贡献,如自动问答、机器阅读、信息检索、对话系统等。由于对高质量知识的需求越来越大,知识图谱的完整性和可靠性也变得越来越重要。因此,知识图补全(即knowledgegraph completion,kgc)已经被广泛研究和关注,不仅被用于推理知识图谱中缺失的关系中,还被用于识别知识图谱中的三元组是否有效。

3、近年来,各种知识图谱补全模型已被广泛开发和应用于知识推理和预测任务,并在许多面向知识图谱的应用任务中取得了有竞争力的性能,显示了其捕捉关系事实和利用异构信息建模不同场景的能力。这些模型通常将三元组中的实体和关系表示为实数向量,并用这些向量评估三元组的合理性。

4、因此,传统的知识图谱补全模型通常将每个实体映射成一个唯一的多维向量、将每个关系映射成一个唯一的多维向量。然而,这种策略会导致存储向量矩阵的内存消耗增加,并且在建模真实世界的知识图谱时会产生高计算成本,特别是在知识图谱中实体和关系的数量量级比较大的情况下。

5、有鉴于此,如何提供一种知识图谱补全模型简化方法,在简化实体表示的参数规模的基础上,仍保持原始知识图谱补全模型的性能,成为亟需解决的问题。


技术实现思路

1、本专利技术提供一种知识图谱补全模型简化方法,一种知识图谱补全模型简化系统,一种知识图谱补全模型简化装置,一种电子设备,以及一种计算机可读存储介质,用以至少提供解决在简化实体表示的参数规模的基础上,仍保持原始知识图谱补全模型的性能的问题。

2、根据本专利技术实施例的第一方面,提供一种知识图谱补全模型简化方法,包括:

3、将原始知识图谱中的初始元素映射到统一的语义空间中进行初始化处理,得到所述初始元素在所述语义空间中对应的初始向量,其中,所述初始向由初始实体集合、初始关系集合和第一概念集合构成;

4、基于构建的坍缩知识图谱,对所述原始知识图谱进行处理,得到锚实体以及第二概念集合,其中,所述锚实体与所述锚实体对应的概念构成的参数规模不大于所述初始实体集合的参数规模;所述第二概念集合为在所述第一概念集合中,根据与所述锚实体对应的概念的相关性排序,获取的相关性符合预设条件,且引入外部语义知识库后得到的概念集合;

5、以所述锚实体、所述第二概念集合以及所述初始关系集合,生成词表;

6、通过目标架构框架,基于所述词表,以及所述锚实体与目标实体的距离向量,对所述目标实体进行更新,生成目标实体向量,并通过对三元组中的缺失元素进行推理,输出推理结果。

7、根据本专利技术实施例的第二方面,提供一种知识图谱补全模型简化系统,包括:

8、初始化模块,用于将原始知识图谱中的初始元素映射到统一的语义空间中进行初始化处理,得到所述初始元素在所述语义空间中对应的初始向量,其中,所述初始向由初始实体集合、初始关系集合和第一概念集合构成;

9、坍缩图谱构建模块,用于基于构建的坍缩知识图谱,对所述原始知识图谱进行处理,得到锚实体以及第二概念集合,其中,所述锚实体与所述锚实体对应的概念构成的参数规模不大于所述初始实体集合的参数规模;所述第二概念集合为在所述第一概念集合中,根据与所述锚实体对应的概念的相关性排序,获取的相关性符合预设条件,且引入外部语义知识库后得到的概念集合;

10、词表生成模块,用于以所述锚实体、所述第二概念集合以及所述初始关系集合,生成词表;

11、更新推理模块,用于通过目标架构框架,基于所述词表,以及所述锚实体与目标实体的距离向量,对所述目标实体进行更新,生成目标实体向量,并通过对三元组中的缺失元素进行推理,输出推理结果。

12、根据本专利技术实施例的第三方面,提供一种知识图谱补全模型简化装置,包括:

13、初始化模块,被配置为将原始知识图谱中的初始元素映射到统一的语义空间中进行初始化处理,得到所述初始元素在所述语义空间中对应的初始向量,其中,所述初始向由初始实体集合、初始关系集合和第一概念集合构成;

14、坍缩图谱构建模块,被配置为基于构建的坍缩知识图谱,对所述原始知识图谱进行处理,得到锚实体以及第二概念集合,其中,所述锚实体与所述锚实体对应的概念构成的参数规模不大于所述初始实体集合的参数规模;所述第二概念集合为在所述第一概念集合中,根据与所述锚实体对应的概念的相关性排序,获取的相关性符合预设条件,且引入外部语义知识库后得到的概念集合;

15、词表生成模块,被配置为以所述锚实体、所述第二概念集合以及所述初始关系集合,生成词表;

16、更新推理模块,被配置为通过目标架构框架,基于所述词表,以及所述锚实体与目标实体的距离向量,对所述目标实体进行更新,生成目标实体向量,并通过对三元组中的缺失元素进行推理,输出推理结果。

17、根据本说明书实施例的第四方面,提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如本说明书实施例第一方面所述的知识图谱补全模型简化方法的步骤。

18、根据本说明书实施例的第五方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有信息传递的实现程序,所述程序被处理器执行时实现如本说明书实施例第一方面所述的知识图谱补全模型简化方法的步骤。

19、根据本说明书实施例提供的一种知识图谱补全模型简化方法,首先将原始知识图谱中的初始元素映射到统一的语义空间中进行初始化处理,得到所述初始元素在所述语义空间中对应的初始向量;然后基于构建的坍缩知识图谱,对所述原始知识图谱进行处理,得到锚实体a以及第二概念集合,其中,所述锚实体与所述锚实体对应的概念构成的参数规模不大于所述初始实体集合的参数规模;所述第二概念集合为在所述第一概念集合中,根据与所述锚实体对应的概念的相关性排序,获取的相关性符合预设条件,且引入外部语义知识库后得到的概念集合;其次以所述锚实体、所述第二概念集合以及所述初始关系集合,生成词表;最后通过目标架构框架,基于所述词表,以及所述锚实体与目标实体的距离向量,对所述目标实体进行更新,生成目标实体向量,并通过对三元组中的缺失元素进行推理,输出推理结果。

20、应用本说明书实施例提供的方法,以坍缩知识图谱模型得到的锚实体和第二概念集合置换原始知识图谱中的初始实体集合,实现对知识图谱补全模型的简化,一方面“做减法(剔除)”,即大幅度降低实体向量的数量;另一方面“做加法(补充)”,即引入外部语义知识库中高质量、离散化、结构化的概念,来弥补上述“做减法”带来的知识图谱补全准确率的损失;最终实现本文档来自技高网...

【技术保护点】

1.一种知识图谱补全模型简化方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于构建的坍缩知识图谱,对所述原始知识图谱进行处理,得到锚实体以及第二概念集合,包括:

3.根据权利要求1所述的方法,其特征在于,所述以所述锚实体、所述第二概念集合以及所述初始关系集合,生成词表,包括:

4.根据权利要求1所述的方法,其特征在于,所述通过目标架构框架,基于所述词表,以及所述锚实体与目标实体的距离向量,对所述目标实体进行更新,生成目标实体向量,包括:

5.根据权利要求1所述的方法,其特征在于,所述缺失关系包括:缺失头实体、缺失尾实体、以及缺失关系;

6.根据权利要求5所述的方法,其特征在于,所述通过对三元组中的缺失元素进行推理,输出推理结果,包括:

7.根据权利要求5所述的方法,其特征在于,所述通过对三元组中的缺失元素进行推理,输出推理结果,包括:

8.一种知识图谱补全模型简化系统,其特征在于,包括:

9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1-7中任一项所述方法的步骤。

10.一种计算机存储介质,其特征在于,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-7中任一项所述方法对应的步骤。

...

【技术特征摘要】

1.一种知识图谱补全模型简化方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于构建的坍缩知识图谱,对所述原始知识图谱进行处理,得到锚实体以及第二概念集合,包括:

3.根据权利要求1所述的方法,其特征在于,所述以所述锚实体、所述第二概念集合以及所述初始关系集合,生成词表,包括:

4.根据权利要求1所述的方法,其特征在于,所述通过目标架构框架,基于所述词表,以及所述锚实体与目标实体的距离向量,对所述目标实体进行更新,生成目标实体向量,包括:

5.根据权利要求1所述的方法,其特征在于,所述缺失关系包括:缺失头实体、缺失尾实体、以及缺失关系;

6.根...

【专利技术属性】
技术研发人员:王亚珅欧阳小叶郭大宇朱小伶白然
申请(专利权)人:中国电子科技集团有限公司电子科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1