时序知识图谱补全方法及基于其的实体预测方法及其装置制造方法及图纸

技术编号:39043863 阅读:15 留言:0更新日期:2023-10-10 11:56
本申请提出了一种时序知识图谱补全方法及基于其的实体预测方法及其装置,涉及大数据技术领域,其中,该方法包括:获取待补全的时序知识图谱;获取待补全的时序知识图谱的头实体s、关系r以及时间戳t的嵌入表示;根据头实体s、关系r以及时间戳t的嵌入表示使用LorenTzE模型计算所有候选实体的得分,基于计算出的得分从候选实体中筛选出目标实体,并使用目标实体替代待补全的尾实体o,得到补全的时序知识图谱。采用上述方案的本申请具备更强的可解释性。性。性。

【技术实现步骤摘要】
时序知识图谱补全方法及基于其的实体预测方法及其装置


[0001]本申请涉及大数据
,尤其涉及时序知识图谱补全方法及基于其的实体预测方法及其装置。

技术介绍

[0002]知识图谱以的形式存储各种事实,其中是现实世界的关系,而和代表蕴含的头实体和尾实体。传统的知识图谱忽略了时间和事实成立之间的约束。换句话说,传统知识图谱中的三元组可能不会永远正确。 因此,引入时序知识图谱来对事实的动态属性进行建模。时序知识图谱中的每个事实都表示为四元组,表示在时间戳成立。
[0003]时序知识图谱也不可避免地存在事实缺失的问题,这产生了时序知识图谱补全的任务来推断时序图谱中缺失的事实,即给定查询,模型根据计算出的得分给出可能使该事实成立的候选实体集合。
[0004]现有大多数现有方法倾向于将静态知识图谱补全模型扩展到时序知识图谱补全,其只是通过将时间戳嵌入到低维空间中并在原评分函数的基础上,加入时间嵌入以此实现在推理过程中考虑时间信息。如TTransE与TA

TransE均是在TransE的基础上,利用了不同方式获得时间嵌入计算得分;HyTE则是基于TransH,利用时间嵌入确定超平面;ConT在每个时间戳下学习用于 Tucker 分解的张量核,以便捕获不同时间戳的信息。BoxTE则是在超关系知识图谱补全模型BoxE的基础上,将引入的时间嵌入合并到最终的实体嵌入中以提供针对关系的时序信息。尽管从实验角度上看,这类思路被证明是有效的,但在这些模型中时间的物理意义被严重忽视,这导致基于嵌入表示的补全模型的可解释性进一步变差。此外,对于一些以上述方式设计的知识图谱补全模型,其对不同关系性质的建模能力随着时间信息的引入受到了影响。

技术实现思路

[0005]本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
[0006]为此,本申请的第一个目的在于提出一种基于洛伦兹变换的时序知识图谱补全方法,解决了现有方法忽略时间的物理意义,导致可解释性变差的技术问题,通过从物理角度考虑时序知识补全,使模型具备较强的可解释性。
[0007]本申请的第二个目的在于提出一种基于时序知识图谱的实体预测方法。
[0008]本申请的第三个目的在于提出一种基于洛伦兹变换的时序知识图谱补全装置。
[0009]本申请的第四个目的在于提出一种基于时序知识图谱的实体预测装置。
[0010]为达上述目的,本申请第一方面实施例提出了一种基于洛伦兹变换的时序知识图谱补全方法,包括:获取待补全的时序知识图谱,其中,时序知识图谱的一组内容表示现实世界的一个事件,待补全的时序知识图谱的一组内容包括头实体s、现实世界的关系r、待补全的尾实体o和时间戳t,s表示事件中的第一方,o表示事件中的第二方,r表示事件中s对t
的关系,t表示与事件关联的时间;从已知的时序知识图谱中提取出于与实体s属于同组内容的所有其他实体,并将提取出的实体作为尾实体o的候选实体;获取待补全的时序知识图谱的头实体s、关系r以及时间戳t的嵌入表示;根据头实体s、关系r以及时间戳t的嵌入表示使用LorenTzE模型计算所有候选实体的得分,基于计算出的得分从候选实体中筛选出目标实体,并使用目标实体替代待补全的尾实体o,得到补全的时序知识图谱。
[0011]本申请实施例的基于洛伦兹变换的时序知识图谱补全方法,从物理学角度建模时序知识图谱补全任务,将实体视为不同坐标系中的点,将关系建模为连接不同坐标系间的洛伦兹变换,以此为基础构建了模型的整体计算框架,使得构建出的模型具有较强的可解释性。
[0012]可选地,在本申请的一个实施例中,获取待补全的时序知识图谱的头实体s、关系r以及时间戳t的嵌入表示,包括:使用关系r定义从头实体坐标系到尾实体坐标系的洛伦兹变换,并确定关系r的三个距离向量作为关系r的嵌入表示,其中,关系r的三个距离向量用于在尾实体的坐标系中进行平移;确定头实体s在自身坐标系下的三个空间坐标向量作为头实体s的嵌入表示;基于时间戳生成机制生成时间戳t的嵌入表示。
[0013]可选地,在本申请的一个实施例中,关系r定义出的洛伦兹变换由三个向量表示,分别表示头实体坐标系相对于尾实体坐标系的相对运动速度在x、y、z轴方向上的投影;关系r的三个距离向量由三个向量表示;头实体在自身坐标系下的三个空间坐标向量由三个向量表示;时间戳t的嵌入表示为:其中,表示实体e在时间戳t处的时间嵌入向量,为基于时间戳t定义出的变换矩阵,为基于实体e定义出的时间核心变量。
[0014]可选地,在本申请的一个实施例中,根据头实体s、关系r以及时间戳t的嵌入表示使用LorenTzE模型计算候选实体的得分,包括:从候选实体中确定待计算的候选实体,并确定待计算的候选实体在自身坐标系下的三个空间坐标向量;使用头实体的嵌入表示、时间戳的嵌入表示进行基于关系r的洛伦兹变换,得到头实体在尾实体坐标系中的嵌入表示;使用头实体在尾实体坐标系中的嵌入表示和待计算的候选实体在自身坐标系下的三个空间坐标向量计算出待计算的候选实体的分数,其中,分数包括空间得分和时序得分。
[0015]可选地,在本申请的一个实施例中,头实体在尾实体坐标系中的嵌入表示为:其中,为头实体s的三维向量,为通过时间戳生成机制得到的头实体在
时间戳t处的时间嵌入向量;空间得分表示为:其中,,,为关系r的三个距离向量,,,为待计算的候选实体在自身坐标系下的三个空间坐标向量,,,为头实体在尾实体坐标系中的嵌入表示;时序得分表示为:其中,为头实体在尾实体坐标系中的嵌入表示,表示通过时间戳生成机制得到的待计算的候选实体在时间戳t处的时间嵌入向量。
[0016]可选地,在本申请的一个实施例中,LorenTzE模型的空间损失表示为:其中,表示sigmoid函数;LorenTzE模型的时序损失表示为:其中,表示sigmoid函数;LorenTzE模型的总损失表示为:其中,为超参数,用来控制时序损失与空间损失的权重;LorenTzE模型的损失函数表示为其中,表示LorenTzE模型的总损失,表示负样本的数量。
[0017]为达上述目的,本申请第二方面实施例提出了一种基于时序知识图谱的实体预测方法,包括:获取待预测实体、待预测实体的现实世界的关系及关联时间;从已有时序知识图谱中筛选出与待预测实体相关的所有候选实体;获取待预测实体、待预测实体的现实世界的关系及关联时间的嵌入表示;将待预测实体、待预测实体的现实世界的关系及关联时间的嵌入表示输入训练好的LorenTzE模型中,输出所有候选实体的得分,基于得分对候选实体进行筛选,并将筛选出的候选实体作为目标实体。
[0018]为达上述目的,本申请第三方面实施例提出了一种基于洛伦兹变换的时序知识图谱补全装置,包括:第一获取模块、第二获取模块、第三获取模块、补全模块,其中,第一获取模块,用于获取待补全的时序知识图谱,其中,时序知识图谱的一组内容表示现实世界的一个事件,待补全的时序知识图谱的一组内容包括头实体s、现实世界的关系r、待补全的尾本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于洛伦兹变换的时序知识图谱补全方法,其特征在于,包括以下步骤:获取待补全的时序知识图谱,其中,时序知识图谱的一组内容表示现实世界的一个事件,所述待补全的时序知识图谱的一组内容包括头实体s、现实世界的关系r、待补全的尾实体o和时间戳t,s表示事件中的第一方,o表示事件中的第二方,r表示事件中s对t的关系,t表示与事件关联的时间;从已知的时序知识图谱中提取出于与实体s属于同组内容的所有其他实体,并将提取出的实体作为尾实体o的候选实体;获取所述待补全的时序知识图谱的头实体s、关系r以及时间戳t的嵌入表示;根据所述头实体s、关系r以及时间戳t的嵌入表示使用LorenTzE模型计算所有候选实体的得分,基于计算出的得分从候选实体中筛选出目标实体,并使用目标实体替代所述待补全的尾实体o,得到补全的时序知识图谱。2.如权利要求1所述的基于洛伦兹变换的时序知识图谱补全方法,其特征在于,所述获取所述待补全的时序知识图谱的头实体s、关系r以及时间戳t的嵌入表示,包括:使用关系r定义从头实体坐标系到尾实体坐标系的洛伦兹变换,并确定关系r的三个距离向量作为关系r的嵌入表示,其中,所述关系r的三个距离向量用于在尾实体的坐标系中进行平移;确定头实体s在自身坐标系下的三个空间坐标向量作为头实体s的嵌入表示;基于时间戳生成机制生成时间戳t的嵌入表示。3.如权利要求2所述的基于洛伦兹变换的时序知识图谱补全方法,其特征在于,所述关系r定义出的洛伦兹变换由三个向量表示,分别表示头实体坐标系相对于尾实体坐标系的相对运动速度在x、y、z轴方向上的投影;所述关系r的三个距离向量由三个向量表示;所述头实体s在自身坐标系下的三个空间坐标向量由三个向量表示;所述时间戳t的嵌入表示为:其中,表示实体e在时间戳t处的时间嵌入向量,为基于时间戳t定义出的变换矩阵,为基于实体e定义出的时间核心变量。4.如权利要求3所述的基于洛伦兹变换的时序知识图谱补全方法,其特征在于,根据所述头实体s、关系r以及时间戳t的嵌入表示使用LorenTzE模型计算候选实体的得分,包括:从所述候选实体中确定待计算的候选实体,并确定待计算的候选实体在自身坐标系下的三个空间坐标向量;使用头实体的嵌入表示、时间戳的嵌入表示进行基于所述关系r的洛伦兹变换,得到头实体在尾实体坐标系中的嵌入表示;使用头实体在尾实体坐标系中的嵌入表示和待计算的候选实体在自身坐标系下的三个空间坐标向量计算出待计算的候选实体的分数,其中,所述分数包括空间得分和时序得分。5.如权利要求4所述的基于洛伦兹变换的时序知识图谱补全方法,其特征在于,所述头
实体在尾实体坐标系中的嵌入表示为:其中,为头实体s的三维向量,为通过时间戳生成机制得到的头实体在时间戳t处的时间嵌入向量;所述空间得分表示为:其中,,,为关系r的三个距离向量,,,为待计算的候选实体在自身坐标系下的三个空间坐标向量,,,为头实体在尾实体坐标系中的嵌入表示;所述时序得分表示为:其中,为头实体在尾实体坐标系中的嵌入表示,表示通过时间戳生成机制得到的待计算的候选实体在时间戳t处的时间嵌入向量。6.如权利要求5所述的基于洛伦兹变换的时序知识图谱补全...

【专利技术属性】
技术研发人员:鄂海红李泞原宋美娜林学渊
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1