时序知识图谱补全方法及基于其的实体预测方法及其装置制造方法及图纸

技术编号：39043863 阅读：15 留言：0更新日期：2023-10-10 11:56

本申请提出了一种时序知识图谱补全方法及基于其的实体预测方法及其装置，涉及大数据技术领域，其中，该方法包括：获取待补全的时序知识图谱；获取待补全的时序知识图谱的头实体s、关系r以及时间戳t的嵌入表示；根据头实体s、关系r以及时间戳t的嵌入表示使用LorenTzE模型计算所有候选实体的得分，基于计算出的得分从候选实体中筛选出目标实体，并使用目标实体替代待补全的尾实体o，得到补全的时序知识图谱。采用上述方案的本申请具备更强的可解释性。性。性。

全部详细技术资料下载

【技术实现步骤摘要】
时序知识图谱补全方法及基于其的实体预测方法及其装置

[0001]本申请涉及大数据
，尤其涉及时序知识图谱补全方法及基于其的实体预测方法及其装置。

技术介绍

[0002]知识图谱以的形式存储各种事实，其中是现实世界的关系，而和代表蕴含的头实体和尾实体。传统的知识图谱忽略了时间和事实成立之间的约束。换句话说，传统知识图谱中的三元组可能不会永远正确。因此，引入时序知识图谱来对事实的动态属性进行建模。时序知识图谱中的每个事实都表示为四元组，表示在时间戳成立。
[0003]时序知识图谱也不可避免地存在事实缺失的问题，这产生了时序知识图谱补全的任务来推断时序图谱中缺失的事实，即给定查询，模型根据计算出的得分给出可能使该事实成立的候选实体集合。
[0004]现有大多数现有方法倾向于将静态知识图谱补全模型扩展到时序知识图谱补全，其只是通过将时间戳嵌入到低维空间中并在原评分函数的基础上，加入时间嵌入以此实现在推理过程中考虑时间信息。如TTransE与TA
‑
TransE均是在TransE的基础上，利用了不同方式获得时间嵌入计算得分；HyTE则是基于TransH，利用时间嵌入确定超平面；ConT在每个时间戳下学习用于 Tucker 分解的张量核，以便捕获不同时间戳的信息。BoxTE则是在超关系知识图谱补全模型BoxE的基础上，将引入的时间嵌入合并到最终的实体嵌入中以提供针对关系的时序信息。尽管从实验角度上看，这类思路被证明是有效的，但在这些模型中时间的物理意义被严重忽视，这导致基于嵌入表示的补全...

【技术保护点】

【技术特征摘要】
1.一种基于洛伦兹变换的时序知识图谱补全方法，其特征在于，包括以下步骤：获取待补全的时序知识图谱，其中，时序知识图谱的一组内容表示现实世界的一个事件，所述待补全的时序知识图谱的一组内容包括头实体s、现实世界的关系r、待补全的尾实体o和时间戳t，s表示事件中的第一方，o表示事件中的第二方，r表示事件中s对t的关系，t表示与事件关联的时间；从已知的时序知识图谱中提取出于与实体s属于同组内容的所有其他实体，并将提取出的实体作为尾实体o的候选实体；获取所述待补全的时序知识图谱的头实体s、关系r以及时间戳t的嵌入表示；根据所述头实体s、关系r以及时间戳t的嵌入表示使用LorenTzE模型计算所有候选实体的得分，基于计算出的得分从候选实体中筛选出目标实体，并使用目标实体替代所述待补全的尾实体o，得到补全的时序知识图谱。2.如权利要求1所述的基于洛伦兹变换的时序知识图谱补全方法，其特征在于，所述获取所述待补全的时序知识图谱的头实体s、关系r以及时间戳t的嵌入表示，包括：使用关系r定义从头实体坐标系到尾实体坐标系的洛伦兹变换，并确定关系r的三个距离向量作为关系r的嵌入表示，其中，所述关系r的三个距离向量用于在尾实体的坐标系中进行平移；确定头实体s在自身坐标系下的三个空间坐标向量作为头实体s的嵌入表示；基于时间戳生成机制生成时间戳t的嵌入表示。3.如权利要求2所述的基于洛伦兹变换的时序知识图谱补全方法，其特征在于，所述关系r定义出的洛伦兹变换由三个向量表示，分别表示头实体坐标系相对于尾实体坐标系的相对运动速度在x、y、z轴方向上的投影；所述关系r的三个距离向量由三个向量表示；所述头实体s在自身坐标系下的三个空间坐标向量由三个向量表示；所述时间戳t的嵌入表示为：其中，表示实体e在时间戳t处的时间嵌入向量，为基于时间戳t定义出的变换矩阵，为基于实体e定义出的时间核心变量。4.如权利要求3所述的基于洛伦兹变换的时序知识图谱补全方法，其特征在于，根据所述头实体s、关系r以及时间戳t的嵌入表示使用LorenTzE模型计算候选实体的得分，包括：从所述候选实体中确定待计算的候选实体，并确定待计算的候选实体在自身坐标系下的三个空间坐标向量；使用头实体的嵌入表示、时间戳的嵌入表示进行基于所述关系r的洛伦兹变换，得到头实体在尾实体坐标系中的嵌入表示；使用头实体在尾实体坐标系中的嵌入表示和待计算的候选实体在自身坐标系下的三个空间坐标向量计算出待计算的候选实体的分数，其中，所述分数包括空间得分和时序得分。5.如权利要求4所述的基于洛伦兹变换的时序知识图谱补全方法，其特征在于，所述头
实体在尾实体坐标系中的嵌入表示为：其中，为头实体s的三维向量，为通过时间戳生成机制得到的头实体在时间戳t处的时间嵌入向量；所述空间得分表示为：其中，，，为关系r的三个距离向量，，，为待计算的候选实体在自身坐标系下的三个空间坐标向量，，，为头实体在尾实体坐标系中的嵌入表示；所述时序得分表示为：其中，为头实体在尾实体坐标系中的嵌入表示，表示通过时间戳生成机制得到的待计算的候选实体在时间戳t处的时间嵌入向量。6.如权利要求5所述的基于洛伦兹变换的时序知识图谱补全...

【专利技术属性】
技术研发人员：鄂海红，李泞原，宋美娜，林学渊，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人