基于时间关系感知的时序知识图谱补全方法技术

技术编号:39521894 阅读:21 留言:0更新日期:2023-11-25 19:01
本发明专利技术公开了基于时间关系感知的时序知识图谱补全方法,所述方法包括:实体

【技术实现步骤摘要】
基于时间关系感知的时序知识图谱补全方法


[0001]本专利技术涉及深度学习和知识图谱
,尤其涉及一种基于时间关系感知的时序知识图谱补全方法


技术介绍

[0002]时序知识图谱是指在知识图谱的基础上,引入时间信息,描述实体之间在不同时间点上的关系和演化过程的一种扩展形式

它可以用于描述实体之间的历史和未来的关系,反映实体之间的演化过程和动态变化,具有广泛的应用价值

时序知识图谱知识表示是指将时序知识图谱中的实体

关系和时间信息转化为低维嵌入向量,以便于计算机进行处理和应用的过程

[0003]当前的知识表示方法往往仅利用知识的可信度评分函数进行训练,却忽略了时间信息天然具备的时间关系,这有可能导致依赖于这些知识表示方法的下游模型发生一些常识性错误,如“之前”和“之后”等时间关系的错判

如何利用时间信息天然具备的时间关系,优化出更具备时间关系判别性的知识嵌入特征表示,是一个有研究价值和应用价值的问题

[0004]近年来,研究者们构建了各种各样的大规模的知识图谱

虽然它们已经在多个领域取得了显著的成绩,但是在实际应用中,知识覆盖率不足一直是一个令人头疼的问题

那么,如何在已有知识中通过学习得到新的知识,从而对知识图谱进行补全,成为了一种有效手段

并且,在学习的过程中,知识图谱补全检验了模型的推理能力

在时序知识图谱在进行补全工作对于时序知识图谱的研究和利用具有非常重要的实践意义


技术实现思路

[0005]本专利技术旨在至少解决现有技术中存在的技术问题之一

为此,本专利技术公开了基于时间关系感知的时序知识图谱补全方法

所述方法能够实现将时序知识图谱中的实体

关系和时间信息转化为低维嵌入向量,以便于计算机进行处理,相比现有方法,本方法创新性提出了时间关系感知模块,能够建模出更具时间判别性的时间嵌入特征表示

[0006]本专利技术的目的是通过如下技术方案实现的,基于时间关系感知的时序知识图谱补全方法,所述方法包括:步骤1,初始化实体嵌入特征

关系嵌入特征和时间嵌入特征;步骤2,构建时间四元组可信度评分函数,计算时间四元组可信度损失函数;步骤3,构建时间关系感知模块,计算时间关系感知损失函数;步骤4,对时间四元组可信度损失函数和时间关系感知损失函数计算联合损失函数,采用联合损失函数来优化实体的嵌入特征表示

关系的嵌入特征表示和时间的嵌入特征表示;步骤5,设计规则获得目标实体和候选实体;步骤6,根据优化后的实体的嵌入特征表示

关系的嵌入特征表示和时间的嵌入特
征表示,计算候选实体的与目标实体的时间四元组可信度评分函数,根据候选实体的与目标实体的时间四元组可信度评分函数补全图谱

[0007]具体地,所述的初始化实体嵌入特征

关系嵌入特征和时间嵌入特征,包括以下步骤:步骤
101
,将实体嵌入特征建模为
d
维复数,并使用标准正态分布对实体嵌入特征进行初始化;具体而言,对于每个实体,使用一个2×
d
维向量来表示嵌入特征,其中,前
d
维表示实部,后
d
维表示虚部,即:;其中,和分别表示第
i
个实体的实部和虚部,表示
d
维复数空间,有
N
个实体,则实体嵌入特征矩阵的大小为
N
×
2d
,表达式为:;使用标准正态分布对进行初始化,表达式为:;其中,表示实体嵌入特征矩阵中第
i
个实体的第
j
个嵌入特征;将实体嵌入特征矩阵拆分为实部和虚部两个矩阵,表达式为:;;其中,表示实体嵌入特征矩阵的实部矩阵,表示实体嵌入特征矩阵的虚部矩阵;步骤
102
,关系嵌入特征初始化;将关系嵌入特征建模为
d
维复数,并使用标准正态分布对关系嵌入特征进行初始化;具体而言,对于每个关系,使用一个2×
d
维向量来表示嵌入特征,其中前
d
维表示实部,后
d
维表示虚部,即:;其中,和分别表示第
i
个关系的实部和虚部,有
M
个关系,则关系嵌入特征矩阵
R
的大小为
M
×
2d
,表达式为:;使用标准正态分布对进行初始化,表达式为:;其中,表示关系嵌入特征矩阵
R
中第
i
个关系的第
j
个嵌入特征;将关系嵌入特征矩阵
R
拆分为实部和虚部两个矩阵,表达式为:;;其中,表示关系嵌入特征矩阵
R
的实部矩阵,表示关系嵌入特征矩阵的虚部矩阵;步骤
103
,时间嵌入特征初始化;将时间嵌入特征建模为
d
维复数,并使用标准正态分布对其进行初始化;具体而言,对于每个时间,使用一个2×
d
维向量来表示嵌入特征,其中前
d
维表示实部,后
d
维表示虚部,表达式为:
;其中,和分别表示第
i
个时间的实部和虚部,有
L
个时间,则时间嵌入特征矩阵
T
的大小为
L
×
2d
,表达式为:;使用标准正态分布对
T
进行初始化,表达式为:;其中,表示时间嵌入特征矩阵
T
中第
i
个时间的第
j
个嵌入特征;将时间嵌入矩阵
T
拆分为实部和虚部两个矩阵,即:;;其中,表示时间嵌入特征矩阵
T
的实部矩阵,表示时间嵌入特征矩阵
T
的虚部矩阵

[0008]所述的构建时间四元组可信度评分函数,计算时间四元组可信度损失函数,包含以下步骤:对于时间四元组,其中是关系主体,是关系客体,是关系,是时间;时间四元组对应的嵌入特征四元组表示为,和分别为和的嵌入特征,为关系的嵌入特征,为时间的嵌入特征,时间四元组的可信度评分函数为函数,即:;其中,是的共轭复数;从时序知识图谱中采样出个时间四元组作为正样本的子集,随机构造出个时间四元组作为负样本的集合,计算时间四元组可信度损失函数,表达式如下:;其中,和是超参数

[0009]具体地,所述的构建时间关系感知模块,计算时间关系感知损失函数,包含如下步骤:从时序知识图谱中采样出个时间四元组,第个时间四元组的时间表示为,对应的嵌入特征表示为,第个时间四元组的时间表示为,对应的嵌入特征表示为,根据和的时间跨度,将时间关系分为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
基于时间关系感知的时序知识图谱补全方法,其特征在于,所述方法包括:步骤1,初始化实体嵌入特征

关系嵌入特征和时间嵌入特征;步骤2,构建时间四元组可信度评分函数,计算时间四元组可信度损失函数;步骤3,构建时间关系感知模块,计算时间关系感知损失函数;步骤4,对时间四元组可信度损失函数和时间关系感知损失函数计算联合损失函数,采用联合损失函数来优化实体的嵌入特征表示

关系的嵌入特征表示和时间的嵌入特征表示;步骤5,设计规则获得目标实体和候选实体;步骤6,根据优化后的实体的嵌入特征表示

关系的嵌入特征表示和时间的嵌入特征表示,计算候选实体的与目标实体的时间四元组可信度评分函数,根据候选实体的与目标实体的时间四元组可信度评分函数补全图谱
。2.
根据权利要求1所述的基于时间关系感知的时序知识图谱补全方法,其特征在于,所述的初始化实体嵌入特征

关系嵌入特征和时间嵌入特征,包括以下步骤:步骤
101
,将实体嵌入特征建模为
d
维复数,并使用标准正态分布对实体嵌入特征进行初始化;具体而言,对于每个实体,使用一个2×
d
维向量来表示嵌入特征,其中,前
d
维表示实部,后
d
维表示虚部,即:;其中,和分别表示第
i
个实体的实部和虚部,表示
d
维复数空间,有
N
个实体,则实体嵌入特征矩阵的大小为
N
×
2d
,表达式为:;使用标准正态分布对进行初始化,表达式为:;其中,表示实体嵌入特征矩阵中第
i
个实体的第
j
个嵌入特征;将实体嵌入特征矩阵拆分为实部和虚部两个矩阵,表达式为:;;其中,表示实体嵌入特征矩阵的实部矩阵,表示实体嵌入特征矩阵的虚部矩阵;步骤
102
,关系嵌入特征初始化;将关系嵌入特征建模为
d
维复数,并使用标准正态分布对关系嵌入特征进行初始化;具体而言,对于每个关系,使用一个2×
d
维向量来表示嵌入特征,其中前
d
维表示实部,后
d
维表示虚部,即:;其中,和分别表示第
i
个关系的实部和虚部,有
M
个关系,则关系嵌入特征矩阵
R
的大小为
M
×
2d
,表达式为:;
使用标准正态分布对进行初始化,表达式为:;其中,表示关系嵌入特征矩阵
R
中第
i
个关系的第
j
个嵌入特征;将关系嵌入特征矩阵
R
拆分为实部和虚部两个矩阵,表达式为:;;其中,表示关系嵌入特征矩阵
R
的实部矩阵,表示关系嵌入特征矩阵的虚部矩阵;步骤
103
,时间嵌入特征初始化;将时间嵌入特征建模为
d
维复数,并使用标准正态分布对其进行初始化;具体而言,对于每个时间,使用一个2×
d
维向量来表示嵌入特征,其中前
d
维表示实部,后
d
维表示虚部,表达式为:;其中,和分别表示第
i
个时间的实部和虚部,有
L
个时间,则时间嵌入特征矩阵
T
的大小为
L
×
2d
,表达式为:;使用标准正态分布对
T
进行初始化,表达式为:;其中,表示时间嵌入特征矩阵
T
中第
i
个时间的第
j
个嵌入特征;将时间嵌入矩阵
T
拆分为实部和虚部两个矩阵,即:;;其中,表示时间嵌入特征矩阵
T
的实部矩阵,表示时间嵌入特征矩阵
T
的虚部矩阵
。3.
根据权利要求2所述的基于时间关系感知的时序知识图谱补全方法,其特征在于,所述的构建时间四元组可信度评分函数,计算时间四元组可信度损失函数,包含以下步骤:对于时间四元组,其中是关系主体,是关系客体,是关系,是时间;时间四元组对应的嵌入特征四元组表示为,和分别为和的嵌入特征,为关系的嵌入特征,为时间的嵌入特征,时间四元组的可信度评分函数为函数,即:;其中,是的共轭复数;从时序知识图谱中采样出个时间四元组作为正样本的子集,随机构造出个时间四元组作为负样本的集合,计算时间四元组可信度损失函...

【专利技术属性】
技术研发人员:修保新
申请(专利权)人:湖南董因信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1