System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于时间概率盒子嵌入的时序知识图谱补全方法技术_技高网

一种基于时间概率盒子嵌入的时序知识图谱补全方法技术

技术编号:41316571 阅读:5 留言:0更新日期:2024-05-13 14:57
本发明专利技术公开一种基于时间概率盒子嵌入的时序知识图谱补全方法,其目标是对不完整的时序知识图谱进行补全,为下游任务提供完整数据。现有方法只是将时序信息嵌入实体之中或将它们完全割裂处理,忽略了实体之间的关系与时序信息之间的特殊联系。本发明专利技术基于盒子嵌入技术,将实体嵌入到向量空间中并制定规则函数捕获实体之间复杂的关系。其次,提出一种时间信息的评分办法,用于评价实体和时序事实在时间维度上联系的紧密程度。最后,通过基于特征加权的频率朴素贝叶斯分类方法对关系与时间信息的联系进行分类处理,得到待补全时序知识图谱的答案集合。本发明专利技术不仅提高了时序知识图谱补全的正确率,也弥补了传统方法补全效率较低的缺点。

【技术实现步骤摘要】

本专利技术涉及时序知识图谱补全领域,具体是一种基于时间概率盒子嵌入的时序知识图谱补全方法


技术介绍

1、时序知识图谱补全是指在给定的时序知识图谱中,通过学习已有的知识来预测缺失的实体、关系或时序信息,从而填充图谱中的空白部分,是图谱构建过程中的重要任务。时序知识图谱对于时间相关的预测、推荐、推理任务和描述事物发展规律具有巨大的应用价值。如在电影推荐系统中,通过补全用户的观影历史、评分和时间信息,可以帮助用户发现适合他们当前喜好和时间的电影推荐。

2、目前已有的时序知识图谱补全方法忽略了关系与时序信息之间的特殊关系,并且对时序信息的建模不合理,没有充分利用事实在时间维度上的相关性等一系列问题,最终导致补全效果较差。


技术实现思路

1、针对现有技术的以上缺陷和改进需求,本专利技术提供了一种基于时间概率盒子嵌入的时序知识图谱补全方法,其目的在于,通过采用表达能力强的盒子嵌入对实体和关系进行表示,同时进一步挖掘关系与时序信息的联系,对答案集合进行过滤,可以高效率的实现时序知识图谱补全,返回满足条件的答案集合对象。

2、本专利技术解决其技术问题所采用的技术方案是:一种基于时间概率盒子嵌入的时序知识图谱补全方法,该方法主要包含如下的步骤:

3、1.首先,使用盒子嵌入对时序事实中的实体在向量空间中进行低维向量表示,关系定义为实体盒子之间的伸缩平移,共包含两个具体处理过程实体表示和关系约束过程:

4、(1):在实体表示过程中,使用 b min, b max两个向量分别表示实体盒子的上界和下界,损失函数为同一事实的两个实体盒子在关系的伸缩平移下重合部分大小,并通过梯度下降法不断训练优化实体表示向量,为了缓解梯度信号消失的问题,使盒子上下界向量服从耿贝尔分布,关系的转移公式定义为:,其中 cen和 len函数求得实体盒子 x的中心点和边长,公式表示为, α与δ表示平移和伸缩参数;

5、(2):在关系约束中制定三个用于约束复杂关系的损失函数,分别针对蕴含“层次关系”、“传递关系”和“组合关系”的实体在向量空间中的表示;

6、2.其次,为了考察补全后的实体或关系在时间维度上联系的紧密程度,提出了宽容交并比指标,首先通过迭代计算出每个实体出现在时序事实中的时间范围,其次,计算出头尾实体在时间维度上重叠区间的大小,以此来判断补全结果在时间维度上的合理性;

7、3.最后,考虑到不同关系导致时序事实对时间信息的依赖程度不同,提出了基于特征加权的频率朴素贝叶斯分类方法,对于缺失实体或关系的事实首先在不考虑时序信息的情况下进行补全,得到待补全答案集合,随后将集合通过基于特征加权的频率朴素贝叶斯分类方法筛除在时间维度上不相关的答案或关系实体,得到最终答案集合。

8、进一步,步骤一中的(2)中所述对于每一批次参与训练的具有复杂关系的实体,都进行规则化约束,具体 “层次关系”的规则化约束损失函数定义如下:

9、,

10、其中r代表关系, u代表所有实体盒子集合,a,b分别代表具有“层次关系”的实体盒子,gr代表“层次关系”的转移公式,对于“传递关系”的规则化约束损失函数定义如下:

11、,

12、其中r代表关系, u代表所有实体盒子集合,a,c分别代表具有“传递关系”的实体盒子,对于“组合关系”的规则化约束损失函数定义如下:

13、,

14、其中r1,r2,r3代表关系, u代表所有实体盒子集合,a,b分别代表具有“组合关系”的实体盒子, f r1 ,f r2 ,f r3代表构成“组合关系”的三种关系的转移公式。

15、进一步,步骤二中所述采用宽容交并比指标对实体、关系与时序信息联系的紧密程度进行对比,具体的公式表示为:

16、,

17、其中系数代表了预测区间宽度和实际区间宽度差,表示预测时间区间的上界,表示预测时间区间的下界,表示实际时间区间的上界,表示实际时间区间的下界。

18、进一步,步骤三中所述基于特征加权的频率朴素贝叶斯分类方法在朴素贝叶斯分类方法的基础上,根据实际时间得分大于某一设定阈值的频率 t p和预测时间得分大于设定阈值的频率 f p的差值表示时序信息对时序事实的影响权重,权重大小也代表着时序信息与关系之间联系的紧密程度,联系越紧密代表时序信息对待补全的时序事实的影响更大。

本文档来自技高网...

【技术保护点】

1.一种基于时间概率盒子嵌入的时序知识图谱补全方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于时间概率盒子嵌入的时序知识图谱补全方法,其特征在于:步骤一中的(2)中对于每一批次参与训练的具有复杂关系的实体,都进行规则化约束,具体的,“层次关系”的规则化约束损失函数定义如下:

3.根据权利要求1所述的一种基于时间概率盒子嵌入的时序知识图谱补全方法,其特征在于:步骤二中所述的采用宽容交并比指标对实体、关系与时序信息联系的紧密程度进行对比,具体的公式表示为:

4.根据权利要求1所述的一种基于时间概率盒子嵌入的时序知识图谱补全方法,其特征在于:步骤三中基于特征加权的频率朴素贝叶斯分类方法在朴素贝叶斯分类方法的基础上,根据实际时间得分大于某一设定阈值的频率

【技术特征摘要】

1.一种基于时间概率盒子嵌入的时序知识图谱补全方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于时间概率盒子嵌入的时序知识图谱补全方法,其特征在于:步骤一中的(2)中对于每一批次参与训练的具有复杂关系的实体,都进行规则化约束,具体的,“层次关系”的规则化约束损失函数定义如下:

3.根据权利要求1所述的一种基于时间...

【专利技术属性】
技术研发人员:李松王祺李春红张丽平
申请(专利权)人:哈尔滨理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1