System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于人工智能,涉及应用于数据挖掘、语义分析、智能问答、知识推理、分析决策、推荐系统等领域的一种时序知识图谱嵌入表示方法。
技术介绍
1、在数字化时代,我们处于一个前所未有的数据海洋中。每天都有数以亿计的数据点被创建、上传和分享,这使得数据的提取、解析和理解变得越来越困难,这导致传统的数据管理和信息检索方式已经不能满足现代社会的需求。知识图谱(knowledge graph,简称kg)作为一种新型的知识管理工具,它以图的形式描述客观世界中的概念、实体、事件以及相互关系,将互联网信息以更加接近人类认知的形式展现出来,实现了海量信息的高效组织和管理,为信息深层加工和利用奠定了基础。在知识图谱中,数据不再是孤立的碎片,而是相互关联的、有意义的实体和关系。通过对这些关系的深入挖掘,知识图谱为用户提供了一个更加直观、更加丰富的数据视角,帮助他们从大量的信息中迅速找到所需的内容。然而,知识具有时间变化性,传统的知识图谱虽能描述实体之间的静态关系,但对于反映时间维度上的知识变化显得力不从心。因此,时序知识图谱(temporal knowledge graph,简称tkg)被提出,为解决这一挑战提供了一种全新的视角。tkg不仅记录了实体之间的关系,还为这些关系打上了时间戳,其通常形式化为四元组(s,r,o,τ),其中τ代表了该事件存在或发生的时间。这种表示方式不仅保证了知识图谱的完整性和动态性,更大大增强了查询的精准性,尤其在涉及时间变量的情境中。
2、由于知识图谱(kgs)和时序知识图谱(tkgs)固有的不完整性,知识图谱
3、尽管tkge模型在某些任务上表现出色,但仍然存在以下挑战:
4、(1)时间信息融入实体限制了知识图谱上的链接预测:
5、随着时间信息融入到实体当中,实体信息可能会出现一系列的演变,这是因为在现实世界中,许多关系和属性都与时间相关;例如,一个人的工作职位、居住地点或关系状态都可能随着时间而改变;也即,两个实体在某一时刻存在某种关系,而这种关系在另一个时刻可能就不复存在了;这种动态性使得时序知识图谱中的链接预测变得具有挑战性,因此需要tkge模型具有更高的灵活性和适应性,以捕捉并考虑到这种动态性;
6、(2)模型无法同时编码重要的关系模式:
7、知识图谱中的实体和关系是高度复杂和多样化的,理想情况下,tkge模型应该能够同时编码和理解这些复杂关系的各种模式;然而,现有的tkge模型往往难以同时处理这些多样性,例如,有些模型可能对某些类型的关系模式表现出色,但对其他模式效果不佳,这限制了它们在复杂的知识图谱环境中的应用;
8、(3)模型无法提供解释性:
9、在许多实际应用中,除了高精度的预测结果外,模型的解释性也非常重要,用户和开发者都希望理解模型为何做出特定的预测,这有助于建立对模型的信任,也方便故障排查和优化;然而,深度学习模型(包括许多tkge模型)往往被视为“黑箱”,其内部运作机制难以解读;尽管有一些方法试图提高模型的解释性,但这通常需要牺牲一定的性能,因此,如何在不损失性能的前提下提高tkge模型的解释性仍是一个有待攻克的难题。
技术实现思路
1、本专利技术实施例的目的在于提供一种时序知识图谱嵌入表示方法,以解决现有的时序知识图谱嵌入模型存在的时间信息融入实体限制了知识图谱上的链接预测、无法同时编码重要的关系模式以及无法提供解释性的问题。
2、本专利技术实施例所采用的技术方案是:一种时序知识图谱嵌入表示方法,包括以下步骤:
3、步骤s1、通过对数螺旋线来编码时序知识图谱中的一对实体之间的关系嵌入表示,将实体之间的关系映射到相应的对数螺旋线时间轴上,得到基于对数螺旋线的时序知识图谱嵌入模型;
4、步骤s2、构建时序螺旋正则化器并将时序螺旋正则化器作为损失函数的附加项;
5、步骤s3、采用将时序螺旋正则化器作为附加项的损失函数,对基于对数螺旋线的时序知识图谱嵌入模型进行训练;
6、步骤s4、采用训练完成的基于对数螺旋线的时序知识图谱嵌入模型,进行时序知识图谱嵌入表示。
7、进一步的,所述步骤s1的具体过程如下:
8、在复数空间中对时序知识图谱进行建模,对于一个四元组(s,r,o,τ),s、r、o、τ对应表示头实体、关系、尾实体和时间,关系指头实体和尾实体之间的关系,使用es、er、eo和eτ表示在复数空间中的头嵌入、关系嵌入、尾嵌入和时间嵌入,因此有:
9、
10、其中,es,er,eo,eτ∈ck,ck表示复数空间,re(s)表示头嵌入的实向量,im(s)表示头嵌入的虚向量,re(r)表示关系嵌入的实向量,im(r)表示关系嵌入的虚向量,re(o)表示尾嵌入的实向量,im(o)表示尾嵌入的虚向量,re(τ)表示时间嵌入的实向量,im(τ)表示时间嵌入的虚向量,i表示虚数单位;
11、对数螺旋线的臂的距离以几何级数递增在极坐标(ξ,θ)中,通过以下方程来描述:
12、ξ=aebθ; (2)
13、其中,ξ表示从螺旋的起点到任意点的径向距离,参数a控制螺旋的起始点到原点的距离,参数b控制相邻两螺旋环之间的距离,相邻两螺旋环之间的距离是2πb;θ是从螺旋起点到任意点的角度;
14、基于关系的时间戳即时间信息,将关系映射到与其时间戳对应的对数螺旋线时间轴上:
15、将每一个关系视为公式(2)中的旋转角度θ,并将每一个关系对应的时间戳即试件信息视为公式(2)中的距离控制参数b,因此,每一个关系的嵌入值范围是er∈(0,2π);为了防止螺旋之间的交叉,将所有螺旋的起始点设置为原点,即设置公式(2)中的a=0,基于此,将所有关系映射到匹配的对数螺旋线时间轴,表示为:
16、
17、其中,ξ(τ,r)表示从螺旋的起点到每个关系点r的径向距离,表示哈达本文档来自技高网...
【技术保护点】
1.一种时序知识图谱嵌入表示方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种时序知识图谱嵌入表示方法,其特征在于,所述步骤S1的具体过程如下:
3.根据权利要求1所述的一种时序知识图谱嵌入表示方法,其特征在于,所述步骤S2通过在平滑时间正则化器中添加阶段的额外时间戳嵌入e′τ来构建时序螺旋正则化器,并在相邻的时间嵌入之间添加一个偏差分量,定义为:
4.根据权利要求2所述的一种时序知识图谱嵌入表示方法,其特征在于,所述步骤S3中,对基于对数螺旋线的时序知识图谱嵌入模型进行训练时,在不同的对数螺旋线时间轴上会有相同的模数情况,这导致了语义关系之间的混淆,因此,采用额外时间戳相位嵌入e′τ=Re(τ′)+iIm(τ′)来避免这些不良情况,τ′表示额外时间戳,Re(τ′)表示额外时间戳相位嵌入的实向量,Im(τ′)表示额外时间戳相位嵌入的虚向量,由于相位具有周期性特征,因此,采用正弦函数来测量额外时间戳相位嵌入,得到:
5.根据权利要求4所述的一种时序知识图谱嵌入表示方法,其特征在于,所述步骤S3中,对基于对数螺旋线的时序知识
...【技术特征摘要】
1.一种时序知识图谱嵌入表示方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种时序知识图谱嵌入表示方法,其特征在于,所述步骤s1的具体过程如下:
3.根据权利要求1所述的一种时序知识图谱嵌入表示方法,其特征在于,所述步骤s2通过在平滑时间正则化器中添加阶段的额外时间戳嵌入e′τ来构建时序螺旋正则化器,并在相邻的时间嵌入之间添加一个偏差分量,定义为:
4.根据权利要求2所述的一种时序知识图谱嵌入表示方法,其特征在于,所述步骤s3中,对基于对数螺旋线的时序知识图谱嵌入模型进行训练时...
【专利技术属性】
技术研发人员:苏向东,飞龙,张晖,王勇和,王炜华,闫蓉,高光来,
申请(专利权)人:内蒙古大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。