【技术实现步骤摘要】
一种面向时序知识图谱的无监督实体对齐方法及装置
[0001]本专利技术属于知识图谱实体对齐
,尤其涉及一种面向时序知识图谱的无监督实体对齐方法及装置。
技术介绍
[0002]近年来,知识图谱作为表示现实对象结构化信息的工具,在语义搜索、推荐系统和问答系统中的应用越来越广泛。为了对不同来源的知识图谱进行融合以弥补其不完整性,首先要对齐来自不同知识图谱但指向同一现实对象的实体,即“实体对齐”。
[0003]时序知识图谱通过引入时间信息扩展了传统的知识图谱,近期受到了越来越多的关注。大多数现有的基于嵌入的实体对齐方法并没有考虑时序知识图谱中额外的时间信息,容易导致具有相似邻域结构但对应于不同时间信息的实体的错误对齐。将时间信息纳入实体对齐的过程可以显著提高时序知识图谱实体对齐的性能。因此,设计一种面向时序知识图谱的高效的实体对齐方法已经成为学术界和工业界的迫切需要。
[0004]在实现本专利技术的过程中,专利技术人发现现有技术中至少存在如下问题:首先,现有的研究只是为每个时间信息创建嵌入方法,以增强图学习过程 ...
【技术保护点】
【技术特征摘要】
1.一种面向时序知识图谱的无监督实体对齐方法,其特征在于,包括:S11:获取两个时序知识图谱,每个所述时序知识图谱包括若干含有时间信息的四元组;S12:根据每个所述时序知识图谱中的实体和对应的时间信息,通过图卷积式前向传递的方式,构建两个时间特征矩阵;S13:根据所述两个时间特征矩阵,采用双向策略生成两个实体对齐矩阵,并通过所述两个实体对齐矩阵以匹配的方式无监督地获得预对齐的伪标签;S14:利用所述时间信息扩展图神经网络模型,以时序知识图谱的四元组为训练数据集、以所述预对齐的伪标签未训练数据标签,对扩展后的图神经网络模型进行训练,得到关系特征矩阵;S15:采用加权方式融合所述关系特征矩阵和两个时间特征矩阵,得到融合的规范化实体对齐矩阵;S16:利用所述规范化实体对齐矩阵得到两个时序知识图谱之间的距离,并通过最小化所述距离,得到对应的实体对齐矩阵,从而得到实体对齐结果。2.根据权利要求1所述的方法,其特征在于,步骤S11中,四元组,表示主体实体在时间间隔内与对象实体有关系。3.根据权利要求1所述的方法,其特征在于,步骤S12中,对每个所述时序知识图谱进行如下操作,从而构建两个时间特征矩阵:S21:提取实体与时间的二部图作为初步的时间特征矩阵;S22:根据不同关系类型的占比为知识图谱构建带有权重的关系邻接矩阵;S23:基于所述时间特征矩阵和关系邻接矩阵,通过图卷积式前向传递,聚合来自邻居实体的信息,以补充时间特征,得到聚合后的时间特征矩阵。4.根据权利要求1所述的方法,其特征在于,步骤S13包括:S31:对所述两个时间特征矩阵,分别在正向和反向初步推导出两个实体对齐矩阵;S32:在两个实体对齐矩阵中分别标识与实体相似度最高的对应实体,从而得到若干实体对,若得到的实体对在双向策略中相互匹配,则取得该实体对为预对齐的伪标签。5.根据权利要求1所述的方法,其特征在于,步骤S14包括:S41:初始化一个可学习的嵌入向量;S42:使用负样本采样方法构造损失函数;S43:利用所述嵌入向量,通过添加时间信息扩展图神经网络模型,构建用于学习知识图谱结构特征的多层图神经网络模型;S44:将所述预对齐的伪标签...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。