一种融合高速路机制和属性信息的知识图谱实体对齐方法技术

技术编号:37863623 阅读:9 留言:0更新日期:2023-06-15 20:53
本发明专利技术公开了一种融合高速路机制和属性信息的知识图谱实体对齐方法,包括以下步骤:获取知识图谱KG1和KG2的数据以及一部分预对齐的实体种子集S;将两个知识图谱进行知识抽取,获得知识表示;通过已有知识进行模型构建获得结构向量模型;在结构向量模型中使用图神经网络将KG1和KG2的实体映射到同一低维向量空间;在图神经网络中使用高速门机制过滤相关实体和属性信息以实现异构知识图谱之间更细粒度更准确的实体对齐。通过利用带有高速路门机制Highway gates图卷积的表示方法,学习关系三元组和属性信息的嵌入表示,使用两层GCN模型,首先通过GCN,高速路门机制,第二次GCN的过程控制了实体进入的数量减少了候选项,并降低了噪声。低了噪声。低了噪声。

【技术实现步骤摘要】
一种融合高速路机制和属性信息的知识图谱实体对齐方法


[0001]本专利技术涉及知识图谱数据处理领域,特别涉及一种融合高速路机制和属性信息的知识图谱实体对齐方法。

技术介绍

[0002]知识图谱实体对齐目的是找到不同知识图谱中指向现实世界中同一对象的过程。现在的知识图谱有关实体对齐的方法不管是传统实体对齐还是基于表示学习的实体对齐方法主要关注实体本身和关系信息而忽略了属性信息,而知识图谱的属性信息对提高实体对齐的准确率也很重要。目前而言大多数实体对齐的方法是需要根据标注数据进行对齐的,并且这些方法都是以标注的数据为真为前提的,但是标注数据中也可能会存在错误的数据,这些数据在很大程度的上会影响实体对齐的准确率。为此提出一种融合高速路机制和属性信息的知识图谱实体对齐方法。

技术实现思路

[0003]本专利技术要解决的技术问题是克服现有技术的缺陷,提供一种融合高速路机制和属性信息的知识图谱实体对齐方法。
[0004]为了解决上述技术问题,本专利技术提供了如下的技术方案:
[0005]一种融合高速路机制和属性信息的知识图谱实体对齐方法,包括以下步骤:
[0006]步骤1,获取知识图谱KG1和KG2的数据以及一部分预对齐的实体种子集S;
[0007]步骤2,将两个知识图谱进行知识抽取,获得知识表示;
[0008]步骤3,通过已有知识进行模型构建获得结构向量模型;
[0009]步骤4,在结构向量模型中使用图神经网络将KG1和KG2的实体映射到同一低维向量空间;
>[0010]步骤5,在图神经网络中使用高速门机制过滤相关实体和属性信息以实现异构知识图谱之间更细粒度更准确的实体对齐。
[0011]作为本专利技术的一种优选技术方案,所述结构向量模型包括三部分,分别为;
[0012]关系实体的实体对齐、属性信息的实体对齐和融合关系实体和属性信息的实体对齐。
[0013]作为本专利技术的一种优选技术方案,所述结构向量模型为两层GCN模型。
[0014]作为本专利技术的一种优选技术方案,在步骤2中,知识抽取分为实体抽取、关系抽取和属性抽取,所获得的知识表示进行实体对齐时进行实体消歧和指代消歧。
[0015]作为本专利技术的一种优选技术方案,在步骤5中采用Highway gates机制进行过滤,具体机制表示为:
[0016]是Highway gates的权重和偏置,即为GCN中输出层的门系数,是GCN的输出层、输入层的加权和。
[0017]与现有技术相比,本专利技术的有益效果如下:
[0018]本专利技术通过利用带有高速路门机制Highway gates图卷积的表示方法,学习关系三元组和属性信息的嵌入表示,使用两层GCN模型,首先通过GCN,高速路门机制,第二次GCN的过程控制了实体进入的数量减少了候选项,并降低了噪声。
附图说明
[0019]附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:
[0020]图1是本专利技术的整体流程图;
[0021]图2是本专利技术的实验结果图图;
[0022]图3是实施例种子集的影响对比图;
具体实施方式
[0023]以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。
[0024]实施例1
[0025]如图1

3所示,本专利技术提供一种融合高速路机制和属性信息的知识图谱实体对齐方法,包括以下步骤:
[0026]步骤1,获取知识图谱KG1和KG2的数据以及一部分预对齐的实体种子集S;
[0027]步骤2,将两个知识图谱进行知识抽取,获得知识表示;
[0028]步骤3,通过已有知识进行模型构建获得结构向量模型;
[0029]步骤4,在结构向量模型中使用图神经网络将KG1和KG2的实体映射到同一低维向量空间;
[0030]步骤5,在图神经网络中使用高速门机制过滤相关实体和属性信息以实现异构知识图谱之间更细粒度更准确的实体对齐。
[0031]进一步的,结构向量模型包括三部分,分别为;
[0032]关系实体的实体对齐、属性信息的实体对齐和融合关系实体和属性信息的实体对齐。
[0033]进一步的,结构向量模型为两层GCN模型。
[0034]进一步的,在步骤2中,知识抽取分为实体抽取、关系抽取和属性抽取,所获得的知识表示进行实体对齐时进行实体消歧和指代消歧。
[0035]进一步的,在步骤5中采用Highway gates机制进行过滤,具体机制表示为:
[0036]是Highway gates的权重和偏置,即为GCN中输出层的门系数,是GCN的输出层、输入层的加权和。
[0037]实验结果图如图2所示,为更清楚直观地展示GCN

HW与对比模型相比的有效性,在实验过程中设置了在不同种子集的情况下Hits@1的效果。实验表明在不同种子集的情况下,随着种子集的不断增加训练效果也在变好,当种子集达到50%时,所有方法的效果有显著提升;当给到10%的种子集时所有的方法效果表现一般,但提出的方法在所有不同的种子集上效果比baseline的效果好。所以,即使在很少的种子集上提出的方法有很好的实体对齐效果,如图3所示。
[0038]最后应说明的是:以上所述仅为本专利技术的优选实施例而已,并不用于限制本专利技术,尽管参照前述实施例对本专利技术进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本专利技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本专利技术的保护范围之内。
本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种融合高速路机制和属性信息的知识图谱实体对齐方法,其特征在于,包括以下步骤:步骤1,获取知识图谱KG1和KG2的数据以及一部分预对齐的实体种子集S;步骤2,将两个知识图谱进行知识抽取,获得知识表示;步骤3,通过已有知识进行模型构建获得结构向量模型;步骤4,在结构向量模型中使用图神经网络将KG1和KG2的实体映射到同一低维向量空间;步骤5,在图神经网络中使用高速门机制过滤相关实体和属性信息以实现异构知识图谱之间更细粒度更准确的实体对齐。2.根据权利要求1所述的一种融合高速路机制和属性信息的知识图谱实体对齐方法,其特征在于,所述结构向量模型包括三部分,分别为;关系实体的实体对齐、属性信息的实体对齐和融合关系实体和属性...

【专利技术属性】
技术研发人员:时慧芳
申请(专利权)人:昆明理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1