用于实体对齐的方法及装置、电子设备制造方法及图纸

技术编号:33960494 阅读:15 留言:0更新日期:2022-06-30 00:26
本申请涉及实体对齐技术领域,公开一种用于实体对齐的方法,包括:在知识图谱中确定第一待对齐实体和第二待对齐实体;构建第一集合、第二集合和第三集合;第一集合包括第一待对齐实体、第一待对齐实体对应的关系和第一待对齐实体对应的实体,第二集合包括第二待对齐实体、第二待对齐实体对应的关系和第二待对齐实体对应的实体,第三集合包括第一待对齐实体和第二待对齐实体共有的关系和实体;根据第一集合、第二集合和第三集合获取第一概率和第二概率;根据第一概率和第二概率判断第一待对齐实体和第二待对齐实体是否为同一对象,从而提高了实体对齐的准确率。本申请还公开一种用于实体对齐的装置及电子设备。实体对齐的装置及电子设备。实体对齐的装置及电子设备。

【技术实现步骤摘要】
用于实体对齐的方法及装置、电子设备


[0001]本申请涉及实体对齐
,例如涉及一种用于实体对齐的方法及装置、电子设备。

技术介绍

[0002]不同的知识图谱,收集知识的侧重点不同。对于同一个实体,有知识图谱的可能侧重于其本身某个方面的描述,有的知识图谱可能侧重于描述实体与其它实体的关系。通过知识融合可以将不同知识图谱中的知识进行互补融合,形成全面、准确、完整的实体描述。知识融合过程中,主要涉及到的工作就是实体对齐。通过实体对齐可以判断两个不同信息来源的实体是否为指向真实世界中同一个对象。
[0003]在实现本公开实施例的过程中,发现相关技术中至少存在如下问题:
[0004]现有技术中仅根据两个实体分别对应的关系对齐矩阵和实体对齐矩阵的相似度判断两个实体是否为同一对象,这样的实体对齐方式准确率不高。

技术实现思路

[0005]为了对披露的实施例的一些方面有基本的理解,下面给出了简单的概括。所述概括不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围,而是作为后面的详细说明的序言。
[0006]本公开实施例提供了一种用于实体对齐的方法及装置、电子设备,以提高实体对齐的准确率。
[0007]在一些实施例中,所述用于实体对齐的方法包括:在知识图谱中确定第一待对齐实体和第二待对齐实体;构建第一集合、第二集合和第三集合;所述第一集合包括所述第一待对齐实体、所述第一待对齐实体对应的关系和所述第一待对齐实体对应的实体,所述第二集合包括所述第二待对齐实体、所述第二待对齐实体对应的关系和所述第二待对齐实体对应的实体,所述第三集合包括所述第一待对齐实体和所述第二待对齐实体共有的关系和实体;根据所述第一集合、所述第二集合和第三集合获取第一待对齐实体和第二待对齐实体为同一对象的第一概率,和,第一待对齐实体和第二待对齐实体不是同一对象的第二概率;根据第一概率和第二概率判断第一待对齐实体和第二待对齐实体是否为同一对象。
[0008]在一些实施例中,用于实体对齐的装置包括:确定模块,被配置为在知识图谱中确定第一待对齐实体和第二待对齐实体;集合构建模块,被配置为构建第一集合、第二集合和第三集合;第一集合包括第一待对齐实体、第一待对齐实体对应的关系和第一待对齐实体对应的实体,第二集合包括第二待对齐实体、第二待对齐实体对应的关系和第二待对齐实体对应的实体,第三集合包括第一待对齐实体和第二待对齐实体共有的关系和实体;概率获取模块,被配置为根据第一集合、第二集合和第三集合获取第一待对齐实体和第二待对齐实体为同一对象的第一概率,和,第一待对齐实体和第二待对齐实体不是同一对象的第二概率;判断模块,被配置为根据第一概率和第二概率判断第一待对齐实体和第二待对齐
实体是否为同一对象。
[0009]在一些实施例中,电子设备,包括处理器和存储有程序指令的存储器,处理器被配置为在运行程序指令时,执行如上述的用于实体对齐的方法。
[0010]本公开实施例提供的用于实体对齐的方法及装置、电子设备,可以实现以下技术效果:首先在知识图谱中确定出第一待对齐实体和第二待对齐实体,然后构建包含第一待对齐实体及其对应的关系和对应的实体的第一集合,构建包含第二待对齐实体及其对应的关系和对应的实体的第二集合,构建包含第一待对齐实体与第二待对齐实体共有的关系和实体的第三集合,根据第一集合、第二集合和第三集合获取第一待对齐实体和第二待对齐实体为同一对象的第一概率,和,第一待对齐实体和第二待对齐实体不是同一对象的第二概率,进而根据第一概率和第二概率判断第一待对齐实体和第二待对齐实体是否为同一对象。由于考虑到了两个实体之间存在共有的关系和实体,从而提高了实体对齐的准确率。
[0011]以上的总体描述和下文中的描述仅是示例性和解释性的,不用于限制本申请。
附图说明
[0012]一个或多个实施例通过与之对应的附图进行示例性说明,这些示例性说明和附图并不构成对实施例的限定,附图中具有相同参考数字标号的元件示为类似的元件,附图不构成比例限制,并且其中:
[0013]图1是本公开实施例提供的一个用于实体对齐的方法的示意图;
[0014]图2是本公开实施例提供的另一个用于实体对齐的方法的示意图;
[0015]图3是本公开实施例提供的另一个用于实体对齐的方法的示意图;
[0016]图4是本公开实施例提供的一个用于实体对齐的装置的结构示意图;
[0017]图5是本公开实施例提供的一个电子设备的结构示意图。
具体实施方式
[0018]为了能够更加详尽地了解本公开实施例的特点与
技术实现思路
,下面结合附图对本公开实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本公开实施例。在以下的技术描述中,为方便解释起见,通过多个细节以提供对所披露实施例的充分理解。然而,在没有这些细节的情况下,一个或多个实施例仍然可以实施。在其它情况下,为简化附图,熟知的结构和装置可以简化展示。
[0019]本公开实施例的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开实施例的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。
[0020]除非另有说明,术语“多个”表示两个或两个以上。
[0021]本公开实施例中,字符“/”表示前后对象是一种“或”的关系。例如,A/B表示:A或B。
[0022]术语“和/或”是一种描述对象的关联关系,表示可以存在三种关系。例如,A和/或B,表示:A或B,或,A和B这三种关系。
[0023]术语“对应”可以指的是一种关联关系或绑定关系,A与B相对应指的是A与B之间是一种关联关系或绑定关系。
[0024]本公开实施例的技术方案可以应用于电子设备中,电子设备包括:计算机、智能终端或服务器。在一些实施例中,智能终端包括智能手机或平板等存储有知识图谱的装置。
[0025]本公开实施例中,利用智能终端或服务器在知识图谱中确定两个待对齐实体,并构建第一集合、第二集合和第三集合,根据第一集合、第二集合和第三集合获取第一待对齐实体和第二待对齐实体为同一对象的第一概率,和,第一待对齐实体和第二待对齐实体不是同一对象的第二概率,进而根据第一概率和第二概率判断第一待对齐实体和第二待对齐实体是否为同一对象。由于考虑到了两个实体之间存在共有的关系和实体,从而提高了实体对齐的准确率。
[0026]结合图1所示,本公开实施例提供一种用于实体对齐的方法,包括:
[0027]步骤S101,电子设备在知识图谱中确定第一待对齐实体和第二待对齐实体。
[0028]步骤S102,电子设备构建第一集合、第二集合和第三集合;第一集合包括第一待对齐实体、第一待对齐实体对应的关系和第一待对齐实体对应的实体,第二集合包括第二待对齐实体、第二待对齐实体对应的关系和第二待对齐实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于实体对齐的方法,其特征在于,包括:在知识图谱中确定第一待对齐实体和第二待对齐实体;构建第一集合、第二集合和第三集合;所述第一集合包括所述第一待对齐实体、所述第一待对齐实体对应的关系和所述第一待对齐实体对应的实体,所述第二集合包括所述第二待对齐实体、所述第二待对齐实体对应的关系和所述第二待对齐实体对应的实体,所述第三集合包括所述第一待对齐实体和所述第二待对齐实体共有的关系和实体;根据所述第一集合、所述第二集合和所述第三集合获取所述第一待对齐实体和所述第二待对齐实体为同一对象的第一概率,和,所述第一待对齐实体和所述第二待对齐实体不是同一对象的第二概率;根据所述第一概率和所述第二概率判断所述第一待对齐实体和所述第二待对齐实体是否为同一对象。2.根据权利要求1所述的方法,其特征在于,根据所述第一集合、所述第二集合和所述第三集合获取所述第一待对齐实体和所述第二待对齐实体为同一对象的第一概率,和,所述第一待对齐实体和所述第二待对齐实体不是同一对象的第二概率,包括:获取所述第一待对齐实体的向量表示,获取所述第二待对齐实体的向量表示;获取所述第一集合对应的实体对齐矩阵,获取所述第一集合对应的关系对齐矩阵;获取所述第二集合对应的实体对齐矩阵,获取所述第二集合对应的关系对齐矩阵;获取所述第三集合对应的实体向量,获取所述第三集合对应的关系向量;将各所述向量表示、各所述实体对齐矩阵、各所述关系对齐矩阵、所述实体向量和所述关系向量输入第一预设模型,获得输出向量;将所述输出向量输入全连接层,获得所述第一概率和所述第二概率。3.根据权利要求2所述的方法,其特征在于,获取所述第一待对齐实体的向量表示,包括:利用第二预设模型获取所述第一待对齐实体的向量表示。4.根据权利要求2所述的方法,其特征在于,获取所述第一集合对应的实体对齐矩阵,包括:获取所述第一集合中的各实体与所述第二集合中所有实体之间的各最短路径长度;将各所述最短路径长度的倒数进行归一化处理,获得所述第一集合中的各实体对应的路径向量;根据第一预设算法对所述第一集合中的各实体对应的路径向量进行计算,获得所述第一集合中的各实体对应的实体对齐向量表示;根据所述第一集合中的各实体对应的实体对齐向量表示获取所述第一集合对应的实体对齐矩阵。5.根据权利要求2所述的方法,其特征在于,获取所述第一集合对应的关系对齐矩阵,包括:获取所述第一集合中的各关系与所述第二集合中所有关系之间的各共现次数...

【专利技术属性】
技术研发人员:刘伟硕
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1