实体对齐方法、装置、电子设备和存储介质制造方法及图纸

技术编号:31022325 阅读:13 留言:0更新日期:2021-11-30 03:14
本发明专利技术提供一种实体对齐方法、装置、电子设备和存储介质,其中方法包括:确定待对齐的两个目标实体;确定两个目标实体的邻居差异信息,所述邻居差异信息为对应目标实体的邻居信息与另一目标实体的邻居信息之间的差异;基于两个目标实体的邻居差异信息和实体信息,确定所述两个目标实体间的实体对齐结果。本发明专利技术利用邻居差异信息来弥补知识图谱异构性带来的短期邻居差异,减弱短期邻居差异给两个目标实体的实体表示带来的干扰,从而确定两个目标实体间的实体对齐结果,提高了实体对齐的准确性。性。性。

【技术实现步骤摘要】
实体对齐方法、装置、电子设备和存储介质


[0001]本专利技术涉及自然语言处理
,尤其涉及一种实体对齐方法、装置、电子设备和存储介质。

技术介绍

[0002]自然语言处理技术的发展,使得知识图谱在信息搜索、智能问答和推荐系统等领域崭露头角。对于搜索问答等上游任务而言,知识图谱所涵盖的知识量是高准确率的前提,而随着时间推移,知识图谱的数量增多、种类也愈加繁琐。因此,需要将来自不同知识图谱的实体进行对齐,将多个知识图谱融合,实现不同场景与领域的知识共享。
[0003]然而,目前的实体对齐方法均以实体与其在不同图谱中对应的实体具有相似的邻域结构作为前提,而现实场景中的知识图谱多具备不完整性和异质性,由此带来的邻域差异会影响实体对齐的准确性。

技术实现思路

[0004]本专利技术提供一种实体对齐方法、装置、电子设备和存储介质,用以解决现有技术中准确性欠佳的缺陷。
[0005]本专利技术提供一种实体对齐方法,包括:
[0006]确定待对齐的两个目标实体;
[0007]确定所述两个目标实体的邻居差异信息,所述邻居差异信息为对应目标实体的邻居信息与另一目标实体的邻居信息之间的差异;
[0008]基于所述两个目标实体的邻居差异信息和实体信息,确定所述两个目标实体间的实体对齐结果。
[0009]根据本专利技术提供的一种实体对齐方法,所述确定所述两个目标实体的邻居差异信息,包括:
[0010]对所述两个目标实体的邻居信息中每个邻居实体的实体信息进行匹配,得到所述两个目标实体的邻居差异信息,任一目标实体的邻居差异信息包括所述任一目标实体的各个邻居实体与另一目标实体的各个邻居实体之间的差异。
[0011]根据本专利技术提供的一种实体对齐方法,所述对所述两个目标实体的邻居信息中每个邻居实体的实体信息进行匹配,得到所述两个目标实体间的邻居差异信息,包括:
[0012]对所述两个目标实体的邻居信息中每个邻居实体的实体信息进行匹配,得到任一目标实体的各个邻居实体与另一目标实体的各个邻居实体间的匹配度;
[0013]基于任一目标实体的任一邻居实体与另一目标实体的各个邻居实体间的匹配度,对所述另一目标实体的各个邻居实体的实体信息进行融合,得到所述任一目标实体的所述任一邻居实体的邻居融合信息;
[0014]确定所述任一目标实体的各个邻居实体的实体信息与对应邻居融合信息之间的差异,作为所述任一目标实体的邻居差异信息。
[0015]根据本专利技术提供的一种实体对齐方法,所述基于所述两个目标实体的邻居差异信息和实体信息,确定所述两个目标实体间的实体对齐结果,包括:
[0016]基于任一目标实体的各个邻居实体与另一目标实体的各个邻居实体之间的差异,以及所述任一目标实体的各个邻居实体的实体信息,确定所述任一目标实体的各个邻居实体的邻居表示;
[0017]将任一目标实体的实体信息与其各个邻居实体的邻居表示融合,得到所述任一目标实体的实体结构信息;
[0018]基于所述两个目标实体的实体结构信息,确定所述两个目标实体间的实体对齐结果。
[0019]根据本专利技术提供的一种实体对齐方法,所述将任一目标实体的实体信息与其各个邻居实体的邻居表示融合,得到所述任一目标实体的实体结构信息,包括:
[0020]基于任一目标实体的不同阶数的邻居实体与所述任一目标实体间的相关程度,将所述不同阶数的邻居实体的邻居表示分别进行融合,得到不同阶数对应的同阶融合结果;
[0021]对所述不同阶数对应的同阶融合结果与所述任一目标实体的实体信息进行融合,得到所述任一目标实体的实体结构信息。
[0022]根据本专利技术提供的一种实体对齐方法,任一阶数的邻居实体与所述任一目标实体间的相关程度是将所述任一阶数的邻居实体的邻居表示与所述任一目标实体的实体信息进行注意力变换后得到的;
[0023]其中,不同阶数的邻居实体在进行注意力变换时采用的注意力变换参数不同。
[0024]根据本专利技术提供的一种实体对齐方法,所述基于所述两个目标实体的邻居差异信息和实体信息,确定所述两个目标实体间的实体对齐结果,包括:
[0025]基于所述两个目标实体的邻居差异信息、实体信息,以及所述两个目标实体的实体属性信息,确定所述两个目标实体间的实体对齐结果;
[0026]任一目标实体的实体属性信息是基于所述任一目标实体各属性的重要程度确定的。
[0027]根据本专利技术提供的一种实体对齐方法,任一目标实体的实体属性信息是基于如下步骤确定的:
[0028]基于所述任一目标实体各属性之间的相关性,确定各属性的重要程度;
[0029]基于各属性的重要程度,将各属性对应的属性名信息和各属性对应的属性值信息融合,得到所述任一目标实体的实体属性信息。
[0030]本专利技术还提供一种实体对齐装置,包括:
[0031]待对齐实体确定单元,用于确定待对齐的两个目标实体;
[0032]邻居差异获取单元,用于确定所述两个目标实体的邻居差异信息,所述邻居差异信息为对应目标实体的邻居信息与另一目标实体的邻居信息之间的差异;
[0033]实体对齐单元,用于基于所述两个目标实体的邻居差异信息和实体信息,确定所述两个目标实体间的实体对齐结果。
[0034]本专利技术还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述实体对齐方法的步骤。
[0035]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述实体对齐方法的步骤。
[0036]本专利技术提供的实体对齐方法、装置、电子设备和存储介质,通过确定两个目标实体的邻居差异信息,以反映知识图谱的异构性带来的短期邻居差异,并基于两个目标实体的邻居差异信息和实体信息,生成两个目标实体对应的实体表示,利用邻居差异信息来弥补知识图谱异构性带来的短期邻居差异,减弱短期邻居差异给两个目标实体的实体表示带来的干扰,从而确定两个目标实体间的实体对齐结果,提高了实体对齐的准确性。
附图说明
[0037]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038]图1为本专利技术提供的实体对齐方法的流程示意图;
[0039]图2为本专利技术提供的邻居差异信息确定方法的流程示意图;
[0040]图3为本专利技术提供的实体对齐结果确定方法的流程示意图;
[0041]图4为本专利技术提供的稳定匹配方法的示意图;
[0042]图5为本专利技术提供的邻居实体融合方法的流程示意图;
[0043]图6为本专利技术提供的基于结构信息和属性信息的实体对齐方法的示本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种实体对齐方法,其特征在于,包括:确定待对齐的两个目标实体;确定所述两个目标实体的邻居差异信息,所述邻居差异信息为对应目标实体的邻居信息与另一目标实体的邻居信息之间的差异;基于所述两个目标实体的邻居差异信息和实体信息,确定所述两个目标实体间的实体对齐结果。2.根据权利要求1所述的实体对齐方法,其特征在于,所述确定所述两个目标实体的邻居差异信息,包括:对所述两个目标实体的邻居信息中每个邻居实体的实体信息进行匹配,得到所述两个目标实体的邻居差异信息,任一目标实体的邻居差异信息包括所述任一目标实体的各个邻居实体与另一目标实体的各个邻居实体之间的差异。3.根据权利要求2所述的实体对齐方法,其特征在于,所述对所述两个目标实体的邻居信息中每个邻居实体的实体信息进行匹配,得到所述两个目标实体间的邻居差异信息,包括:对所述两个目标实体的邻居信息中每个邻居实体的实体信息进行匹配,得到任一目标实体的各个邻居实体与另一目标实体的各个邻居实体间的匹配度;基于任一目标实体的任一邻居实体与另一目标实体的各个邻居实体间的匹配度,对所述另一目标实体的各个邻居实体的实体信息进行融合,得到所述任一目标实体的所述任一邻居实体的邻居融合信息;确定所述任一目标实体的各个邻居实体的实体信息与对应邻居融合信息之间的差异,作为所述任一目标实体的邻居差异信息。4.根据权利要求2所述的实体对齐方法,其特征在于,所述基于所述两个目标实体的邻居差异信息和实体信息,确定所述两个目标实体间的实体对齐结果,包括:基于任一目标实体的各个邻居实体与另一目标实体的各个邻居实体之间的差异,以及所述任一目标实体的各个邻居实体的实体信息,确定所述任一目标实体的各个邻居实体的邻居表示;将任一目标实体的实体信息与其各个邻居实体的邻居表示融合,得到所述任一目标实体的实体结构信息;基于所述两个目标实体的实体结构信息,确定所述两个目标实体间的实体对齐结果。5.根据权利要求4所述的实体对齐方法,其特征在于,所述将任一目标实体的实体信息与其各个邻居实体的邻居表示融合,得到所述任一目标实体的实体结构信息,包括:基于任一目标实体的不同阶...

【专利技术属性】
技术研发人员:李直旭马桂林邓宸博陈嘉
申请(专利权)人:科大讯飞苏州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1