一种面向实体对齐的主动学习方法、装置和电子装置制造方法及图纸

技术编号：40106711 阅读：15 留言：0更新日期：2024-01-23 18:32

本申请涉及一种面向实体对齐的主动学习方法、装置和电子装置，该方法包括：基于预设的主动学习规则，并根据知识图谱中的第一实体对，获取知识图谱中与第一实体对的特征关系满足预设条件的第二实体对；其中，第一实体对为进行实体对齐后得到的实体对；根据第一实体对和第二实体对，训练预设的图神经网络模型，并基于主动学习规则得到第三实体对，根据第三实体对更新第二实体对；当第三实体对的数量为预设的实体对数量阈值时，确定得到目标图神经网络模型。通过主动学习的方法，得到标注的实体对，进而使用标注实体对训练图神经网络模型，进而降低了在多模态知识图谱实体对齐过程中的标注成本，同时保证了实体对齐的准确性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能领域，特别是涉及一种面向实体对齐的主动学习方法、装置和电子装置。

技术介绍

1、知识图谱(knowledge graph，kg)是一种简单而有效的建模人类知识的方式，通过实体和关系来表示，已用于大型语言模型、信息检索和检测等。实体对齐(entityalignment, ea)的目标是在不同的知识图谱之间建立相同实体的对应关系，其中，实体对齐是知识图谱融合过程的初始阶段。利用视觉模态(如图像)来增强实体嵌入的多模态知识图谱获得了大量的关注，同时，主动学习方法可以挑选最具价值的实体对来减轻人工标注多模态知识图谱中的实体成本。

2、现有技术中，多模态知识图谱通过利用视觉模态(如图像)来增强实体嵌入。但是多模态主动学习所对应的不同模式可能会提供重叠的视角，导致冗余标签和注释资源的低效使用；同时，不同的模态可能提供重叠的信息，导致冗余标注，造成标注预算的浪费。而在多模态知识图谱中利用有限的标注预算进行实体对齐的方式，这些方法在标注实体对信息时未充分考虑到其他模态信息的影响，导致标注冗余，未能提升模型效果，导致标注预算的浪费。

3、针对现有技术中多模态知识图谱实体对齐过程中标注预算浪费，导致标注成本过高的问题，目前还没有提出有效的解决方案。

技术实现思路

1、在本实施例中提供了一种面向实体对齐的主动学习方法、装置和电子装置，以解决相关技术中存在多模态知识图谱的实体对齐的准确度有待提高的问题。

2、第一个方面，在本实施例中提供了一种面向实体对

3、基于预设的主动学习规则，并根据知识图谱中的第一实体对，获取知识图谱中的第二实体对；其中，所述第一实体对为进行实体对齐后得到的实体对；所述第一实体对与第二实体对的特征关系满足预设条件；

4、根据所述第一实体对和所述第二实体对，训练预设的图神经网络模型，并基于所述主动学习规则得到第三实体对，根据所述第三实体对更新所述第二实体对；

5、当所述第三实体对的数量为预设的实体对数量阈值时，确定目标图神经网络模型。

6、在其中的一些实施例中，所述基于预设的主动学习规则，并根据知识图谱中的第一实体对，获取知识图谱中的第二实体对之前，包括：

7、获取知识图谱中的多个图像实体，并将多个图像实体组成多个图像实体对；

8、计算多个所述图像实体对中的图像实体之间的相似度，得到多个图像实体相似度；

9、确定高于预设阈值的图像实体相似度对应的图像实体对为所述第一实体对。

10、在其中的一些实施例中，所述基于预设的主动学习规则，并根据知识图谱中的第一实体对，获取知识图谱中的第二实体对，包括：

11、使用所述第一实体对训练预设的图神经网络模型，得到中间图神经网络模型；

12、输入除第一实体对外的实体至所述中间图神经网络模型，得到所述除第一实体外的实体的标签特征值；

13、当所述标签特征值在预设范围内时，根据预设的主动学习规则，标注所述标签特征值所对应的实体，并确定所述标签特征值所对应的实体为第二实体对。

14、在其中的一些实施例中，所述输入除第一实体对外的实体至所述中间图神经网络模型，得到所述除第一实体外的实体的标签特征值，包括：

15、输入第二实体对的特征值至所述中间图神经网络模型中，得到标签特征向量；

16、确定所述标签特征向量的平均值为所述第二实体对的标签特征值。

17、在其中的一些实施例中，所述根据所述第一实体对和所述第二实体对，训练预设的图神经网络模型，并基于所述主动学习规则得到第三实体对，根据所述第三实体对更新所述第二实体对，包括：

18、根据所述第一实体对和第二实体对，训练所述中间图神经网络模型，得到待标注的实体对；

19、根据所述预设的主动学习规则，获取所述待标注的实体对中的第三实体对，并对所述第三实体对进行标注；

20、使用知识图谱中已标注的实体对，训练所述中间图神经网络模型；其中，所述已标注的实体对包括第一实体对、第二实体对和第三实体对。

21、在其中的一些实施例中，所述确定目标图神经网络模型之后，包括：

22、输入待对齐实体至所述目标图神经网络模型，得到不同所述待对齐实体之间的相似度，并对相似度在预设的相似度阈值的所述待对齐实体进行实体对齐；

23、计算实体对齐的结果指标，并根据所述结果指标获取所述实体对齐的准确度；

24、所述结果指标包括实体对齐的命中指标和实体对齐的评价指标。

25、在其中的一些实施例中，所述输入待对齐实体至所述目标图神经网络模型，得到不同待对齐实体之间的相似度，包括：

26、根据所述目标图神经网络模型，计算所述待对齐实体的结构特征；所述结构特征包括在知识图谱中所述待对齐实体的边的特征，以及与所述待对齐实体关联的邻居实体的特征；

27、根据所述待对齐实体的结构特征，确定所述待对齐实体之间的结构相似度；

28、根据所述待对齐实体之间的结构相似度和所述待对齐实体之间的图像相似度，确定所述待对齐实体之间的相似度。

29、第二个方面，在本实施例中提供了一种实体对齐装置，所述装置包括：主动学习模块、训练模块和确定模块；

30、所述主动学习模块，用于基于预设的主动学习规则，并根据知识图谱中的第一实体对，获取知识图谱中的第二实体对；其中，所述第一实体对为进行实体对齐后得到的实体对；所述第一实体对与第二实体对的特征关系满足预设条件；

31、所述训练模块，用于根据所述第一实体对和所述第二实体对，训练预设的图神经网络模型，并基于所述主动学习规则得到第三实体对，根据所述第三实体对更新所述第二实体对；

32、所述确定模块，用于当所述第三实体对的数量等于预设的实体对数量阈值时，确定目标图神经网络模型。

33、第三个方面，在本实施例中提供了一种电子装置，包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述第一个方面所述的面向实体对齐的主动学习方法。

34、第四个方面，在本实施例中提供了一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述第一个方面所述的面向实体对齐的主动学习方法。

35、与相关技术相比，在本实施例中提供的一种面向实体对齐的主动学习方法、装置和电子装置，基于预设的主动学习规则，并根据知识图谱中的第一实体对，获取知识图谱中的第二实体对；其中，第一实体对为进行实体对齐后得到的实体对；第一实体对与第二实体对的特征关系满足预设条件；根据第一实体对和第二实体对，训练预设的图神经网络模型，并基于主动学习规则得到第三实体对，根据第三实体对更新第二实体对；当第三实体对的数量为预设的实体对数量阈值时，确定得到目标图神经网络模型。通过主动学习的方法，得到标注的本文档来自技高网...

【技术保护点】

1.一种面向实体对齐的主动学习方法，其特征在于，所述方法包括：

2.根据权利要求1所述的面向实体对齐的主动学习方法，其特征在于，所述基于预设的主动学习规则，并根据知识图谱中的第一实体对，获取知识图谱中的第二实体对之前，包括：

3.根据权利要求1所述的面向实体对齐的主动学习方法，其特征在于，所述基于预设的主动学习规则，并根据知识图谱中的第一实体对，获取知识图谱中的第二实体对，包括：

4.根据权利要求3所述的面向实体对齐的主动学习方法，其特征在于，所述输入除第一实体对外的实体至所述中间图神经网络模型，得到所述除第一实体外的实体的标签特征值，包括：

5.根据权利要求3所述的面向实体对齐的主动学习方法，其特征在于，所述根据所述第一实体对和所述第二实体对，训练预设的图神经网络模型，并基于所述主动学习规则得到第三实体对，根据所述第三实体对更新所述第二实体对，包括：

6.根据权利要求1所述的面向实体对齐的主动学习方法，其特征在于，所述确定目标图神经网络模型之后，包括：

7.根据权利要求6所述的面向实体对齐的主动学习方法，其

8.一种面向实体对齐的主动学习装置，其特征在于，所述装置包括：

9.一种电子装置，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行权利要求1至权利要求7中任一项所述的面向实体对齐的主动学习方法。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至权利要求7中任一项所述的面向实体对齐的主动学习方法的步骤。

...

【技术特征摘要】

1.一种面向实体对齐的主动学习方法，其特征在于，所述方法包括：

5.根据权利要求3所述的面向实体对齐的主动学习方法，其特征在于，所述根据所述第一实体对和所述第二实体对，训练预设的图神经网络模型，并基于所述主动学习规则得到第三实体对，根据所...

【专利技术属性】
技术研发人员：陆亚飞，许宝贵，严笑然，刘洋，滕皓，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人