一种面向多模态知识图谱的实体对齐方法及装置制造方法及图纸

技术编号：38814875 阅读：13 留言：0更新日期：2023-09-15 19:54

本发明专利技术适用于知识图谱技术领域，提供了一种面向多模态知识图谱的实体对齐方法及装置，该方法包括以下步骤：将两个待对齐的多模态知识图谱作为模型的输入；使用GCN对知识图谱结构进行建模，生成知识图谱的结构嵌入；还生成语义嵌入；根据结构嵌入计算余弦相似度得到结构相似性矩阵，通过计算语义嵌入的余弦相似度得到语义相似性矩阵；通过可以动态调整权重的自适应特征融合策略将结构相似性矩阵和语义相似性矩阵融合成最终的实体相似性矩阵，根据实体相似性矩阵得到对齐结果；在得到的对齐结果中挑选可靠的对齐实体，重复迭代过程直至模型收敛，本发明专利技术解决了目前知识图谱实体对齐任务缺乏训练数据的问题。务缺乏训练数据的问题。务缺乏训练数据的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向多模态知识图谱的实体对齐方法及装置

[0001]本专利技术涉及知识图谱
，具体是一种面向多模态知识图谱的实体对齐方法及装置。

技术介绍

[0002]当今世界随着互联网的蓬勃发展，网络中的数据内容正在爆炸式的增长。由于互联网内容具有规模大、异质多元及组织结构松散的特点，所以人们无法高效地获取信息和知识。随着知识图谱(Knowledge Graph,KG)的提出，其凭借着强大的语义处理能力和开放组织能力，为当今互联网时代的知识化组织和智能应用做出了重大贡献。知识图谱的概念最初是由Google于2012年5月16日正式提出。目的是凭借知识图谱去挖掘用户需求的语义信息并消除歧义，从而提升搜索引擎返回信息的精准度和用户的检索效率。知识图谱更偏重于描述实体与实体之间的关联，知识图谱的出现更符合计算机语义学的发展趋势。随着人工智能技术的快速发展，知识图谱现在已经不仅仅是作为检索系统的数据库来使用。随着对知识图谱技术的研究不断深入，知识图谱已经被应用到更多的领域，如语义匹配、搜索推荐、问答对话、推理决策及区块链协作等等。正是由于知识图谱的广泛应用范围，不同的机构和组织一般都会根据自身的业务需求去构建知识图谱，由于缺乏一个统一的行业标准，这就导致了不同的知识图谱之间存在着严重的异构和冗余问题。通常来说两个不同的知识图谱对同一个客观实体的描述往往存在着互补的情况，所以将多个知识图谱融合成一个规模更大、信息覆盖程度更广的知识图谱是必要的，而知识图谱融合的首要任务就是实体对齐。实体对齐的目标是匹配两个不同知识图谱中引用相同真实...

【技术保护点】

【技术特征摘要】
1.一种面向多模态知识图谱的实体对齐方法，其特征在于，该方法包括以下步骤：步骤1：将两个待对齐的多模态知识图谱作为模型的输入；步骤2：使用GCN对知识图谱结构进行建模，生成知识图谱的结构嵌入；还生成语义嵌入；步骤3：根据结构嵌入计算余弦相似度得到结构相似性矩阵，通过计算语义嵌入的余弦相似度得到语义相似性矩阵；步骤4：通过可以动态调整权重的自适应特征融合策略将结构相似性矩阵和语义相似性矩阵融合成最终的实体相似性矩阵，根据实体相似性矩阵得到对齐结果；步骤5：在得到的对齐结果中挑选可靠的对齐实体对加入种子集作为训练数据继续指导下一次对齐，重复迭代过程直至模型收敛。2.根据权利要求1所述的面向多模态知识图谱的实体对齐方法，其特征在于，在步骤2中，生成语义嵌入的步骤包括：获取词袋特征，并将其输入到前馈神经网络以获得相应的嵌入；获取视觉特征，将视觉特征输入到前馈神经网络获得视觉信息的嵌入；将词袋特征和视觉信息的嵌入进行融合生成语义嵌入。3.根据权利要求2所述的面向多模态知识图谱的实体对齐方法，其特征在于，所述词袋特征包括关系、属性和实体名称信息。4.根据权利要求2所述的面向多模态知识图谱的实体对齐方法，其特征在于，...

【专利技术属性】
技术研发人员：包铁，邵斐，彭涛，毕海嘉，刘露，
申请(专利权)人：吉林大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人