【技术实现步骤摘要】
一种基于实体结构特征的长尾实体对齐方法
[0001]本专利技术涉及实体对齐领域,具体是一种基于实体结构特征的长尾实体对齐方法。
技术介绍
[0002]随着知识图谱技术研究与应用的深化,知识图谱所应用的研究领域范围越来越广,已经不再局限应用于人工智能领域的智能检索和数据可视化,相关技术已经在金融行业、生物医疗、图书管理及电商推荐等领域得到较为广泛的应用。然而现实世界中这些知识图谱可以由不同机构组织或个人按照特定的需求来设计构建,在不同领域、不同时间都会产生不同的知识图谱,其知识图谱的构建方式、规模大小、数据的表达形式以及语言的选择都存在一定的差异,这导致知识图谱可能出现冗余异构问题;实体对齐任务的主要目的是找到拥有不同表示形式的同一现实世界实体,使用实体对齐不仅可以解决不同知识图谱之间存在的冗余问题,也可以降低知识图谱的稀疏性,不同实体对齐算法的选择与实现正是提高知识图谱实体对齐准确度的关键手段,实体对齐研究分为传统的实体对齐方法和基于知识表示学习的实体对齐方法,随着信息化技术越来越快的发展,知识图谱的规模越来越大,实体和关系 ...
【技术保护点】
【技术特征摘要】
1.一种基于实体结构特征的长尾实体对齐方法,其特征在于,该方法包括以下步骤:步骤S1:给定两个知识图谱、实体集合、关系集合以及种子集,并按照比例随机划分训练集和测试集;步骤S2:随机初始化实体和关系嵌入,并将两个知识图谱的实体和关系嵌入到相同的向量空间中;步骤S3:利用步骤S2中得到的实体嵌入和关系嵌入分别计算头实体和尾实体的投影表示;步骤S4:计算所有三元组中实体的上下文表示;步骤S5:基于步骤S4中得到的上下文向量表示,计算向量之间的距离,对计算得到的距离使用全局最优的对齐策略,得到新的对齐实体对;步骤S6:将步骤S5中得到的对齐实体对加入对齐集合,并基于该集合补全知识图谱三元组,返回步骤S1继续执行,直到不再出现新的对齐实体对。2.根据权利要求1所述的基于实体结构特征的长尾实体对齐方法,其特征在于,在步骤S2中,利用RotatE模型将两个知识图谱的实体和关系嵌入到相同的向量空间中。3.根据权利要求1所述的基于实体结构特征的长尾实体对齐方法,其特征在于,在步骤S2中,还包括基于关系向量r|=1的约束,处理知识图谱中的对称关系模式。4.根据权利要求1所述的基于实体结构特征的长尾实体对齐方法,其特征在于,在步骤S4中,计算所有三元组中实体担任分别不同角色的平均投影向量表示,将平均投影向量表示记为实体的上下文表示。5.根据权利要求1所述的基于实体结构特征的长尾...
【专利技术属性】
技术研发人员:包铁,王俊懿,彭涛,毕海嘉,刘露,
申请(专利权)人:吉林大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。