【技术实现步骤摘要】
一种引入实体类型自动化表示的知识图谱嵌入与推理方法
本专利技术涉及自然语言处理和知识图谱
,更具体的说是涉及一种对于任何知识图谱都通用的引入实体类型自动化表示的知识图谱嵌入方法。
技术介绍
知识图谱以图结构存储和组织由实体和关系构成的知识,并能够根据需求提供查询和推理等功能,成为人工智能领域实现认知系统的重要技术之一。目前,知识图谱已在智慧公安、金融反欺诈和智能医疗等领域发挥重要作用。由于一般情况下构建的知识图谱规模巨大,不可避免会出现知识图谱信息不全的情况,例如一些三元组缺少其中的一个实体或关系,因此需要在知识图谱上进行推理补全缺失的知识。传统基于符号的方法的复杂度随着知识图谱的规模急剧增加,无法满足现有的大规模知识图谱的推理任务。知识图谱嵌入旨在将知识图谱中的实体和关系嵌入到低维向量空间,借助于低维向量表示的知识图谱推理具有较高的计算效率和泛化性能。如何得到对于任何知识图谱都通用的知识图谱向量表示并实现精确的推理任务是知识图谱嵌入的重点和难点,而仅利用三元组本身的信息来进行知识图谱嵌入难以准确表示知识图谱中实体和关系,需要学习更多的语义信息来辅助表示知识图谱并进行推理。同时,大多数知识图谱中存在对称关系和一对多,多对一和多对多的复杂关系,因此需要设计相应的知识图谱嵌入策略来解决这些问题。针对上述问题,国内外已有相关方法用于知识图谱嵌入。专利CN201911036820.5设计了一种基于隐式翻译模型的知识图谱嵌入方法,将关系表示为两层全连接神经网络,但这种方法仅考虑了单独的三元组信息,无法得到 ...
【技术保护点】
1.一种引入实体类型自动化表示的知识图谱嵌入与推理方法,其特征在于,具体步骤如下:/n步骤一:针对任何知识图谱中的每个实体,利用三元组构建关于实体类型表示的能量函数;基于实体类型表示的能量函数,按照实体类型的语义相关性对三元组中头实体和尾实体的实体类型表示分别进行约束,得到衡量每两个三元组实体类型间的语义相关度的能量函数;/n步骤二:对三元组中的实体表示进行关系超平面投影操作并构建关于实体表示的能量函数;/n步骤三:结合关于实体类型表示的能量函数、实体类型间的语义相关度的能量函数、以及关于实体表示的能量函数,联合建立评价函数,并通过最小化评价函数,自动学习实体类型表示、与实体类型表示相关的关系表示、实体表示和与实体表示相关的关系表示;/n步骤四:基于步骤三得到的实体类型表示、与实体类型表示相关的关系表示、实体表示和与实体表示相关的关系表示,并联合步骤一中的关于实体类型表示的能量函数和步骤二中的关于实体表示的能量函数构建两阶段推理策略,得到知识图谱推理结果,用于补全知识图谱中缺少头实体或尾实体的三元组。/n
【技术特征摘要】 【专利技术属性】
1.一种引入实体类型自动化表示的知识图谱嵌入与推理方法,其特征在于,具体步骤如下:
步骤一:针对任何知识图谱中的每个实体,利用三元组构建关于实体类型表示的能量函数;基于实体类型表示的能量函数,按照实体类型的语义相关性对三元组中头实体和尾实体的实体类型表示分别进行约束,得到衡量每两个三元组实体类型间的语义相关度的能量函数;
步骤二:对三元组中的实体表示进行关系超平面投影操作并构建关于实体表示的能量函数;
步骤三:结合关于实体类型表示的能量函数、实体类型间的语义相关度的能量函数、以及关于实体表示的能量函数,联合建立评价函数,并通过最小化评价函数,自动学习实体类型表示、与实体类型表示相关的关系表示、实体表示和与实体表示相关的关系表示;
步骤四:基于步骤三得到的实体类型表示、与实体类型表示相关的关系表示、实体表示和与实体表示相关的关系表示,并联合步骤一中的关于实体类型表示的能量函数和步骤二中的关于实体表示的能量函数构建两阶段推理策略,得到知识图谱推理结果,用于补全知识图谱中缺少头实体或尾实体的三元组。
2.根据权利要求1所述的一种引入实体类型自动化表示的知识图谱嵌入与推理方法,其特征在于,所述步骤一中,针对任何知识图谱中的实体,利用由头实体h,尾实体t和这二者之间的关系r组成的三元组(h,r,t),定义三元组关于实体类型表示的能量函数E1(h,r,t)为:
E1(h,r,t)=||Mryh+yr-Mryt||
其中,yh∈Rd,yr∈Rd,yt∈Rd分别是头实体h的实体类型,关系r和尾实体t的实体类型在实数空间下的表示,且均为维度为d的实值向量;Mr∈Rd×d是实体类型表示关于关系r的注意力权重矩阵,且维度是d×d的实数矩阵;当r为对称关系时,yr=0,保证头实体和尾实体具有相同的实体类型表示;当处理一对多,多对一和多对多的复杂关系时,针对相同的头实体和尾实体之间存在多种不同关系的情况,通过关于不同关系的注意力权重矩阵Mr使其均满足Mryh+yr=Mryt的目标;
基于实体类型表示,对于两个三元组(h1,r1,t1)和(h2,r2,t2),如果这两个三元组具有相同的关系,则其中的两个头实体h1和h2或两个尾实体t1和t2具有更高的语义相似度,如果如果这两个三元组具有不同的关系,则其中的两个头实体h1和h2或尾实体t1和t2具有更低的语义相似度,定义衡量这两个三元组中实体类型的语义相关度的能量函数E2((h1,r1,t1),(h2,r2,t2))为:
其中,h1和h2为头实体,r1和r2为关系,t1和t2为尾实体;和分别是实体类型表示关于关系r1和关系r2的两个注意力权重矩阵;和分别为头实体h1和h2的实体类型表示,和分别为尾实体t1和t2的实体类型表示。
3.根据权利要求2所述的一种引入实体类型自动化表示的知识图谱嵌入与推理方法,其特征在于,所述步骤二中,定义三元组(h,r,t)关于实体表示的能量函数E3(h,r,t)为:
技术研发人员:李波,牛广林,张永飞,李晶阳,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。