知识图谱表示学习方法及系统技术方案

技术编号:27656454 阅读:31 留言:0更新日期:2021-03-12 14:18
本发明专利技术提供一种知识图谱表示学习方法及系统,该方法包括:根据知识图谱中的三元组的首实体、尾实体以及关系实体,计算初始评价函数;根据所述首实体及对应的实体类型、尾实体及对应的实体类型,计算用于表征属于相同实体类型的实体之间关系的第一关系参数,以及计算用于表征属于相关实体类型的实体之间关系的第二关系参数;将所述初始评价函数减去所述第一关系参数与第二关系参数的和作为最终评价函数,通过最小化所述最终评价函数,学习得到所述三元组的向量表示。本发明专利技术计算简单高效,能满足大规模知识图谱的时效性要求。

【技术实现步骤摘要】
知识图谱表示学习方法及系统
本专利技术涉及领域知识图谱
,尤其涉及一种知识图谱表示学习方法及系统。
技术介绍
在当前知识表示技术中,考虑层级实体类型作为实体的外部信息方面,主要方法是,将实体类型作为投影矩阵。首先将实体(头实体/尾实体)映射到投影矩阵,该投影矩阵为各层级实体类型对应的投影矩阵的组合,再计算三元组的得分函数。该方法考虑了含层级的实体类型,然而,由于每个实体类型都需要学习一个投影矩阵,导致计算复杂度较高,不能满足大规模知识图谱的时效性要求。
技术实现思路
有鉴于此,本专利技术提供一种知识图谱表示学习方法以及系统,计算简单高效,能满足大规模知识图谱的时效性要求。一方面,本专利技术提供一种知识图谱表示学习方法,包括:根据知识图谱中的三元组的首实体、尾实体以及关系实体,计算初始评价函数;其中,所述首实体表示为:所述首实体所属实体类型的中心向量与所述首实体所属实体类型指向所述首实体的残差向量之和;所述尾实体表示为:所述尾实体所属实体类型的中心向量与所述尾实体所属实体类型指向所述尾实体的残差向量之和;根据所述首实体及对应的实体类型、尾实体及对应的实体类型,计算用于表征属于相同实体类型的实体之间关系的第一关系参数,以及计算用于表征属于相关实体类型的实体之间关系的第二关系参数;将所述初始评价函数减去所述第一关系参数与第二关系参数的和作为最终评价函数,通过最小化所述最终评价函数,学习得到所述三元组的向量表示。进一步地,所述首实体所属实体类型的中心向量表示为:所述首实体所属实体类型的父实体类型的中心向量与所述首实体所属实体类型的父实体类型指向所述首实体所属实体类型的残差向量之和;所述尾实体所属实体类型的中心向量表示为:所述尾实体所属实体类型的父实体类型的中心向量与所述尾实体所属实体类型的父实体类型指向所述尾实体所属实体类型的残差向量之和。进一步地,根据所述首实体及对应的实体类型、尾实体及对应的实体类型,计算用于表征属于相同实体类型的实体之间关系的第一关系参数的步骤通过如下公式实现:其中,e表示实体,ε表示实体集合,t表示实体类型,表示实体类型集合,mintra表示预设的用于表征同类型实体相似度的参数。进一步地,根据所述首实体及对应的实体类型、尾实体及对应的实体类型,计算用于表征属于相关实体类型的实体之间关系的第二关系参数的步骤通过如下公式实现:其中,tf表示父实体类型,Tf\{tf}表示除父实体类型外其余实体类型集合,Tf\{tf,ti}表示除父实体类型、当前实体类型外其余实体类型集合,minter表示预设的用于表征相关类型实体相似度的参数。进一步地,其中,minter为实体类型层数L的函数,具体为:其中,NL为第L层节点的数量。另一方面,本专利技术提供一种知识图谱表示学习系统,包括:实体关系提取单元,用于根据知识图谱中的三元组的首实体、尾实体以及关系实体,计算初始评价函数;其中,所述首实体表示为:所述首实体所属实体类型的中心向量与所述首实体所属实体类型指向所述首实体的残差向量之和;所述尾实体表示为:所述尾实体所属实体类型的中心向量与所述尾实体所属实体类型指向所述尾实体的残差向量之和;实体类型关系提取单元,用于根据所述首实体及对应的实体类型、尾实体及对应的实体类型,计算用于表征属于相同实体类型的实体之间关系的第一关系参数,以及计算用于表征属于相关实体类型的实体之间关系的第二关系参数;知识图谱学习单元,用于将所述初始评价函数减去所述第一关系参数与第二关系参数的和作为最终评价函数,通过最小化所述最终评价函数,学习得到所述三元组的向量表示。进一步地,所述首实体所属实体类型的中心向量表示为:所述首实体所属实体类型的父实体类型的中心向量与所述首实体所属实体类型的父实体类型指向所述首实体所属实体类型的残差向量之和;所述尾实体所属实体类型的中心向量表示为:所述尾实体所属实体类型的父实体类型的中心向量与所述尾实体所属实体类型的父实体类型指向所述尾实体所属实体类型的残差向量之和。进一步地,所述实体类型关系提取单元,用于根据如下公式得到第一关系参数:其中,e表示实体,ε表示实体集合,t表示实体类型,表示实体类型集合,mintra表示预设的用于表征同类型实体相似度的参数。进一步地,所述实体类型关系提取单元,用于根据如下公式得到第二关系参数:其中,tf表示父实体类型,Tf\{tf}表示除父实体类型外其余实体类型集合,Tf\{tf,ti}表示除父实体类型、当前实体类型外其余实体类型集合,minter表示预设的用于表征相关类型实体相似度的参数。进一步地,其中,minter为实体类型层数L的函数,具体为:其中,NL为第L层节点的数量。本专利技术知识图谱表示学习方法及系统,考虑了实体的实体类型的外部信息,通过第一关系参数以及第二关系参数的引入使实体之间更加具有区分能力,并引入残差嵌入,将实体向量表示为中心向量与残差向量之和,使相同类型的实体可以共享中心向量,该方法学习到的实体、实体类型,都可以利用欧氏距离进行计算,计算简单高效,能满足大规模知识图谱的时效性要求。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为根据本专利技术示例性第一实施例的知识图谱表示学习方法的流程图。图2为根据本专利技术示例性第二实施例的知识图谱表示学习方法中的人物知识图谱示意图。图3为根据本专利技术示例性第二实施例的知识图谱表示学习方法的学习结果示意图。图4为根据本专利技术示例性第三实施例的知识图谱表示学习系统的结构框图。具体实施方式下面结合附图对本专利技术实施例进行详细描述。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合;并且,基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。如图1所示,本专利技术一种知识图谱表示学习方法,包括:步骤101,根据知识图谱中的三元组的首实体、尾实体以及关系实体,计算初始评价函数;其中,所述首实体表示为:所述首实本文档来自技高网...

【技术保护点】
1.一种知识图谱表示学习方法,其特征在于,包括:/n根据知识图谱中的三元组的首实体、尾实体以及关系实体,计算初始评价函数;其中,所述首实体表示为:所述首实体所属实体类型的中心向量与所述首实体所属实体类型指向所述首实体的残差向量之和;所述尾实体表示为:所述尾实体所属实体类型的中心向量与所述尾实体所属实体类型指向所述尾实体的残差向量之和;/n根据所述首实体及对应的实体类型、尾实体及对应的实体类型,计算用于表征属于相同实体类型的实体之间关系的第一关系参数,以及计算用于表征属于相关实体类型的实体之间关系的第二关系参数;/n将所述初始评价函数减去所述第一关系参数与第二关系参数的和作为最终评价函数,通过最小化所述最终评价函数,学习得到所述三元组的向量表示。/n

【技术特征摘要】
1.一种知识图谱表示学习方法,其特征在于,包括:
根据知识图谱中的三元组的首实体、尾实体以及关系实体,计算初始评价函数;其中,所述首实体表示为:所述首实体所属实体类型的中心向量与所述首实体所属实体类型指向所述首实体的残差向量之和;所述尾实体表示为:所述尾实体所属实体类型的中心向量与所述尾实体所属实体类型指向所述尾实体的残差向量之和;
根据所述首实体及对应的实体类型、尾实体及对应的实体类型,计算用于表征属于相同实体类型的实体之间关系的第一关系参数,以及计算用于表征属于相关实体类型的实体之间关系的第二关系参数;
将所述初始评价函数减去所述第一关系参数与第二关系参数的和作为最终评价函数,通过最小化所述最终评价函数,学习得到所述三元组的向量表示。


2.根据权利要求1所述的知识图谱表示学习方法,其特征在于,所述首实体所属实体类型的中心向量表示为:所述首实体所属实体类型的父实体类型的中心向量与所述首实体所属实体类型的父实体类型指向所述首实体所属实体类型的残差向量之和;
所述尾实体所属实体类型的中心向量表示为:所述尾实体所属实体类型的父实体类型的中心向量与所述尾实体所属实体类型的父实体类型指向所述尾实体所属实体类型的残差向量之和。


3.根据权利要求2所述的知识图谱表示学习方法,其特征在于,根据所述首实体及对应的实体类型、尾实体及对应的实体类型,计算用于表征属于相同实体类型的实体之间关系的第一关系参数的步骤通过如下公式实现:



其中,e表示实体,ε表示实体集合,t表示实体类型,表示实体类型集合,mintra表示预设的用于表征同类型实体相似度的参数。


4.根据权利要求3所述的知识图谱表示学习方法,其特征在于,根据所述首实体及对应的实体类型、尾实体及对应的实体类型,计算用于表征属于相关实体类型的实体之间关系的第二关系参数的步骤通过如下公式实现:



其中,tf表示父实体类型,Tf\{tf}表示除父实体类型外其余实体类型集合,Tf\{tf,ti}表示除父实体类型、当前实体类型外其余实体类型集合,minter表示预设的用于表征相关类型实体相似度的参数。


5.根据权利要求4所述的知识图谱表示学习方法,其特征在于,其中,minter为实体类型层数L的函数,具体为:



其...

【专利技术属性】
技术研发人员:胡碧峰侯乐赵从志
申请(专利权)人:和美深圳信息技术股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1