一种知识图谱表示模型及其方法技术

技术编号:15792132 阅读:202 留言:0更新日期:2017-07-09 23:27
本发明专利技术公开了一种知识图谱表示模型及其方法,其涉及知识图谱表示技术领域,所述表示模型包括实体空间模块、优化函数模块、以及模型训练模块;所述实体空间用于表示实体特征的表示空间,其包括本征态空间和拟态空间;所述优化函数用于表示不同实体在翻译之后的距离,其包括距离计算和权重向量;所述模型训练模块用于特征训练并输出训练结果,所述训练结果用于进行知识图谱预测和分类。本发明专利技术基于动态表示空间的翻译模型,对每一个关系设置一个动态的表示空间,解决现有技术中表示模型无法区分不同关系空间的问题,提供了更为全面可靠的表示方法,并降低了模型的复杂度提高算法的效率,在实际应用中取得了较好的效果。

【技术实现步骤摘要】
一种知识图谱表示模型及其方法
本专利技术涉及知识图谱表示
,具体涉及一种知识图谱表示模型及其方法。
技术介绍
目前在世界范围内已有的知识图谱表示方法主要集中在利用人工构建的特征和基于RDF框架表示的特征。这些特征表示方法在进行知识表示方面存在效率低下,算法复杂等问题。近几年来,利用深度学习的方法提出了一系列的知识表示方法,但当前的训练的知识表示方法多少存在一些模型复杂度较高,或者训练效率较低的问题。另外国内外的知识图谱表示方法代表性工作主要包括TransE(基于翻译的嵌入式模型)[1],TransH(基于超平面的嵌入式模型)[2],TransR(基于实体关系空间的嵌入式模型)[3],CTransR(基于聚类和实体关系空间的嵌入式模型)[3]和TransD(基于动态映射矩阵的嵌入式模型)[4]等方法.上述方法被统称为基于翻译的知识表示模型。基于翻译的模型认为,对每个三元组(h,r,t),其中的关系r是从头实体向量h到尾实体向量t的一个翻译操作,据此,Bordes等人率先提出了TransE(基于翻译的嵌入式模型)知识表示方法,TransE(基于翻译的嵌入式模型)通过欧氏距离上的偏移量来衡量计算实体之间的语义相似度,是一种简单基本的知识表示方法.它的优化目标是尽量使得h+r=t,因此相应模型学习的得分函数是fr(h,t)=||h+r-t||2,其中||h+r-t||2是h+r-t的2阶范数,即欧氏距离。TransH(基于超平面的嵌入式模型)方法建立了一个面向关系的超平面,它由一个法向量nr和翻译向量r表示,头实体向量h和尾实体向量t首先被投影到关系的超平面,得到向量h⊥=h-nrThnr和t⊥=t-nrThnr.因而,TransH(基于超平面的嵌入式模型)的优化目标变为h⊥+r=t⊥,相应的其得分函数修改为fr(h,t)=||h⊥+r-t⊥||2。TransR(基于实体关系空间的嵌入式模型)和CTransR(基于聚类和实体关系空间的嵌入式模型)希望通过建立一个映像矩阵Mr和一个向量r来表示每一个关系r,具体地,TransR(基于实体关系空间的嵌入式模型)将头实体向量h和尾实体向量t通过矩阵映射到关系向量r的层次上,得到Mrh+r=Mrt,也即TransR(基于实体关系空间的嵌入式模型)的优化目标,TransD(基于动态映射矩阵的嵌入式模型)以向量操作取代了TransR(基于实体关系空间的嵌入式模型)中的矩阵与向量的乘法操作,提高了算法效率。在实际应用中,TransE(基于翻译的嵌入式模型)[1]取得了较好的预测效果。在TransE(基于翻译的嵌入式模型)中,针对每个三元组(h,r,t),头实体向量h、尾实体向量t和关系r被表示为n维向量h(t)和r。嵌入向量t近似等于嵌入的h加上嵌入的r,即h+r≈t,TransE(基于翻译的嵌入式模型)能很好的处理一对一关系,但是在处理如一对N,N对一和N对N的复杂关系时有一个明显的缺点,具体来说,在处理复杂关系的过程中,会导致不同实体使用相同的向量,这是不符合实际情况的。TransH(基于超平面的嵌入式模型)[2]通过将头实体向量h和尾实体向量t映射到关系特异性超平面的超平面映射规则解决了复杂关系的问题。但是实体和关系是两种完全不同的概念,因此把它们放在同一向量空间是不正确的。TransR(基于实体关系空间的嵌入式模型)/CTransR(基于聚类和实体关系空间的嵌入式模型)[3]和TransD(基于动态映射矩阵的嵌入式模型)[4]提出了把实体和关系放在不同向量空间的两种新颖的模型,例如:实体空间和多重关系空间,TransR(基于实体关系空间的嵌入式模型)对每个关系r设定了一个映射矩阵Mr,然后用Mr将实体映射到关系空间中。在关系空间中,用Mr映射后的实体向量和关系向量r可以构造一个黄金三元组,这个三元组被描述为Mrh+r≈Mrt。作为对TransR(基于实体关系空间的嵌入式模型)的扩展,CTransR(基于聚类和实体关系空间的嵌入式模型)使用簇算法对TransE(基于翻译的嵌入式模型)的初始结果进行了分割,将每个关系r分为几个子关系rs。在某种程度上,使用rs替换r解决了每个关系的多义性问题。TransD(基于动态映射矩阵的嵌入式模型)使用两个向量ep和hp为每个实体-关系对构造了动态的映射矩阵。但TransR(基于实体关系空间的嵌入式模型)/CTransR(基于聚类和实体关系空间的嵌入式模型)的算法复杂度较高,没法在实际中应用。【1】BordesA,UsunierN,Garcia-DuranA,etal.Translatingembeddingsformodelingmulti-relationaldata[C]//ProcofNIPS.Cambridge,MA:MITPress,2013:2787–2795【2】WangZhen,ZhangJianwen,FengJianlin,etal.Knowledgegraphembeddingbytranslatingonhyperplanes[C]//ProcofAAAI.MenloPark,CA:AAAI,2014:1112–1119【3】LinYankai,LiuZhiyuan,SunMaosong,etal.Learningentityandrelationembeddingsforknowledgegraphcompletion[C]//ProcofAAAI.MenloPark,CA:AAAI,2015【4】JiGuoliang,HeShizhu,XuLiheng,etal.Knowledgegraphembeddingviadynamicmappingmatrix[C]//ProcofACL.StroudsburgPA:ACL,2045:687–696
技术实现思路
本专利技术的目的在于提出能够提高知识图谱的表示能力的一种知识图谱表示模型及其方法,其对知识图谱的补全和校验也有及其重要的作用。为了实现本专利技术的目的,本专利技术的第一技术方案具体如下:一种知识谱图表示模型,所述表示模型包括实体空间模块、优化函数模块、以及模型训练模块;所述实体空间模块用于表示实体特征的表示空间,其包括本征态空间和拟态空间;所述优化函数模块用于表示不同实体在翻译之后的距离,其包括距离计算和权重向量;所述模型训练模块用于特征训练并输出训练结果,所述训练结果用于进行知识图谱预测和分类。本专利技术的第二技术方案具体如下:一种构建所述知识谱图表示模型的方法,所述方法包括以下步骤:1)实体空间构建过程,其采用两个向量来表示实体和关系,所述两个向量包括本征态向量和拟态向量,所述本征态向量用于描述实体关系本征态,所述拟态向量用于描述实体关系拟态,所述拟态向量构成拟态矩阵,拟态向量和本征态向量共同构成实体空间的特征向量;2)优化函数过程,其包括计算头实体翻译后与尾实体的距离公式,采用权重向量表示不同维度的权重,以达到优化距离计算公式的目的;3)模型训练过程,其包括权重向量的动态训练以及防止过拟合参数的设置。本专利技术的第三技术方案具体如下:如前面所述的知识谱图表示模型的实施方法,其还包括数据采集模块、预处理模块、特征抽取模块、训练模块、知识图谱补全模块以及分本文档来自技高网
...
一种知识图谱表示模型及其方法

【技术保护点】
一种知识谱图表示模型,其特征在于,所述表示模型包括实体空间模块、优化函数模块、以及模型训练模块;所述实体空间模块用于表示实体特征的表示空间,其包括本征态空间和拟态空间;所述优化函数模块用于表示不同实体在翻译之后的距离,其包括距离计算和权重向量;所述模型训练模块用于特征训练并输出训练结果,所述训练结果用于进行知识图谱预测和分类。

【技术特征摘要】
1.一种知识谱图表示模型,其特征在于,所述表示模型包括实体空间模块、优化函数模块、以及模型训练模块;所述实体空间模块用于表示实体特征的表示空间,其包括本征态空间和拟态空间;所述优化函数模块用于表示不同实体在翻译之后的距离,其包括距离计算和权重向量;所述模型训练模块用于特征训练并输出训练结果,所述训练结果用于进行知识图谱预测和分类。2.一种构建如权利要求1所述的知识谱图表示模型的方法,其特征在于,所述方法包括:1)实体空间构建过程,其采用两个向量来表示实体和关系,所述两个向量包括本征态向量和拟态向量,所述本征态向量用于描述实体关系本征态,所述拟态向量用于描述实体关系拟态,所述拟态向量构成拟态矩阵,拟态向量和本征态向量共同构成实体空间的特征向量;2)优化函数过程,其包括计算头实体翻译后与尾实体的距离公式,采用权重向量赋予头尾实体的不同维度以不同的权重,以达到优化距离计算公式的目的;3)模型训练过程,其包括权重向量的动态训练以及防止过拟合参数的设置。3.一种如权利要...

【专利技术属性】
技术研发人员:赵翔谭真方阳曾维新葛斌肖卫东唐九阳
申请(专利权)人:中国人民解放军国防科学技术大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1