【技术实现步骤摘要】
多元关系知识库构建方法和系统
[0001]本申请涉及人工智能领域中的知识图谱技术,更具体地讲,涉及一种多元关系知识库构建方法和系统。
技术介绍
[0002]随着信息网络技术的快速发展,各种信息网络数据内容呈现爆炸式增长的态势。这样的内容通常具有大规模、异质多元、组织结构松散的特点,给人们有效获取信息和知识提出了挑战。知识图谱(KG,Knowledge Graph)是语义网络的知识库,能够用可视化技术描述知识资源及其载体,并挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
[0003]知识图谱作为一种特殊的图形结构,实体(entities)作为结点,关系(relations)作为有向边,最近引起了很多人的兴趣。在常见的知识图谱中,每个边缘被表示为具有(头部实体,关系,尾部实体)这一形式的三元组(s,r,o),以指示两个实体s(即,头部实体)和o(即,尾部实体)通过关系r连接,例如(NewYork,isLocatedIn,USA)可表示NewYork位于USA。在过去的几十年中建立了许多大型知识图谱,例如WordN ...
【技术保护点】
【技术特征摘要】
1.一种多元关系知识库构建方法,所述方法包括:针对多元关系知识库中的多元组构建多元关系模型,并建立对应估分函数和损失函数,其中,所述多元关系知识库中的每个多元组由一个关系和多个实体构成,所述一个关系与所述多个实体中的每个实体之间的对应语义由角色来指示,并且所述一个关系的各个角色与所述多个实体中的对应实体之间的对应观测事实构成与该多元组对应的观测事实集合,其中,所述估分函数用于指示与每个多元组对应的观测事实集合中的角色与实体之间的关联性;基于所述估分函数和损失函数,使用从所述多元关系知识库获得的训练样本对所述多元关系模型进行训练,其中,训练样本是与所述多元关系知识库中的不具有缺失实体的多元组对应的观测事实集合;基于经过训练的多元关系模型来预测并补全所述多元关系知识库中具有缺失实体的多元组中的缺失实体,并基于补全了缺失实体的各个多元组来构建完整的多元关系知识库。2.如权利要求1所述的方法,其中,建立估分函数的步骤包括:建立包括预定数量的潜在角色基本向量的潜在角色空间,并基于所述潜在角色基本向量来确定每个角色的角色嵌入向量;将每个实体映射到针对语义的预定数量的语义嵌入向量;确定每个角色的角色敏感模式矩阵,其中,角色敏感模式矩阵指示该角色与各个实体的语义嵌入向量之间的交互强度;基于角色嵌入向量、语义嵌入向量以及角色敏感模式矩阵来建立所述估分函数,其中,每个角色的角色嵌入向量由所述潜在角色基本向量的组合来表示,并且其中,每个角色的角色敏感模式矩阵是基于与所述潜在角色基本向量关联的基本矩阵建立的。3.如权利要求2所述的方法,其中,所述估分函数被表示为:其中,其中,其中,其中,且k
′
=1,2,...,K,其中,表示所述多元关系知识库中的元数为(a
r
+1)的多元组,r指示该多元组中的关系且r∈关系域e
i
指示该多元组中的第i个实体且e
i
∈实体域ε,是关系r的角色的集合,
是与该多元组对应的观测事实集合,a
r
≥2且a
r
是正整数,是关系r的第i个角色的嵌入向量,是角色的嵌入向量的对应角色权重矢量,指示由实体e
i
的m个语义嵌入向量构成的矩阵,是角色的角色敏感模式矩阵并且其第j行指示与所述多元组中的第j个实体e
j
的m个语义嵌入向量的交互强度,是潜在角色空间中的第k个潜在角色基本向量并且是与所述第k个潜在角色基本向量关联的基本矩阵,Φ是利用温度参数进行归一化的函数并且T
u
是针对角色权重矢量的温度参数且T
P
是针对角色敏感模式矩阵的温度参数,其中,d指示角色的嵌入向量维度,K是预设的潜在角色空间的大小并且指示潜在角色基本向量的数量,并且m是预定值。4.如权利要求3所述的方法,其中,所述损失函数表示为:其中,表示针对正样本构建的a
r
组负样本的集合,φ是所述估分函数,表示实体域ε中与所述正样本中的实体e
i
不同的另一实体,表示替换正样本中的第q个实体所获得的负样本集合,1≤q≤a
r
且q为正整数。5.如权利要求4所述的方法,其中,...
【专利技术属性】
技术研发人员:姚权铭,
申请(专利权)人:第四范式北京技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。