一种参数共享的知识图谱的补全推演方法及装置制造方法及图纸

技术编号:23445805 阅读:23 留言:0更新日期:2020-02-28 19:59
本发明专利技术提出了一种参数共享的知识图谱的补全推演方法及装置,知识图谱的补全方法包括:训练所述知识图谱的实体向量和关系向量;基于所述实体向量和所述关系向量计算基准向量,基于所述基准向量确定待预测实体或待预测关系,以进行所述知识图谱的补全。根据本发明专利技术的参数共享的知识图谱的补全推演方法,包括训练和预测两部分,通过训练可以得到实体向量和关系向量,从而获得三元组中已知的实体或关系对应的向量,并计算基准向量,根据基准向量预测确定待预测的实体或关系,实现知识图谱的补全。由此,用更简练的模型框架、更小的模型参数规模,实现了对知识图谱推理与补全,提高了知识图谱的补全操作效率。

A method and device for complementing and deducing knowledge map of parameter sharing

【技术实现步骤摘要】
一种参数共享的知识图谱的补全推演方法及装置
本专利技术涉及信息处理
,尤其涉及一种参数共享的知识图谱的补全推演方法及装置。
技术介绍
为了适应和处理不断涌现的新的应用需求,大量基于表示学习的知识图谱推演与补全模型陆续被提出。这些模型在不断提高计算准确率的同时,模型的特征空间规模和复杂度也在不断攀升,导致模型整体效率无法令人满意,而且灵活性和可扩展性较差、训练成本较高,无法应用于大规模知识图谱。
技术实现思路
本专利技术要解决的技术问题是解决相关技术中知识图谱补全模型结构和参数复杂而导致计算量过大的问题,本专利技术提出了一种参数共享的知识图谱的补全推演方法及装置。根据本专利技术实施例的参数共享的知识图谱的补全推演方法,包括:训练所述知识图谱的实体向量和关系向量;基于所述实体向量和所述关系向量计算基准向量,基于所述基准向量确定待预测实体或待预测关系,以进行所述知识图谱的补全。根据本专利技术实施例的参数共享的知识图谱的补全推演方法,包括训练和预测两部分,通过训练可以得到实体向量和关系向量,从而获得三元组中已知的实体或关系对应的向量,并计算基准向量,根据基准向量预测确定待预测的实体或关系,实现知识图谱的补全。由此,用更简练的模型框架、更小的模型参数规模,实现了对知识图谱推理与补全,提高了知识图谱的补全操作效率。根据本专利技术的一些实施例,所述基于所述实体向量和所述关系向量计算基准向量,基于所述基准向量确定待预测实体或待预测关系,包括:针对待预测尾实体,通过已知的头实体向量和已知的关系向量计算得到尾实体基准向量;遍历所述知识图谱中的所有实体向量,将与所述尾实体基准向量相似度最高的所述实体向量对应的所述实体作为所述待预测尾实体;或者,针对待预测头实体,通过已知的尾实体向量和已知的关系向量计算得到头实体基准向量;遍历所述知识图谱中的所有实体向量,将与所述头实体基准向量相似度最高的所述实体向量对应的所述实体作为所述待预测头实体;或者,针对待预测关系,通过已知的头实体向量和已知的尾实体向量计算得到关系基准向量;遍历所述知识图谱中的所有关系向量,将与所述关系基准向量相似度最高的所述关系向量对应的所述关系作为所述待预测关系。在本专利技术的一些实施例中,所述训练所述知识图谱的实体向量和关系向量,包括:将所述知识图谱的所述实体向量和所有关系向量均随机初始化;针对待预测的实体或关系,从所述知识图谱中选择相应候选样本;基于所述候选样本,训练所述知识图谱的实体向量和关系向量。根据本专利技术的一些实施例,所述针对待预测的实体或关系,从所述知识图谱中选择相应候选样本,包括:针对待预测尾实体,从所述知识图谱中选择候选尾实体集合;或者,针对待预测头实体,从所述知识图谱中选择候选头实体集合;或者,针对待预测关系,从所述知识图谱中选择候选关系集合。在本专利技术的一些实施例中,在训练所述实体向量和所述关系向量时,采用Listwise排序的损失函数。根据本专利技术实施例的参数共享的知识图谱的补全推演装置,包括:训练模块,用于训练所述知识图谱的实体向量和关系向量;预测补全模块,用于基于所述实体向量和所述关系向量计算基准向量,基于所述基准向量确定待预测实体或待预测关系,以进行所述知识图谱的补全。根据本专利技术实施例的参数共享的知识图谱的补全推演装置,通过训练可以得到实体向量和关系向量,预测补全模块可以从训练得到的实体向量和关系向量中,获得三元组中已知的实体或关系对应的向量,并计算基准向量,根据基准向量预测确定待预测的实体或关系,实现知识图谱的补全。由此,用更简练的模型框架、更小的模型参数规模,实现了对知识图谱推理与补全,提高了知识图谱的补全操作效率。根据本专利技术的一些实施例,预测补全模块具体用于:针对待预测尾实体,通过已知的头实体向量和已知的关系向量计算得到尾实体基准向量,遍历所述知识图谱中的所有实体向量,将与所述尾实体基准向量相似度最高的所述实体向量对应的所述实体作为所述待预测尾实体;或者,针对待预测头实体,通过已知的尾实体向量和已知的关系向量计算得到头实体基准向量,遍历所述知识图谱中的所有实体向量,将与所述头实体基准向量相似度最高的所述实体向量对应的所述实体作为所述待预测头实体;或者,针对待预测关系,通过已知的头实体向量和已知的尾实体向量计算得到关系基准向量,遍历所述知识图谱中的所有关系向量,将与所述关系基准向量相似度最高的所述关系向量对应的所述关系作为所述待预测关系。在本专利技术的一些实施例中,所述训练模块包括:初始化模块,用于将所述知识图谱的所述实体向量和所有关系向量均随机初始化;选择模块,用于针对待预测的实体或关系,从所述知识图谱中选择相应候选样本;计算模块,用于基于所述候选样本,训练所述知识图谱的实体向量和关系向量。根据本专利技术的一些实施例,针对待预测尾实体,所述选择模块具体用于从所述知识图谱中选择候选尾实体集合;或者,针对待预测头实体,所述选择模块具体用于从所述知识图谱中选择候选头实体集合;或者针对待预测关系,所述选择模块具体用于从所述知识图谱中选择候选关系集合。根据本专利技术实施例的计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的知识图谱的补全方法的步骤。根据本专利技术实施例的计算机存储介质,可以通过处理器执行本专利技术提出的知识图谱的补全方法,实现相比于传统表示模型参数规模降低、模型性能提升的“双向”改良,摆脱了对复杂特征工程的依赖。而且,将的Softmax回归策略引入基于Listwise排序损失函数,实现协同地同时考虑所有被预测的得分,提升在多标签分类任务中的效果。另外,基于Listwise排序损失函数实现对知识推理与补全效率的提升:实现正确候选答案的得分需要被最大化,错误候选答案的得分需要被最小化;实现排在错误候选答案前面的正确候选答案的数量需要被最大化。附图说明图1是根据本专利技术实施例的参数共享的知识图谱的补全推演方法流程图;图2A是根据本专利技术实施例的预测尾实体的方法流程图;图2B是根据本专利技术实施例的预测头实体的方法流程图;图2C是根据本专利技术实施例的预测关系的方法流程图;图3是根据本专利技术实施例的训练实体向量和关系向量的方法流程图;图4A是根据本专利技术实施例的预测尾实体时,训练实体向量和关系向量的方法流程图;图4B是根据本专利技术实施例的预测头实体时,训练实体向量和关系向量的方法流程图;图4C是根据本专利技术实施例的预测关系时,训练实体向量和关系向量的方法流程图;图5是根据本专利技术实施例的参数共享的知识图谱的补全推演装置的结构示意图;图6是根据本专利技术实施例的知识图谱补全计算方法的示意图。具体实施方式为更进一步阐述本专利技术为达成预定目的所采取的技术手段及功效,以下结合附图及较佳实施例,对本专利技术进行详本文档来自技高网...

【技术保护点】
1.一种参数共享的知识图谱的补全推演方法,其特征在于,包括:/n训练所述知识图谱的实体向量和关系向量;/n基于所述实体向量和所述关系向量计算基准向量,基于所述基准向量确定待预测实体或待预测关系,以进行所述知识图谱的补全。/n

【技术特征摘要】
1.一种参数共享的知识图谱的补全推演方法,其特征在于,包括:
训练所述知识图谱的实体向量和关系向量;
基于所述实体向量和所述关系向量计算基准向量,基于所述基准向量确定待预测实体或待预测关系,以进行所述知识图谱的补全。


2.根据权利要求1所述的参数共享的知识图谱的补全推演方法,其特征在于,所述基于所述实体向量和所述关系向量计算基准向量,基于所述基准向量确定待预测实体或待预测关系,包括:
针对待预测尾实体,通过已知的头实体向量和已知的关系向量计算得到尾实体基准向量;遍历所述知识图谱中的所有实体向量,将与所述尾实体基准向量相似度最高的所述实体向量对应的所述实体作为所述待预测尾实体;或者,
针对待预测头实体,通过已知的尾实体向量和已知的关系向量计算得到头实体基准向量;遍历所述知识图谱中的所有实体向量,将与所述头实体基准向量相似度最高的所述实体向量对应的所述实体作为所述待预测头实体;或者,
针对待预测关系,通过已知的头实体向量和已知的尾实体向量计算得到关系基准向量;遍历所述知识图谱中的所有关系向量,将与所述关系基准向量相似度最高的所述关系向量对应的所述关系作为所述待预测关系。


3.根据权利要求1所述的参数共享的知识图谱的补全推演方法,其特征在于,所述训练所述知识图谱的实体向量和关系向量,包括:
将所述知识图谱的所述实体向量和所有关系向量均随机初始化;
针对待预测的实体或关系,从所述知识图谱中选择相应候选样本;
基于所述候选样本,训练所述知识图谱的实体向量和关系向量。


4.根据权利要求3所述的参数共享的知识图谱的补全推演方法,其特征在于,所述针对待预测的实体或关系,从所述知识图谱中选择相应候选样本,包括:
针对待预测尾实体,从所述知识图谱中选择候选尾实体集合;或者,
针对待预测头实体,从所述知识图谱中选择候选头实体集合;或者
针对待预测关系,从所述知识图谱中选择候选关系集合。


5.根据权利要求3所述的参数共享的知识图谱的补全推演方法,其特征在于,在训练所述实体向量和所述关系向量时,采用Listwise排序的损失函数。


6....

【专利技术属性】
技术研发人员:王亚珅张欢欢谢海永
申请(专利权)人:中国电子科技集团公司电子科学研究院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1