一种基于混合翻译模型的带时间知识图谱嵌入方法技术

技术编号:24331275 阅读:131 留言:0更新日期:2020-05-29 19:41
本发明专利技术公开了一种基于混合翻译模型的带时间知识图谱嵌入方法,包括以下步骤:1)输入知识图谱相关的数据集,根据数据集情况进行初始化设置;2)使用混合翻译模型对知识图谱的嵌入表示进行更新,得到嵌入表示结果;3)根据嵌入表示结果对相关知识图谱数据集进行补全操作。利用本发明专利技术能更好的解决之前算法不能同时处理时间与多元关系的问题,并且能够提高判断的准确性。

An embedding method of knowledge map with time based on hybrid translation model

【技术实现步骤摘要】
一种基于混合翻译模型的带时间知识图谱嵌入方法
本专利技术涉及知识图谱嵌入领域,具体涉及一种基于混合翻译模型的带时间知识图谱嵌入方法。
技术介绍
知识图谱是一种有向图,以现实世界中的不同实体作为节点,不同的关系作为有向图上的边。一组现实世界中存在的事实通常以三元组(h,r,t)的形式表示,其中h表示头部实体,t表示尾部实体,r表示两个实体之间的关系。虽然构建的知识图谱包含大量的事实,但是经常出现知识图谱需要补全的情况。知识图谱补全的任务即预测最有可能缺失的实体和关系,头部实体的预测即预测该情况(?,r,t)下最有可能的头部实体,对于尾部实体的预测即预测该情况(h,r,?),对于关系的预测即预测该种情况(h,?,t)。由于从真实世界所构建的知识图谱是巨大且结构复杂的,基于符号化的方法和传统逻辑的方法既不是可扩展的,也不适合于当前知识图谱补全的任务。知识图谱嵌入已经成为知识图谱补全的一种重要方法之一。在知识图谱表示学习中,基于翻译模型的知识图谱嵌入方法简单有效,并且在相关的预测任务上有良好的表现。它试图在连续向量空间中学习每个实体的低维嵌入和本文档来自技高网...

【技术保护点】
1.一种基于混合翻译模型的带时间知识图谱嵌入方法,其特征在于,包括以下步骤:/n步骤1:输入需要补全的时序知识图谱数据集,根据数据集大小进行初始化设置;/n步骤2:使用混合翻译模型对知识图谱的嵌入表示进行更新,得到嵌入表示结果;/n步骤3:根据嵌入表示结果对使用的知识图谱数据集进行补全操作。/n

【技术特征摘要】
1.一种基于混合翻译模型的带时间知识图谱嵌入方法,其特征在于,包括以下步骤:
步骤1:输入需要补全的时序知识图谱数据集,根据数据集大小进行初始化设置;
步骤2:使用混合翻译模型对知识图谱的嵌入表示进行更新,得到嵌入表示结果;
步骤3:根据嵌入表示结果对使用的知识图谱数据集进行补全操作。


2.根据权利要求1所述的基于混合翻译模型的带时间知识图谱嵌入方法,其特征在于,步骤1中,所述初始化设置具体步骤为:
步骤A1:随机初始化数据集中实体与关系,以向量的形式进行展现,得到初始的关系向量与实体向量;
步骤A2:对于每个关系向量,加入到关系集合R当中,对于每个实体向量,加入到实体集合E当中。


3.根据权利要求1所述的基于混合翻译模型的带时间知识图谱潜入方法,其特征在于,步骤2中,所述使用混合翻译模型对知识图谱的嵌入表示进行更新,具体步骤为:
步骤B1:从数据集的训练集中采样固定大小为batch的一批数据;
步骤B2:构建负样本数据集,对batch中的三元组,随机替换h、r或t生成一个错误的三元组加入到这一批数据当中,构成当前批次所用的训练数据;
步骤B3:将正确三元组(h,r,t)与错误三元组[(h,r`,t)、(h`,r,t)或(h,r,t`)]从实体空间映射到关系空间,得到关系空间中的正确三元组(h⊥,r,t⊥)与错误三元组[(h⊥,r`,t⊥)、(h⊥`,r,t⊥)或(h⊥,r,t⊥`)];
步骤B4:将关系空间中的所有三元组投影到相应时间τ所构建的超平面上;
步骤B5:计算损失函数,采用梯度下降的算法更新实体与关系的嵌入表示;
步骤B6:重复步骤B1-B5,直至得到的结果稳定。


4.根据权利要求3所述的基于混合翻译模型的带时间知识图谱嵌入方法,其特征在于,步骤B2中,所述构建负样本数据集的方式为:



h、r、t、h`、r`、t`表示实...

【专利技术属性】
技术研发人员:王治豪李鑫
申请(专利权)人:华东师范大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1