一种基于仿射变换与偏置建模的知识图谱推理方法与系统技术方案

技术编号：32128099 阅读：18 留言：0更新日期：2022-01-29 19:21

本发明专利技术公开了一种基于仿射变换与偏置建模的知识图谱推理方法与系统，其获取来自用户的问题(包含实体e和关系r)，输入训练好的知识图谱嵌入模型中，以得到预测结果。本发明专利技术给出了实体和关系的具体表示，将实体映射到实域空间，并为每个实体学习一个偏置，用以解决实体不确定性。将关系表示为两个向量，对解决实体不确定性后的头实体进行仿射变换。本发明专利技术通过引入偏置和仿射变换来对知识图谱进行建模表示，能够解决当前嵌入模型无法有效地学习和推理知识图谱中各种关系模式的问题，从而能够有效提升实体和关系的表示能力和知识图谱链接预测的准确性。预测的准确性。预测的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于仿射变换与偏置建模的知识图谱推理方法与系统

[0001]本专利技术属于知识图谱嵌入领域，更具体地，涉及一种基于仿射变换与偏置建模的知识图谱推理方法与系统。

技术介绍

[0002]知识图谱(Knowledge Graph,简称KG)是一个由事实三元组组成的多关系有向图。在一个三元组(h,r,t)中，我们分别用h和t表示头实体和尾实体，而r则是头实体和尾实体之间的关系。因此，在一个多关系的有向图中，头实体通过关系指向尾实体。近年来，研究人员构建了许多大规模的知识图谱，如WordNet、YAGO和Freebase，这些图谱捕捉了各个领域的知识。经过预处理，它们可以很好地用于自然语言处理(NLP)的各种下游任务，包括问题回答、推荐和对话系统等等。然而，由于现实的复杂性，知识图谱仍然缺乏大量的事实三元组，根据已知的事实三要元组推断实体之间缺失的链接的任务被称为链接预测，它已被广泛用于知识图谱完成(Knowledge Graph Completion,简称KGC)中。
[0003]链接预测的一个有效方法是知识图谱嵌入(Knowledge Graph Embedding，简称KGE)。它的关键思想是将KG中的实体和关系映射到一个连续的矢量空间，以简化操作，同时保留知识图谱的固有语义和结构。现有的知识图谱嵌入方法包括浅层语义模型方法和深度学习模型方法；针对基于浅层语义模型的主流方法而言，在初始化实体和向量之后，通过设计一个有效的评分函数，来充分地拟合各种关系模式，保证低复杂度也能得到更好的性能；针对基于深度学习的主流...

【技术保护点】

【技术特征摘要】
1.一种基于仿射变换与偏置建模的知识图谱推理方法，其特征在于，包括以下步骤：(1)获取头实体h和关系r；(2)将步骤(1)得到的头实体h和关系r输入训练好的知识图谱嵌入模型中，以得到对应的分数列表；(3)将步骤(2)得到的分数列表中的所有分数按照从高到低的顺序进行排序之后，取出所有尾实体中的第一个尾实体与步骤(1)中得到的头实体h和关系r一起构成三元组，作为知识图谱推理结果。2.根据权利要求1所述的基于仿射变换与偏置建模的知识图谱推理方法，其特征在于，知识图谱嵌入模型是通过以下方法训练得到的：(2
‑
1)获取知识图谱数据集，并将知识图谱数据集随机划分为训练集、验证集和测试集，每个知识图谱数据是由头实体h、关系r以及尾实体t组成的三元组(h，r，t)构成，所有实体构成实体集合E，所有关系构成关系集合R；(2
‑
2)对步骤(2
‑
1)得到的训练集中的实体集合E和关系集合R进行随机初始化，以获得每一个实体的嵌入表示和每一个关系的嵌入表示；(2
‑
3)将步骤(2
‑
2)得到的训练集中所有实体的嵌入表示和关系的嵌入表示输入知识图谱嵌入模型中，并使用基于自对抗负采样的方法对知识图谱嵌入模型中实体的嵌入表示和关系的嵌入表示进行迭代训练，直到该知识图谱嵌入模型收敛为止，从而得到训练好的知识图谱嵌入模型。(2
‑
4)根据步骤(2
‑
1)得到的知识图谱验证集对初步训练好的知识图谱嵌入模型进行验证，直到得到的基于自对抗负采样的最小化排名目标达到最优为止，从而得到训练好的知识图谱嵌入模型。3.根据权利要求1或2所述的基于仿射变换与偏置建模的知识图谱推理方法，其特征在于，知识图谱数据集是公开的知识图谱数据集FB15k
‑
237、WN18RR或YAGO3
‑
10。4.根据权利要求1至3中任意一项所述的基于仿射变换与偏置建模的知识图谱推理方法，其特征在于，步骤(2
‑
2)中，每一个实体和每一个关系的嵌入表示的大小均为2d，d的取值范围为1～1000，每一个嵌入表示均满足均匀分布；其中，实体的前d维嵌入表示为e(h或者t)，后d维嵌入表示为该实体的偏置b
e
(b
h
或者b
t
)；而关系的前d维嵌入表示是该关系的权重w
r
，后d维嵌入表示是该关系的偏置b
r
。5.根据权利要求1或2所述的基于仿射变换与偏置建模的知识图谱推理方法，其特征在于，步骤(2
‑
3)具体为：首先，根据步骤(2
‑
...

【专利技术属性】
技术研发人员：宋勃升，苏祥，曾湘祥，
申请(专利权)人：湖南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人