一种知识库学习方法技术

技术编号:39644632 阅读:12 留言:0更新日期:2023-12-09 11:12
本发明专利技术提供一种知识库学习方法,所述方法包括:

【技术实现步骤摘要】
一种知识库学习方法、补全系统以及商品推荐系统


[0001]本专利技术涉及表征学习领域,具体来说,涉及表征学习领域中的知识库嵌入技术,更具体地说,涉及一种知识库学习方法

补全系统以及商品推荐系统


技术介绍

[0002]知识图谱是结构化的语义知识库,用于以符号形式描述现实世界中的概念及其相互关系,通过知识图谱能够将现实世界获得的信息

数据以及链接关系聚集为知识,使信息资源更易于计算

理解以及评价,并能实现知识的快速响应和推理

[0003]在过去几十年中,随着众多知识图谱的出现和发展,一系列与知识图谱相关的下游任务,例如,知识问答

语义搜索和推荐系统得到了广泛且成功的应用

然而,随着数据不断增长,已有的知识图谱通常是不完整的,这限制了知识图谱在相关下游任务中
(
知识问答

语义搜索等
)
的发展与应用

为了解决该问题,研究人员提出知识库嵌入学习方法,所谓的知识库嵌入学习方法是通过将知识库中实体
(Entity)
和关系
(Relation)
嵌入到连续向量空间以学习实体和关系的低维向量表示
(
嵌入表示
)
,进而根据所学习到的实体和关系的嵌入表示来预测知识库中缺失的链接关系

[0004]现有技术中,大多数的知识库嵌入学习方法都聚焦于二元关系知识库,这些方法将二元关系事实建模为三元组
(
头实体,关系,尾实体
)
以学习实体和关系的低维向量表示,并根据所学习到的实体和关系的嵌入表示来预测知识库中缺失的链接关系

但是,现有的知识库嵌入学习方法主要聚焦于二元关系事实,即更注重学习实体和关系的个体表示,而忽略了多元关系事实

事实上,多元关系事实不应该被忽视,因为大多数现实世界的知识库同时涵盖了二元关系事实和多元关系事实,例如现有的知识库
Freebase
中超过三分之一的实体参与了多元关系事实,其中,知识库中的多元关系事实可以被定义为一个多元组,且一个多元组可被表示为:
relation(role1:entity1,

,role
n
:entity
n
)

relation
表示多元关系,
role
表示角色,
entity
表示实体,
role:entity
表示角色

实体对

多元关系事实
(
多元组
)
与二元关系事实
(
三元组
)
相比,其能够以简洁的方式提供精细的知识

为了能够学习知识库中的多元关系事实,有研究人员试图将多元关系事实转化为二元关系事实,但是实际操作时发现这是不可行的,一方面是因为多元关系事实转化为二元关系事实的计算复杂度高,另一方面是因为将多元关系事实转化为二元关系事实会失去多元关系事实的结构信息导致数据稀疏性

[0005]近年来,一些研究人员提出了针对多元关系事实的知识库嵌入学习方法,这些方法主要包括两类,一类是基于关系驱动范式的知识库嵌入学习方法,另一类是基于角色驱动范式的知识库嵌入学习方法

其中,基于关系驱动范式的知识库嵌入学习方法专注于学习多元组中多元关系和实体的个体表示,而忽略了多元组中多元关系

角色和实体之间的交互,导致在探索实体之间潜在关系方面存在缺陷,不利于链接预测;而基于角色驱动范式的知识库嵌入学习方法重视多元关系知识库中的重要角色,并利用角色促进实体和多元关系的表示,但是,这类方法只是将多元组中所有角色

实体对投影到统一的关系空间中,无
法利用多元组中角色

实体对和多元关系之间的细粒度交互,导致缺乏对多元关系推理中一些基本推理模式
(
对称性

逆转和组合
)
的支持

[0006]虽然有研究人员提出了针对多元关系事实的知识库嵌入学习方法,但是这些方法至少存在以下限制之一:
(1)
忽略了多元组中多元关系

角色和实体之间的交互,导致在探索实体之间潜在关系方面存在缺陷,不利于链接预测;
(2)
无法利用多元组中角色

实体对和多元关系之间的细粒度交互,导致缺乏对多元关系推理中一些基本推理模式
(
对称性

逆转和组合
)
的支持,不利于链接预测


技术实现思路

[0007]因此,本专利技术的目的在于克服上述现有技术的缺陷,提供一种知识库学习方法

一种知识库补全系统和一种商品推荐方法

[0008]本专利技术的目的是通过以下技术方案实现的

[0009]根据本专利技术的第一方面,提供一种知识库学习方法,所述方法包括:
S1、
获取已有的知识库并进行初始化以获取学习数据及其对应的初始嵌入表示,其中,所述学习数据包括多个多元组,每一个多元组均包括一个多元关系及与该多元关系对应的一个或多个角色

实体对,且每一角色

实体对被分配一个子关系;
S2、
以预设的损失函数为学习目标,按照预设的迭代方式对所述学习数据进行多轮迭代学习以得到其对应的目标嵌入表示

[0010]在本专利技术的一些实施例中,所述初始嵌入表示包括:所有多元组中每一多元关系的初始嵌入表示

每一角色在不同多元关系下的初始嵌入表示

每一实体在不同角色下的初始嵌入表示以及每一角色

实体对对应的子关系初始嵌入表示

[0011]在本专利技术的一些实施例中,所述学习数据包括多个正样本以及与每个正样本对应的负样本集合,所述每个负样本集合包括一个或多个负样本,所述每个正样本和负样本均为多元组,其中,所述正样本为正确的多元组,所述负样本为错误的多元组

[0012]在本专利技术的一些实施例中,在所述步骤
S2
中,所述预设的迭代方式为按照如下步骤执行每一轮迭代学习:
S21、
基于上一轮迭代学习后得到的所述学习数据对应的嵌入表示,按照预设的规则进行实体变换以获取当前轮实体变换对应的嵌入表示;
S22、
基于当前轮实体变换对应的嵌入表示,按照预设的评分函数对每个多元组进行评分;
S23、
基于步骤
S22
得到的每个多元组的评分按照预设的损失函数计算当本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种知识库学习方法,其特征在于,所述方法包括:
S1、
获取已有的知识库并进行初始化以获取学习数据及其对应的初始嵌入表示,其中,所述学习数据包括多个多元组,每一个多元组均包括一个多元关系及与该多元关系对应的一个或多个角色

实体对,且每一角色

实体对被分配一个子关系;
S2、
以预设的损失函数为学习目标,按照预设的迭代方式对所述学习数据进行多轮迭代学习以得到其对应的目标嵌入表示
。2.
根据权利要求1所述的方法,其特征在于,所述初始嵌入表示包括:所有多元组中每一多元关系的初始嵌入表示

每一角色在不同多元关系下的初始嵌入表示

每一实体在不同角色下的初始嵌入表示以及每一角色

实体对对应的子关系初始嵌入表示
。3.
根据权利要求2所述的方法,其特征在于,所述学习数据包括多个正样本以及与每个正样本对应的负样本集合,所述每个负样本集合包括一个或多个负样本,所述每个正样本和负样本均为多元组,其中,所述正样本为正确的多元组,所述负样本为错误的多元组
。4.
根据权利要求3所述的方法,其特征在于,在所述步骤
S2
中,所述预设的迭代方式为按照如下步骤执行每一轮迭代学习:
S21、
基于上一轮迭代学习后得到的所述学习数据对应的嵌入表示,按照预设的规则进行实体变换以获取当前轮实体变换对应的嵌入表示;
S22、
基于当前轮实体变换对应的嵌入表示,按照预设的评分函数对每个多元组进行评分;
S23、
基于步骤
S22
得到的每个多元组的评分按照预设的损失函数计算当前轮迭代学习损失,并基于该迭代学习损失更新上一轮迭代学习后得到的所述学习数据对应的嵌入表示,以获取当前轮迭代学习后的所述学习数据对应的嵌入表示;其中,第一轮迭代学习时基于所述步骤
S1
得到的所述学习数据对应的初始嵌入表示进行迭代学习
。5.
根据权利要求4所述的方法,其特征在于,在所述步骤
S21
中,所述预设的规则为按照如下步骤进行实体变换:
S211、
基于上一轮迭代学习后得到的每个多元组中每一角色嵌入表示按照第一嵌入函数计算每个多元组中每一角色的当前轮嵌入表示;
S212、
基于步骤
S211
得到的每个多元组中每一角色的当前轮嵌入表示以及上一轮迭代学习后得到的每一实体在不同角色下的嵌入表示,按照第二嵌入函数计算每个多元组中每一实体的当前轮第一嵌入表示;
S213、
基于上一轮迭代学习后得到的每个多元组中每一角色

实体对的子关系嵌入表示,按照第三嵌入函数对所述步骤
S212
得到的每个多元组中每一实体的当前轮第一嵌入表示进行子关系变换,以获取每个多元组中每一实体的当前轮第二嵌入表示;
S214、
对步骤
S213
得到的每个多元组中每一实体的当前轮第二嵌入表示进行几何变换,得到每个多元组中每一实体的当前轮第三嵌入表示
。6.
根据权利要求5所述的方法,其特征在于,所述第一嵌入函数为:所述的方法,其特征在于,所述第一嵌入函数为:
其中,表示在多元组对应的多元关系
r
下的第
j
个角色的当前轮嵌入表示,
r
表示多元组对应的多元关系,
λ
表示上一轮迭代学习后得到的多元组中所有角色对应的注意力向量,
λ
T
表示
λ
的转置,表示上一轮迭代学习后得到的多元组中第
i
个位置的角色在多元关系
r
下的嵌入表示,
λ
i
表示上一轮迭代学习后得到的多元组中第
i
个位置的角色对应的注意力向量,
n
表示多元组中
n
个位置,
Softmax(
·
)
表示归一化指数函数;所述第二嵌入函数为:其中,
E
k
表示多元组对应的第
k
个实体的当前轮第一嵌入表示,表示上一轮迭代学习后得到的多元组对...

【专利技术属性】
技术研发人员:许倩倩曹宗胜杨智勇操晓春黄庆明
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1