【技术实现步骤摘要】
一种知识库学习方法、补全系统以及商品推荐系统
[0001]本专利技术涉及表征学习领域,具体来说,涉及表征学习领域中的知识库嵌入技术,更具体地说,涉及一种知识库学习方法
、
补全系统以及商品推荐系统
。
技术介绍
[0002]知识图谱是结构化的语义知识库,用于以符号形式描述现实世界中的概念及其相互关系,通过知识图谱能够将现实世界获得的信息
、
数据以及链接关系聚集为知识,使信息资源更易于计算
、
理解以及评价,并能实现知识的快速响应和推理
。
[0003]在过去几十年中,随着众多知识图谱的出现和发展,一系列与知识图谱相关的下游任务,例如,知识问答
、
语义搜索和推荐系统得到了广泛且成功的应用
。
然而,随着数据不断增长,已有的知识图谱通常是不完整的,这限制了知识图谱在相关下游任务中
(
知识问答
、
语义搜索等
)
的发展与应用
。
为了解决该问题,研究人员提出知识库嵌入学习方法,所谓的知识库嵌入学习方法是通过将知识库中实体
(Entity)
和关系
(Relation)
嵌入到连续向量空间以学习实体和关系的低维向量表示
(
嵌入表示
)
,进而根据所学习到的实体和关系的嵌入表示来预测知识库中缺失的链接关系
。
[0004]现有技术中,大多数的知识库嵌入学习方法都聚焦于二元关 ...
【技术保护点】
【技术特征摘要】
1.
一种知识库学习方法,其特征在于,所述方法包括:
S1、
获取已有的知识库并进行初始化以获取学习数据及其对应的初始嵌入表示,其中,所述学习数据包括多个多元组,每一个多元组均包括一个多元关系及与该多元关系对应的一个或多个角色
‑
实体对,且每一角色
‑
实体对被分配一个子关系;
S2、
以预设的损失函数为学习目标,按照预设的迭代方式对所述学习数据进行多轮迭代学习以得到其对应的目标嵌入表示
。2.
根据权利要求1所述的方法,其特征在于,所述初始嵌入表示包括:所有多元组中每一多元关系的初始嵌入表示
、
每一角色在不同多元关系下的初始嵌入表示
、
每一实体在不同角色下的初始嵌入表示以及每一角色
‑
实体对对应的子关系初始嵌入表示
。3.
根据权利要求2所述的方法,其特征在于,所述学习数据包括多个正样本以及与每个正样本对应的负样本集合,所述每个负样本集合包括一个或多个负样本,所述每个正样本和负样本均为多元组,其中,所述正样本为正确的多元组,所述负样本为错误的多元组
。4.
根据权利要求3所述的方法,其特征在于,在所述步骤
S2
中,所述预设的迭代方式为按照如下步骤执行每一轮迭代学习:
S21、
基于上一轮迭代学习后得到的所述学习数据对应的嵌入表示,按照预设的规则进行实体变换以获取当前轮实体变换对应的嵌入表示;
S22、
基于当前轮实体变换对应的嵌入表示,按照预设的评分函数对每个多元组进行评分;
S23、
基于步骤
S22
得到的每个多元组的评分按照预设的损失函数计算当前轮迭代学习损失,并基于该迭代学习损失更新上一轮迭代学习后得到的所述学习数据对应的嵌入表示,以获取当前轮迭代学习后的所述学习数据对应的嵌入表示;其中,第一轮迭代学习时基于所述步骤
S1
得到的所述学习数据对应的初始嵌入表示进行迭代学习
。5.
根据权利要求4所述的方法,其特征在于,在所述步骤
S21
中,所述预设的规则为按照如下步骤进行实体变换:
S211、
基于上一轮迭代学习后得到的每个多元组中每一角色嵌入表示按照第一嵌入函数计算每个多元组中每一角色的当前轮嵌入表示;
S212、
基于步骤
S211
得到的每个多元组中每一角色的当前轮嵌入表示以及上一轮迭代学习后得到的每一实体在不同角色下的嵌入表示,按照第二嵌入函数计算每个多元组中每一实体的当前轮第一嵌入表示;
S213、
基于上一轮迭代学习后得到的每个多元组中每一角色
‑
实体对的子关系嵌入表示,按照第三嵌入函数对所述步骤
S212
得到的每个多元组中每一实体的当前轮第一嵌入表示进行子关系变换,以获取每个多元组中每一实体的当前轮第二嵌入表示;
S214、
对步骤
S213
得到的每个多元组中每一实体的当前轮第二嵌入表示进行几何变换,得到每个多元组中每一实体的当前轮第三嵌入表示
。6.
根据权利要求5所述的方法,其特征在于,所述第一嵌入函数为:所述的方法,其特征在于,所述第一嵌入函数为:
其中,表示在多元组对应的多元关系
r
下的第
j
个角色的当前轮嵌入表示,
r
表示多元组对应的多元关系,
λ
表示上一轮迭代学习后得到的多元组中所有角色对应的注意力向量,
λ
T
表示
λ
的转置,表示上一轮迭代学习后得到的多元组中第
i
个位置的角色在多元关系
r
下的嵌入表示,
λ
i
表示上一轮迭代学习后得到的多元组中第
i
个位置的角色对应的注意力向量,
n
表示多元组中
n
个位置,
Softmax(
·
)
表示归一化指数函数;所述第二嵌入函数为:其中,
E
k
表示多元组对应的第
k
个实体的当前轮第一嵌入表示,表示上一轮迭代学习后得到的多元组对...
【专利技术属性】
技术研发人员:许倩倩,曹宗胜,杨智勇,操晓春,黄庆明,
申请(专利权)人:中国科学院计算技术研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。