【技术实现步骤摘要】
知识图谱推理模型训练方法、设备和存储介质
[0001]本专利技术涉及人工智能
,尤其涉及一种知识图谱推理模型训练方法、设备和存储介质。
技术介绍
[0002]知识图谱(knowledge graph,简称KG)可视为包含多种关系的图。在图中,每个节点是一个实体(如人名、地名、事件和活动等),任意两个节点之间的边表示这两个节点之间的关系。一般而言,可以将知识图谱中任意两个相连的节点及其所连接边表示成三元组(triplet),即(头实体节点,关系,尾实体节点),例如:(北京,首都,中国)。
[0003]知识图谱推理是一种通过模仿人类社会认知模式来探索机器智能的方法。人们结合数理逻辑、关系路径、分布式表示等广泛地研究了基于知识图谱的常识推理算法,并借助深度学习模型实现了在一阶逻辑查询下推理能力的泛化。一种进行知识图谱推理的方式是通过将知识图谱和查询嵌入到低维向量空间来进行一阶逻辑(First
‑
Order
‑
Logical,简称FOL)推理。不同于基本的三元组结构,一阶逻辑通过逻辑谓词和逻辑量化的组合来实现,比如使用了存在、合取、析取、否定、映射等逻辑运算符,非常适合来描述关系。围绕这些逻辑运算符,使得知识图谱推理模型的学习目标通常专注于逻辑映射而非实体、关系的表征。
[0004]然而一阶逻辑推理往往需要人工定义的逻辑范式(或者说逻辑结构),对未见过的逻辑范式归纳能力较弱,使得泛化程度较差,并且相对较差的表征会导致推理模型难以抵抗噪声,进而对推理准确性造成不利影响, ...
【技术保护点】
【技术特征摘要】
1.一种知识图谱推理模型训练方法,其特征在于,包括:获取与第一一阶逻辑结构对应的第一多元组,所述第一多元组中包括从预设训练查询信息中确定的多个实体节点和至少一个关系,所述多个实体节点中包括至少一个锚实体节点和目标实体节点;在预设的知识图谱中分别确定所述第一多元组中所述多个实体节点各自对应的第一临实体节点;在包含所述多个实体节点以及所述多个实体节点各自对应的第一临实体节点的推理子图中,确定第二多元组以及所述第二多元组对应的第二一阶逻辑结构;在所述知识图谱中确定目标多元组中任一实体节点对应的第二临实体节点,所述目标多元组是所述第一多元组和所述第二多元组中任一个;根据所述任一实体节点及其第二临实体节点各自对应的第一向量表示的拼接结果确定所述任一实体节点对应的第二向量表示,以得到所述目标多元组对应的向量表示集,所述向量表示集中包含所述目标多元组内各实体节点的第二向量表示以及各关系的初始向量表示;根据所述向量表示集对知识图谱推理模型进行训练。2.根据权利要求1所述的方法,其特征在于,所述在预设的知识图谱中分别确定所述第一多元组中所述多个实体节点各自对应的第一临实体节点,包括:在所述知识图谱中确定所述第一多元组中所述至少一个锚实体节点各自的入方向的临实体节点,以及确定所述目标实体节点的出方向和入方向的临实体节点。3.根据权利要求1所述的方法,其特征在于,所述在所述知识图谱中确定目标多元组中任一实体节点对应的第二临实体节点,包括:在所述知识图谱中确定所述目标多元组中任一实体节点的出方向和入方向的临实体节点。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据预先训练的知识图谱嵌入模型,获取所述目标多元组和所述知识图谱中包含的各实体节点的第一向量表示;其中,所述知识图谱嵌入模型的训练过程包括:获取目标三元组,所述目标三元组中包括头实体节点、关系和尾实体节点;其中,所述目标三元组包括所述知识图谱内包含的三元组,或者,所述目标三元组包括所述知识图谱内包含的三元组以及从所述目标多元组中拆分出的三元组;对所述头实体节点的初始向量表示和所述关系的初始向量表示的拼接结果进行多个卷积层的卷积操作,以得到融合向量表示;根据所述融合向量表示与所述拼接结果的加和结果,确定所述尾实体节点的目标向量表示;根据所述目标向量表示与所述尾实体节点的初始向量表示,确定用于训练所述知识图谱嵌入模型的损失函数值。5.根据权利要求1所述的方法,其特征在于,所述根据所述向量表示集对知识图谱推理模型进行训练,包括:将所述向量表示集和所述目标多元组对应的目标一阶逻辑结构的标识信息发送至预设的提示网络模型,以使所述提示网络模型确定与所述目标一阶逻辑结构对应的提示向量
以及所述提示向量与所述向量表示集中包含的各锚实体节点的第二向量表示和各关系的初始向量表示的融合结果;将所述融合结果输入所述知识图谱推理模型,以得到所述知识图谱推理模型输出的与所述目标实体节点对应的预测向量表示;根据所述预测向量表示与所述向量表示集中包含的所述目标实体节点的第二向量表示,确定所述目标多元组对应的目标损失函数值,以根据所述目标损失函数值训练所述知识图谱推理模型和所述提示网络模型。6.根据权利要求5所述的方法,其特征在于,所述根据所述预测向量表示与所述向量表示集中包含的所述目标实体节点的第二向量表示,确定所述目标多元组对应的目标损失函数值,包括:在所述知识图谱中确定与所述目标多元组对应的非目标实体节点以及确定所述非目标实体节点对应的第一向量表示,所述非目标实体节点与所述目标多元组中所述至少一个锚实体节点和所述目标实体节点不同,所述第一向量表示是基于预先训练的知识图谱嵌入模型获得的;根据所述预测向量表示与所述目标实体节点的第二向量表示确定第一损失函数值,以及根据所述预测向量表示与所述非目标实体节点的第一向量表示确定第二损失函数值;根据所述第一损失函数值和所述第二损失函数值确定所述目标多元组对应的第一目标损失函数值,以根据所述第一目标损失函数值训练所述知识图谱推理模型和所述提示网络模型。7.根据权利要求6所述的方法,其特征在于,所述目标多元组是相应目标一阶逻辑结构对应的训练集中的任一多元组,所述目标一阶逻辑结构是多种一阶逻辑结构中的一种;所述根据所述第一目标损失函数值训练所述知识图谱推理模型和所述提示网络模型,包括:根据当前一轮迭代训练过程中,所述目标一阶逻辑结构对应的训练集中多个多元组各自对应的第一目标损失函数值,确定所述当前一轮迭代训练过程中所述目标一阶逻辑结构对应的第二目标损失函数值;根据所述当前一轮迭代训练过...
【专利技术属性】
技术研发人员:谢晓颖,龚镖,吕逸良,赵德丽,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。