System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及自然语言处理领域,具体而言,涉及一种知识图谱归纳式关系预测方法、系统、设备及介质。
技术介绍
1、知识图谱关系预测是指在知识图谱中根据已知实体之间的关系,预测未知实体之间可能存在的关系。知识图谱关系预测可以追溯到推理和关联分析等领域。传统的知识图谱由人工构建,其中的实体和关系是通过人工标注和知识抽取等手段得到。然而,人工构建的知识图谱往往是不完整的,并且难以满足快速增长的知识需求。
2、知识图谱关系预测旨在从已有的知识图谱中学习模式和规律,以推断出未知关系。这种预测能力被广泛应用于推荐系统、智能回答、信息检索等。关系预测通常基于机器学习和图表示学习的方式;机器学习使用已知的关系事实作为训练数据,通过学习模型来预测未知关系;图表示学习则通过将实体和关系映射到低维向量空间,以捕捉实体之间的语义和结构信息,从而进行关系预测。但这类方式有很大的局限性,即当知识图谱中出现新增实体时,则需要重新学习实体嵌入才能够进行推理。
技术实现思路
1、本专利技术提供一种知识图谱归纳式关系预测方法、系统、设备及介质,解决了现有关系预测局限于对已有实体之间的关系推导,无法对未来新增的实体进行关系预测的问题。
2、在第一方面,本专利技术实施例中提供一种知识图谱归纳式关系预测方法,所述方法流程如下:
3、基于知识图谱的三元组构造图谱网络,并且基于图谱网络获取三元组对应的路径;
4、将三元组和路径转化为自然语言信息,并且将自然语言信息输入语义模型,以获
5、计算语义表示信息的相似度分数,并且基于相似度分数构造模型的损失函数;
6、迭代训练语义模型至模型的损失函数收敛,以保存训练之后的语义模型;
7、基于图谱网络和训练之后的语义模型预测实体之间的关系。
8、于上述实施例中,本专利技术采用对实体之间的关系路径进行归纳式推导,不基于实体而是专注于路径进行学习,能够预测未知实体之间的关系。
9、作为本申请一些可选实施方式,基于图谱网络获取三元组对应的路径包括正确路径和错误路径。
10、于上述实施例中,本专利技术在基于实体之间关系路径的推导中,着重进行正确路径或错误的路径之间的区分学习,基于多目标优化的方式构造多目标损失函数,增大正负样本的区分度,以实现模型优化。
11、作为本申请一些可选实施方式,基于图谱网络获取三元组对应的正确路径的流程如下:
12、将知识图谱的三元组作为正样本,以每一个正样本的头实体为起点尾实体为终点在图谱网络中按照一定的关系概率随机游走;
13、在随机游走的过程中记录路径上的关系以及路径上的实体,以形成关于正确路径的关系路径和实体路径。
14、于上述实施例中,本专利技术基于正样本采用随机游走的方式,能够采集游走路径上的关系以及实体,便于后续基于正确路径进行语义模型的训练。
15、作为本申请一些可选实施方式,基于图谱网络获取三元组对应的错误路径的流程如下:
16、将知识图谱的三元组的尾实体随机替换,以构造负样本;
17、对于每一个负样本,以负样本的头实体为起点尾实体为终点在图谱网络中按照一定关系概率随机游走;
18、在随机游走的过程中过程中记录路径上的关系以及路径上的实体,以形成关于错误路径的关系路径和实体路径。
19、于上述实施例中,本专利技术基于负样本采用随机游走的方式,能够采集游走路径上的关系以及实体,便于后续基于错误路径进行语义模型的训练。
20、作为本申请一些可选实施方式,所述关系概率的计算公式如下:
21、
22、其中,|r|表示图谱网络中关系r的数量,|r|表示图谱网络中所有关系的数量。
23、于上述实施例中,通过关系概率的计算可以指导游走过程中每一步的关系选择。
24、作为本申请一些可选实施方式,在随机游走的过程中,如果游走深度达到深度阈值,则重新开始游走。
25、于上述实施例中,通过设置游走深度控制机制能够控制游走的时间,防止出现一直游走的情况,影响语义模型训练以及关系预测的效率的问题。
26、作为本申请一些可选实施方式,在随机游走的过程中,如果重新开始游走的次数达到数量阈值,则采用迪杰斯特拉算法获取头实体和尾实体之间的最短路径。
27、于上述实施例中,通过设置游走次数控制机制能够控制游走的时间,防止出现一直游走的情况,影响语义模型训练以及关系预测的效率的问题。
28、作为本申请一些可选实施方式,在随机游走的过程中,如果采用迪杰斯特拉算法无法获取头实体和尾实体之间的最短路径,则将关系路径和实体路径设置为空。
29、作为本申请一些可选实施方式,将三元组和路径转化为自然语言信息,并且将自然语言信息输入语义模型,以获取语义表示信息的流程如下:
30、将正样本、负样本、正确路径以及错误路径转化为自然语言文本,以得到正样本文本、负样本文本、正确路径文本以及错误路径文本;
31、分别将正样本文本、负样本文本、正确路径文本以及错误路径文本输入语义模型,以获取正样本语义向量、负样本语义向量、正确路径语义向量以及错误路径语义向量。
32、于上述实施例中,通过将相应的文本输入语义模型能够获取语义向量,以便后续进行相似度分数的计算。
33、作为本申请一些可选实施方式,计算语义表示信息的相似度分数的流程如下:
34、基于正样本语义向量和正确路径语义向量计算正样本的相似度分数;
35、基于正样本语义向量和错误路径语义向量计算错误路径的相似度分数;
36、基于负样本语义向量和错误路径语义向量计算负样本的相似度分数。
37、于上述实施例中,通过对计算相似度分数,能够进行关系学习以及关系的预测。
38、作为本申请一些可选实施方式,基于语义表示信息的相似度构造模型的损失函数的流程如下:
39、基于正样本的相似度分数构造关于正确路径的损失函数;
40、基于错误路径的相似度分数构造关于错误路径的损失函数;
41、基于正样本的相似度分数和负样本的相似度分数构造整体的损失函数;
42、基于正确路径的损失函数、错误路径的损失函数以及整体的损失函数构建模型最终的损失函数。
43、于上述实施例中,通过构造多目标损失函数,增大正负样本的区分度,以实现模型优化。
44、作为本申请一些可选实施方式,基于图谱网络和训练之后的语义模型预测实体之间的关系的流程如下:
45、基于图谱网络获取实体之间的关系路径;
46、将实体和关系路径转化为自然语言信息,并且将自然语言信息输入语义模型,以获取语义表示信息;
47、计算语义表示信息的相似度分数,并且将最高相似度分数对应的关系作为预测结果。
48、于上述实施例本文档来自技高网...
【技术保护点】
1.一种知识图谱归纳式关系预测方法,其特征在于,所述方法流程如下:
2.根据权利要求1所述的一种知识图谱归纳式关系预测方法,其特征在于,基于图谱网络获取三元组对应的路径包括正确路径和错误路径。
3.根据权利要求2所述的一种知识图谱归纳式关系预测方法,其特征在于,基于图谱网络获取三元组对应的正确路径的流程如下:
4.根据权利要求2所述的一种知识图谱归纳式关系预测方法,其特征在于,基于图谱网络获取三元组对应的错误路径的流程如下:
5.根据权利要求3或4所述的一种知识图谱归纳式关系预测方法,其特征在于,所述关系概率的计算公式如下:
6.根据权利要求3或4所述的一种知识图谱归纳式关系预测方法,其特征在于,在随机游走的过程中,如果游走深度达到深度阈值,则重新开始游走。
7.根据权利要求6所述的一种知识图谱归纳式关系预测方法,其特征在于,在随机游走的过程中,如果重新开始游走的次数达到数量阈值,则采用迪杰斯特拉算法获取头实体和尾实体之间的最短路径。
8.根据权利要求7所述的一种知识图谱归纳式关系预测方法,其特征
9.根据权利要求8所述的一种知识图谱归纳式关系预测方法,其特征在于,将三元组和路径转化为自然语言信息,并且将自然语言信息输入语义模型,以获取语义表示信息的流程如下:
10.根据权利要求9所述的一种知识图谱归纳式关系预测方法,其特征在于,计算语义表示信息的相似度分数的流程如下:
11.根据权利要求10所述的一种知识图谱归纳式关系预测方法,其特征在于,基于语义表示信息的相似度构造模型的损失函数的流程如下:
12.根据权利要求1所述的一种知识图谱归纳式关系预测方法,其特征在于,基于图谱网络和训练之后的语义模型预测实体之间的关系的流程如下:
13.一种知识图谱归纳式关系预测系统,其特征在于,所述系统包括:
14.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于:所述处理器执行计算机程序时实现权利要求1-12中任一项所述一种知识图谱归纳式关系预测方法。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-12中任一项所述一种基于对抗训练的命名实体识别模型训练方法。
...【技术特征摘要】
1.一种知识图谱归纳式关系预测方法,其特征在于,所述方法流程如下:
2.根据权利要求1所述的一种知识图谱归纳式关系预测方法,其特征在于,基于图谱网络获取三元组对应的路径包括正确路径和错误路径。
3.根据权利要求2所述的一种知识图谱归纳式关系预测方法,其特征在于,基于图谱网络获取三元组对应的正确路径的流程如下:
4.根据权利要求2所述的一种知识图谱归纳式关系预测方法,其特征在于,基于图谱网络获取三元组对应的错误路径的流程如下:
5.根据权利要求3或4所述的一种知识图谱归纳式关系预测方法,其特征在于,所述关系概率的计算公式如下:
6.根据权利要求3或4所述的一种知识图谱归纳式关系预测方法,其特征在于,在随机游走的过程中,如果游走深度达到深度阈值,则重新开始游走。
7.根据权利要求6所述的一种知识图谱归纳式关系预测方法,其特征在于,在随机游走的过程中,如果重新开始游走的次数达到数量阈值,则采用迪杰斯特拉算法获取头实体和尾实体之间的最短路径。
8.根据权利要求7所述的一种知识图谱归纳式关系预测方法,其特征在于,在随机游走的过程中,如果采用迪杰斯特拉算法无法获取头实体和尾实体之间的最短路径,则将关系路径和实体...
【专利技术属性】
技术研发人员:请求不公布姓名,请求不公布姓名,请求不公布姓名,请求不公布姓名,
申请(专利权)人:成都数之联科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。