一种关系预测方法及系统技术方案

技术编号:26689778 阅读:25 留言:0更新日期:2020-12-12 02:39
本发明专利技术提供一种关系预测方法及系统,方法包括:对原始训练数据进行向量化处理,得到路径关系向量组;对所述路径关系向量组进行模型解码处理,得到关系特征表述向量;对所述关系特征表述向量进行模型构建,得到特征模型;根据所述特征模型分别对多个待测数据进行关系矩阵的计算,得到多个关系矩阵;对多个所述关系矩阵进行最小值筛选处理,得到最小关系矩阵,并将所述最小关系矩阵对应的所述待测数据作为所述路径关系向量组并进行模型解码处理得到预测数据。本发明专利技术有效的提高预测准确性,并具有良好的鲁棒性,能够合理准确的预测出目标节点的关系,实现了以少部分数据为依托去预测推理其它同类数据的关系或标签。

【技术实现步骤摘要】
一种关系预测方法及系统
本专利技术主要涉及数据挖掘
,具体涉及一种关系预测方法及系统。
技术介绍
基于知识图谱预测和推理问题的相关研究具有广泛的应用价值,不仅能够应用于自然语言中的问答系统,也能用于语音补全和推荐系统中。现有技术无法实现深度挖邻居节点与目标相关节点之间的相互影响程度,从而无法尽可能多的挖掘图数据中信息,同时也无法在多维特征空间实现节点特性的精准表达,进而不能合理准确的预测出目标节点的关系,更加无法实现以少部分数据为依托去预测推理其它同类数据的关系或标签。
技术实现思路
本专利技术所要解决的技术问题是针对现有技术的不足,提供一种关系预测方法及系统。本专利技术解决上述技术问题的技术方案如下:一种关系预测方法,包括如下步骤:S1:对原始训练数据进行向量化处理,得到路径关系向量组;S2:对所述路径关系向量组进行模型解码处理,得到关系特征表述向量;S3:对所述关系特征表述向量进行模型构建,得到特征模型;S4:根据所述特征模型分别对多个待测数据进行关系矩阵的计算,得到多个关系矩阵;S5:对多个所述关系矩阵进行最小值筛选处理,得到最小关系矩阵,并将所述最小关系矩阵对应的所述待测数据作为所述路径关系向量组,返回步骤S2进行模型解码处理,得到预测数据。本专利技术解决上述技术问题的另一技术方案如下:一种关系预测系统,包括:数据处理模块,用于对原始训练数据进行向量化处理,得到路径关系向量组;模型解码模块,用于对所述路径关系向量组进行模型解码处理,得到关系特征表述向量;向量模型构建模块,用于对所述关系特征表述向量进行模型构建,得到特征模型;待测数据计算模块,用于根据所述特征模型分别对多个待测数据进行关系矩阵的计算,得到多个关系矩阵;预测数据获得模块,用于对多个所述关系矩阵进行最小值筛选处理,得到最小关系矩阵,并将所述最小关系矩阵对应的所述待测数据作为所述路径关系向量组,返回步骤S2进行模型解码处理,得到预测数据。本专利技术的有益效果是:通过对原始训练数据的向量化处理得到路径关系向量组,对路径关系向量组的模型解码处理得到关系特征表述向量,对关系特征表述向量的模型构建得到特征模型,能够学习到中心节点中的邻居节点间的关系特性,实现了对节点更加合理的区分,根据特征模型分别对多个待测数据的关系矩阵的计算得到多个关系矩阵,对多个关系矩阵的最小值筛选处理得到最小关系矩阵,并将最小关系矩阵对应的待测数据作为路径关系向量组进行模型解码处理得到预测数据,有效的提高预测准确性,并具有良好的鲁棒性,实现了深度挖邻居节点与目标相关节点之间的相互影响程度,从而尽可能多的挖掘图数据中信息,同时也可以在多维特征空间实现节点特性的精准表达,进而合理准确的预测出目标节点的关系,实现了以少部分数据为依托去预测推理其它同类数据的关系或标签。附图说明图1为本专利技术一实施例提供的关系预测方法的流程示意图;图2为本专利技术一实施例提供的关系预测系统的模块框图。具体实施方式以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。图1为本专利技术一实施例提供的关系预测方法的流程示意图。如图1所示,一种关系预测方法,包括如下步骤:S1:对原始训练数据进行向量化处理,得到路径关系向量组;S2:对所述路径关系向量组进行模型解码处理,得到关系特征表述向量;S3:对所述关系特征表述向量进行模型构建,得到特征模型;S4:根据所述特征模型分别对多个待测数据进行关系矩阵的计算,得到多个关系矩阵;S5:对多个所述关系矩阵进行最小值筛选处理,得到最小关系矩阵,并将所述最小关系矩阵对应的所述待测数据作为所述路径关系向量组,返回步骤S2进行模型解码处理,得到预测数据。上述实施例中,通过对原始训练数据的向量化处理得到路径关系向量组,对路径关系向量组的模型解码处理得到关系特征表述向量,对关系特征表述向量的模型构建得到特征模型,能够学习到中心节点中的邻居节点间的关系特性,实现了对节点更加合理的区分,根据特征模型分别对多个待测数据的关系矩阵的计算得到多个关系矩阵,对多个关系矩阵的最小值筛选处理得到最小关系矩阵,并将最小关系矩阵对应的待测数据作为路径关系向量组进行模型解码处理得到预测数据,有效的提高预测准确性,并具有良好的鲁棒性,实现了深度挖邻居节点与目标相关节点之间的相互影响程度,从而尽可能多的挖掘图数据中信息,同时也可以在多维特征空间实现节点特性的精准表达,进而合理准确的预测出目标节点的关系,实现了以少部分数据为依托去预测推理其它同类数据的关系或标签。可选地,作为本专利技术的一个实施例,所述步骤S1的过程包括:S11:对所述原始训练数据进行预处理,得到知识图谱数据;S12:利用广度优先收索算法对所述知识图谱数据进行搜索处理,得到路径关系组;S13:对所述路径关系组进行数据向量化处理,得到路径关系向量组。具体地,首先,所述原始训练数据可通过现有的所有计算机系统日志记录、系统的统计信息或预警信息、摄像头捕获的图像信息及其它相关的生成文件所记录的文本、语音、图像、数据流、信号等形式构成,将所述原始训练数据以‘节点-关系-节点’的形式保存;其次,通过遍历找出所有的节点与关系并对其进行编号,同时单独保存所有的节点信息与关系信息,并对其进行编号;然后,采用广度优先的算法对节点集与任意节点的路径进行搜索,并保存为路径信息,其形式为‘{1路径长度(以2为例):((节点1,关系1与源节点的关系)(节点2,与节点1的关系)),2路径长度:((节点3,节点3与源节点的关系)(节点4,与节点3的关系)).....}’;最后,将上述路径数据变为向量的形式得到路径关系向量组。应理解地,预测的节点与节点间的关系必须为知识图谱中存在的关系,且关系不能与节点重复,且节点与节点间存在一个一一对应的关系。上述实施例中,对所述原始训练数据的预处理得到知识图谱数据;利用广度优先收索算法对所述知识图谱数据的搜索处理得到路径关系组;对所述路径关系组的数据向量化处理得到路径关系向量组,为后续处理提供对应的数据,有效的提高预测准确性,并具有良好的鲁棒性,能够合理准确的预测出目标节点的关系,实现了以少部分数据为依托去预测推理其它同类数据的关系或标签。可选地,作为本专利技术的一个实施例,所述步骤S2的过程包括:S21:通过多头RNN图注意力网络对所述路径关系向量组进行数据关联处理,得到待更替参数;S22:通过所述待更替参数构建模型,得到解码端参数模型;S23:对所述解码端参数模型进行解码处理,得到关系特征表述向量。上述实施例中,通过多头RNN图注意力网络对所述路径关系向量组的数据关联处理得到待更替参数;通过所述待更替参数构建模型得到解码端参数模型;对所述解码端参数模型的解码处理得到关系特征表述向量,提高了关系预测的准确度,学习了中心节点的邻居节点间本文档来自技高网...

【技术保护点】
1.一种关系预测方法,其特征在于,包括如下步骤:/nS1:对原始训练数据进行向量化处理,得到路径关系向量组;/nS2:对所述路径关系向量组进行模型解码处理,得到关系特征表述向量;/nS3:对所述关系特征表述向量进行模型构建,得到特征模型;/nS4:根据所述特征模型分别对多个待测数据进行关系矩阵的计算,得到多个关系矩阵;/nS5:对多个所述关系矩阵进行最小值筛选处理,得到最小关系矩阵,并将所述最小关系矩阵对应的所述待测数据作为所述路径关系向量组,返回步骤S2进行模型解码处理,得到预测数据。/n

【技术特征摘要】
1.一种关系预测方法,其特征在于,包括如下步骤:
S1:对原始训练数据进行向量化处理,得到路径关系向量组;
S2:对所述路径关系向量组进行模型解码处理,得到关系特征表述向量;
S3:对所述关系特征表述向量进行模型构建,得到特征模型;
S4:根据所述特征模型分别对多个待测数据进行关系矩阵的计算,得到多个关系矩阵;
S5:对多个所述关系矩阵进行最小值筛选处理,得到最小关系矩阵,并将所述最小关系矩阵对应的所述待测数据作为所述路径关系向量组,返回步骤S2进行模型解码处理,得到预测数据。


2.根据权利要求1所述的关系预测方法,其特征在于,所述步骤S1的过程包括:
S11:对所述原始训练数据进行预处理,得到知识图谱数据;
S12:利用广度优先收索算法对所述知识图谱数据进行搜索处理,得到路径关系组;
S13:对所述路径关系组进行数据向量化处理,得到路径关系向量组。


3.根据权利要求1所述的关系预测方法,其特征在于,所述步骤S2的过程包括:
S21:通过多头RNN图注意力网络对所述路径关系向量组进行数据关联处理,得到待更替参数;
S22:通过所述待更替参数构建模型,得到解码端参数模型;
S23:对所述解码端参数模型进行解码处理,得到关系特征表述向量。


4.根据权利要求3所述的关系预测方法,其特征在于,所述待更替参数包括节点矩阵和线性化节点;
通过多头RNN图注意力网络对所述路径关系向量组进行数据关联处理,得到节点矩阵和线性化节点,具体为:
S211:通过第一式对所述路径关系向量组进行节点矩阵的计算,得到节点矩阵,所述第一式为:
G′=G.WR,
其中,G={(ei,rk,ej)|ei,ej,rk∈input},
其中,G为输入节点矩阵,input为输入路径数据,WR为节点矩阵权重参数,G′为节点矩阵;
S212:通过第二式对所述路径关系向量组进行线性化节点的计算,得到线性化节点,所述第二式为:
e″=WEe′i+b,
其中,
其中,αijk=softmaxjk(netijk),
其中,netijk=LeakyReLU(RNN(cijk)),
其中,
其中,为节点i与节点j的关系为关系k的向量,W1为节点i与节点j的关系为k的权重参数,ei为节点i,ej为节点j,rk为节点i与节点j的关系k,M为预设的多头注意力,WE为权重参数,b为偏置值,e″为线性化节点,netijk为输出关系,LeakyReLU为激活函数,RNN为rnn神经网络,αijk为注意力,softmaxjk为激活函数,elu为激活函数。


5.根据权利要求4所述的关系预测方法,其特征在于,所述步骤S22的过程包括:
S221:通过第三式对所述待更替参数进行节点间关系的计算,得到节点间的关系,所述第三式为:
output=|sin(dh,t,r)|,
其中,
其中,...

【专利技术属性】
技术研发人员:蔡晓东洪涛
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:广西;45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1