一种关系预测方法及系统技术方案

技术编号：26689778 阅读：25 留言：0更新日期：2020-12-12 02:39

本发明专利技术提供一种关系预测方法及系统，方法包括：对原始训练数据进行向量化处理，得到路径关系向量组；对所述路径关系向量组进行模型解码处理，得到关系特征表述向量；对所述关系特征表述向量进行模型构建，得到特征模型；根据所述特征模型分别对多个待测数据进行关系矩阵的计算，得到多个关系矩阵；对多个所述关系矩阵进行最小值筛选处理，得到最小关系矩阵，并将所述最小关系矩阵对应的所述待测数据作为所述路径关系向量组并进行模型解码处理得到预测数据。本发明专利技术有效的提高预测准确性，并具有良好的鲁棒性，能够合理准确的预测出目标节点的关系，实现了以少部分数据为依托去预测推理其它同类数据的关系或标签。

全部详细技术资料下载

【技术实现步骤摘要】
一种关系预测方法及系统
本专利技术主要涉及数据挖掘
，具体涉及一种关系预测方法及系统。
技术介绍
基于知识图谱预测和推理问题的相关研究具有广泛的应用价值，不仅能够应用于自然语言中的问答系统，也能用于语音补全和推荐系统中。现有技术无法实现深度挖邻居节点与目标相关节点之间的相互影响程度，从而无法尽可能多的挖掘图数据中信息，同时也无法在多维特征空间实现节点特性的精准表达,进而不能合理准确的预测出目标节点的关系，更加无法实现以少部分数据为依托去预测推理其它同类数据的关系或标签。
技术实现思路
本专利技术所要解决的技术问题是针对现有技术的不足，提供一种关系预测方法及系统。本专利技术解决上述技术问题的技术方案如下：一种关系预测方法，包括如下步骤：S1：对原始训练数据进行向量化处理，得到路径关系向量组；S2：对所述路径关系向量组进行模型解码处理，得到关系特征表述向量；S3：对所述关系特征表述向量进行模型构建，得到特征模型；S4：根据所述特征模型分别对多个待测数据进行关系矩阵的计算，得到多个关系矩阵；S5：对多个所述关系矩阵进行最小值筛选处理，得到最小关系矩阵，并将所述最小关系矩阵对应的所述待测数据作为所述路径关系向量组，返回步骤S2进行模型解码处理，得到预测数据。本专利技术解决上述技术问题的另一技术方案如下：一种关系预测系统，包括：数据处理模块，用于对原始训练数据进行向量化处理，得到路径关系向量组；模型解码模块，用于对所述路径关系向量...

【技术保护点】
1.一种关系预测方法，其特征在于，包括如下步骤：/nS1：对原始训练数据进行向量化处理，得到路径关系向量组；/nS2：对所述路径关系向量组进行模型解码处理，得到关系特征表述向量；/nS3：对所述关系特征表述向量进行模型构建，得到特征模型；/nS4：根据所述特征模型分别对多个待测数据进行关系矩阵的计算，得到多个关系矩阵；/nS5：对多个所述关系矩阵进行最小值筛选处理，得到最小关系矩阵，并将所述最小关系矩阵对应的所述待测数据作为所述路径关系向量组，返回步骤S2进行模型解码处理，得到预测数据。/n

【技术特征摘要】
1.一种关系预测方法，其特征在于，包括如下步骤：
S1：对原始训练数据进行向量化处理，得到路径关系向量组；
S2：对所述路径关系向量组进行模型解码处理，得到关系特征表述向量；
S3：对所述关系特征表述向量进行模型构建，得到特征模型；
S4：根据所述特征模型分别对多个待测数据进行关系矩阵的计算，得到多个关系矩阵；
S5：对多个所述关系矩阵进行最小值筛选处理，得到最小关系矩阵，并将所述最小关系矩阵对应的所述待测数据作为所述路径关系向量组，返回步骤S2进行模型解码处理，得到预测数据。

2.根据权利要求1所述的关系预测方法，其特征在于，所述步骤S1的过程包括：
S11:对所述原始训练数据进行预处理，得到知识图谱数据；
S12:利用广度优先收索算法对所述知识图谱数据进行搜索处理，得到路径关系组；
S13:对所述路径关系组进行数据向量化处理，得到路径关系向量组。

3.根据权利要求1所述的关系预测方法，其特征在于，所述步骤S2的过程包括：
S21：通过多头RNN图注意力网络对所述路径关系向量组进行数据关联处理，得到待更替参数；
S22:通过所述待更替参数构建模型，得到解码端参数模型；
S23:对所述解码端参数模型进行解码处理，得到关系特征表述向量。

4.根据权利要求3所述的关系预测方法，其特征在于，所述待更替参数包括节点矩阵和线性化节点；
通过多头RNN图注意力网络对所述路径关系向量组进行数据关联处理，得到节点矩阵和线性化节点，具体为：
S211：通过第一式对所述路径关系向量组进行节点矩阵的计算，得到节点矩阵，所述第一式为：
G′＝G.WR，
其中，G＝{(ei,rk,ej)|ei,ej,rk∈input}，
其中，G为输入节点矩阵，input为输入路径数据，WR为节点矩阵权重参数，G′为节点矩阵；
S212：通过第二式对所述路径关系向量组进行线性化节点的计算，得到线性化节点，所述第二式为：
e″＝WEe′i+b，
其中，
其中，αijk＝softmaxjk(netijk)，
其中，netijk＝LeakyReLU(RNN(cijk))，
其中，
其中，为节点i与节点j的关系为关系k的向量，W1为节点i与节点j的关系为k的权重参数，ei为节点i，ej为节点j，rk为节点i与节点j的关系k，M为预设的多头注意力，WE为权重参数，b为偏置值，e″为线性化节点，netijk为输出关系，LeakyReLU为激活函数，RNN为rnn神经网络，αijk为注意力，softmaxjk为激活函数，elu为激活函数。

5.根据权利要求4所述的关系预测方法，其特征在于，所述步骤S22的过程包括：
S221：通过第三式对所述待更替参数进行节点间关系的计算，得到节点间的关系，所述第三式为：
output＝|sin(dh,t,r)|，
其中，
其中，...

【专利技术属性】
技术研发人员：蔡晓东，洪涛，
申请(专利权)人：桂林电子科技大学，
类型：发明
国别省市：广西;45

全部详细技术资料下载我是这个专利的主人