模型训练方法、图数据处理方法、装置、设备及存储介质制造方法及图纸

技术编号：35299406 阅读：17 留言：0更新日期：2022-10-22 12:47

本申请提供了一种模型训练方法、图数据处理方法、装置、设备及存储介质；方法包括：获取预设的图神经网络模型和训练数据；利用图神经网络模型确定各个训练节点的训练表示向量；确定训练图结构的补图结构和补图结构的第一邻接矩阵，获取训练图结构的第二邻接矩阵；基于第一邻接矩阵、第二邻接矩阵和各个训练节点的训练表示向量确定第一损失函数分量；基于图神经网络模型预设的第二损失函数分量和第一损失函数分量确定联合损失函数；利用联合损失函数、各个训练节点的训练表示向量和各个训练节点的训练标签，对图神经网络模型进行训练，得到训练好的图神经网络模型。通过本申请，能够提高图神经网络模型对信号描述的全面性。提高图神经网络模型对信号描述的全面性。提高图神经网络模型对信号描述的全面性。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练方法、图数据处理方法、装置、设备及存储介质

[0001]本申请涉及人工智能
，尤其涉及一种图数据处理方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]近年来，图结构的数据成了数据挖掘领域的研究热点，比如社交网络、引文网络、合作者网络，知识图谱、推荐系统等等。图数据由若干的节点和节点之间连的若干边构成，对这种数据的充分理解的利用离不开为其中的每一个节点生成一个表示向量。相关技术中利用图卷积网络和图注意力网络来确定节点的表示向量时往往无法捕捉到高频信号成分，随着层数的增加使得不同节点的分类信息趋于一致，从而出现过平滑问题，大大降低下游任务处理的准确度；例如在推荐任务处理时，会为差异较大的用户推荐相同的对象，不能实现精准推荐。

技术实现思路

[0003]本申请实施例提供一种模型训练方法、图数据处理方法、装置、设备及存储介质，能够提高神经网络模型对信号描述的全面性。
[0004]本申请实施例的技术方案是这样实现的：
[0005]本申请实施例提供一种模型训练方法，包括：
[0006]获取预设的图神经网络模型和训练数据，所述训练数据包括训练图结构和所述训练图结构中各个训练节点的标签信息；
[0007]利用所述图神经网络模型确定所述各个训练节点的训练表示向量；
[0008]确定所述训练图结构的补图结构和所述补图结构的第一邻接矩阵，获取所述训练图结构的第二邻接矩阵；
[0009]基于所述第一邻接矩阵、所述第二邻接矩阵和所述各个训练节点的训练表示...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其特征在于，所述方法还包括：获取预设的图神经网络模型和训练数据，所述训练数据包括训练图结构和所述训练图结构中各个训练节点的标签信息；利用所述图神经网络模型确定所述各个训练节点的训练表示向量；确定所述训练图结构的补图结构和所述补图结构的第一邻接矩阵，获取所述训练图结构的第二邻接矩阵；基于所述第一邻接矩阵、所述第二邻接矩阵和所述各个训练节点的训练表示向量确定第一损失函数分量；基于所述图神经网络模型预设的第二损失函数分量和所述第一损失函数分量确定联合损失函数；利用所述联合损失函数、所述各个训练节点的训练表示向量和所述各个训练节点的训练标签，对所述图神经网络模型进行训练，得到训练好的图神经网络模型。2.根据权利要求1中所述的方法，其特征在于，所述利用所述图神经网络模型确定所述各个训练节点的训练表示向量，包括：获取所述各个训练节点的属性信息，并基于所述各个训练节点的属性信息确定所述各个训练节点的特征向量；利用所述图神经网络模型对所述各个训练节点的特征向量和所述第二邻接矩阵进行编码处理，得到所述各个训练节点的训练表示向量。3.根据权利要求1中所述的方法，其特征在于，所述确定所述训练图结构的补图结构，包括：基于所述训练图结构的第二邻接矩阵，确定所述训练图结构中各个训练节点的非邻居节点集合；从所述各个训练节点的非邻居节点集合中确定预设个数的目标非邻居节点；将所述各个训练节点和各自对应的目标非邻居节点连接，构成所述训练图结构的补图结构。4.根据权利要求1中所述的方法，其特征在于，所述第一损失函数分量包括第一正则子项和第二正则子项，所述基于所述第一邻接矩阵、所述第二邻接矩阵和所述各个训练节点的训练表示向量确定第一损失函数分量，包括：获取第一超参数和第二超参数；对所述第一邻接矩阵的第i行第j列对应的第一邻接系数、第i个训练节点的训练向量、第j个训练节点的训练向量的转置的乘积进行求和处理，得到能够表示高通滤波器的第一正则子项；对所述第二邻接矩阵的第i行第j列对应的第二邻接系数、第i个训练节点的训练向量、第j个训练节点的训练向量的转置的乘积进行求和处理，得到能够表示低通滤波器的第二正则子项；利用所述第一超参数和所述第二超参数对所述第一正则子项和所述第二正则子项进行加权求和，得到所述第一损失函数分量。5.根据权利要求1中所述的方法，其特征在于，所述利用所述联合损失函数、所述各个训练节点的训练表示向量和所述各个训练节点的训练标签，对所述图神经网络模型进行训
练，得到训练好的图神经网络模型，包括：利用所述图神经网络模型对所述各个训练节点的训练表示向量进行预测处理，得到各个训练节点的预测信息；基于所述各个训练节点的预测信息、所述各个训练节点的训练标签和所述联合损失函数确定损失值；当根据所述损失值确定所述联合损失函数未收敛时，基于所述联合损失函数，对图神经网络模型的参数进行调整，直至得到训练好的图神经网络模型。6.根据权利要求1至5任一项所述的方法，其特征在于，所述方法还包括：获取测试数据，所述测试数据包括测试图结构和所述测试图结构中各个测试节点的标签信息；利用所述训练好的图神经网络模型对所述测试图结构进行预测处理，得到所述测试图结构中各个测试节点的预测信息；基于所述各个测试节点的预测信息和对应的标签信息确定所述训练好的图神经网络模型的评估指标值；确定所述评估指标值小于预设的指标阈值，再次获取训练数据；利用所述训练数据对所述训练好的图神经网络模型继续进行训练，直至再次训练好的图神经网络模型的评估指标值达到所述指标阈值。7.一种图数据处理方法，其特征在于...

【专利技术属性】
技术研发人员：孙嘉齐，赵胜林，白星宇，石书玮，
申请(专利权)人：深圳市腾讯信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人