图神经网络的训练方法及装置制造方法及图纸

技术编号:26731520 阅读:26 留言:0更新日期:2020-12-15 14:34
本说明书实施例提供一种图神经网络的训练方法,包括:获取关系网络图,其中各个对象节点对应采样概率集,包括针对其每个一阶邻居节点的采样概率;基于该关系网络图,对该图神经网络进行多轮迭代更新,其中任一轮包括:以本轮选取的第一标签节点为中心,进行M阶邻居节点采样,其中任意的第i阶邻居节点采样包括,针对已采样的第i‑1阶邻居节点中任意的第一节点,基于其当前采样概率集,从其一阶邻居节点全集中采样若干邻居节点归入第i阶邻居节点;基于采样到的M阶以内的邻居节点和该第一标签节点带有的第一业务标签,对该图神经网络进行本轮更新;利用更新后图神经网络确定若干邻居节点对应的若干训练反馈,进而更新第一节点的当前采样概率集。

【技术实现步骤摘要】
图神经网络的训练方法及装置
本说明书实施例涉及计算机
,尤其涉及一种图神经网络的训练方法及装置。
技术介绍
关系网络图是对现实世界中实体之间的关系的描述,目前广泛地应用于各种计算机信息处理中。一般地,关系网络图包含节点集合和边集合,节点表示现实世界中的实体,边表示现实世界中实体之间的联系。例如,在社交网络中,人就是实体,人和人之间的关系或联系就是边。在很多情况下,希望对关系网络图中的节点、边等的拓扑特性进行分析,从中提取出有效信息,实现这类过程的计算方法称为图计算。典型地,希望将关系网络图中的每个节点(实体)用相同维度的向量来表示,也就是生成针对每个节点的节点向量。如此,生成的节点向量可以应用于计算节点和节点之间的相似度,发现图中的社团结构,预测未来可能形成的边联系,以及对图进行可视化等。节点向量的生成方法已成为图计算的基础算法。根据一种方案,可以利用图神经网络(GraphNeuralNetworks,简称GNN),生成关系网络图中节点的节点向量。通常,图神经网络在确定某个节点的嵌入表达时需要使用它多阶邻居的信息,但是,随本文档来自技高网...

【技术保护点】
1.一种图神经网络的训练方法,包括:/n获取关系网络图,其中包括对应于多个业务对象的多个对象节点,以及对象节点之间存在关联关系而形成的连接边;该多个对象节点中包括带有业务标签的多个标签节点;该多个对象节点各自对应采样概率集,其中包括对应对象节点针对其每个一阶邻居节点的采样概率;/n基于所述关系网络图,对所述图神经网络进行多轮迭代更新,其中任一轮迭代更新包括:/n以本轮选取的第一标签节点为中心,进行M阶邻居节点采样,其中任意的第i阶邻居节点采样包括,针对已采样的第i-1阶邻居节点中任意的第一节点,基于其当前采样概率集,从其一阶邻居节点全集中采样若干邻居节点归入第i阶邻居节点;/n基于采样到的M阶...

【技术特征摘要】
1.一种图神经网络的训练方法,包括:
获取关系网络图,其中包括对应于多个业务对象的多个对象节点,以及对象节点之间存在关联关系而形成的连接边;该多个对象节点中包括带有业务标签的多个标签节点;该多个对象节点各自对应采样概率集,其中包括对应对象节点针对其每个一阶邻居节点的采样概率;
基于所述关系网络图,对所述图神经网络进行多轮迭代更新,其中任一轮迭代更新包括:
以本轮选取的第一标签节点为中心,进行M阶邻居节点采样,其中任意的第i阶邻居节点采样包括,针对已采样的第i-1阶邻居节点中任意的第一节点,基于其当前采样概率集,从其一阶邻居节点全集中采样若干邻居节点归入第i阶邻居节点;
基于采样到的M阶以内的邻居节点,确定所述第一标签节点的嵌入向量;
根据所述嵌入向量以及所述第一标签节点带有的第一业务标签,对所述图神经网络进行本轮更新;
针对所述任意的第一节点,利用本轮更新后的图神经网络,得到其采样的若干邻居节点所对应的若干节点嵌入向量;
确定所述若干邻居节点所对应的若干训练反馈,其中各个训练反馈与对应节点的节点嵌入向量的范数正相关,且与对应节点的当前采样概率负相关;
基于所述若干训练反馈,更新所述第一节点对应的当前采样概率集。


2.根据权利要求1所述的方法,其中,所述多个业务对象归属以下中的至少一类:用户、商户、商品、服务、事件。


3.根据权利要求1所述的方法,其中,基于其当前采样概率集,从其一阶邻居节点全集中采样若干邻居节点归入第i阶邻居节点,包括:
基于其当前采样概率集合,对其一阶邻居节点全集进行无放回采样,得到所述若干邻居节点,归入第i阶邻居节点。


4.根据权利要求1所述的方法,其中,根据所述嵌入向量以及所述第一标签节点带有的第一业务标签,对所述图神经网络进行本轮更新,包括:
将所述嵌入向量输入针对业务对象的业务预测模型中,得到对应的业务预测结果;
基于所述业务预测结果和所述第一业务标签,训练所述图神经网络和业务预测模型。


5.根据权利要求4所述的方法,所述业务预测模型用于预测业务对象的分类值或回归值。


6.根据权利要求1所述的方法,其中,所述多个对象节点还各自对应采样权重集,其中包括对应对象节点针对其每个一阶邻居节点的采样权重;其中,基于所述若干训练反馈,更新所述第一节点对应的当前采样概率集,包括:
针对所述第一节点的当前采样权重集,对其中对应若干邻居节点的采样权重进行更新,其中各个更新后的采样权重与对应节点的更新前采样权重和训练反馈正相关;
基于更新后的当前采样权重集,更新所述当前采样概率集,其中各个更新后的采样概率正相关于对应节点的采样权重。


7.根据权利要求6所述的方法,其中,所述各个更新后的采样权重还与所述一阶邻居节点全集中节点的总数负相关。


8.根据权利要求6所述的方法,其中,基于更新后的当前采样权重集,更新所述当前采样概率集,包括:
针对所述一阶邻居节点全集中的各个节点,确定其当前采样权重与所述当前采样权重集中权重的和值之间的比值,并确定与该比值正相关的更新后采样权重。


9.一种图神经网络的训练装置,包括:
关系图获取单元,配置为获取关系网络图,其中包括对应于多个业务对象的多个对象节点,以及对象节点之间存在关联关系而形成的连接...

【专利技术属性】
技术研发人员:吴郑伟刘子奇
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1