图神经网络的训练方法和系统技术方案

技术编号:31581613 阅读:13 留言:0更新日期:2021-12-25 11:25
本公开的实施方式提供了一种图神经网络的训练方法和系统,该训练方法包括:获取原始图数据结构,原始图数据结构包括:多个原始结点和原始边,原始边用于表示相连的原始结点之间的关联关系;基于图神经网络的第一数量,将原始图数据结构分为第一数量的第一图数据结构,第一图数据结构包括至少一个第一结点和至少一个第二结点,第二结点与至少一个第一结点通过原始边连接,其中,不同第一图数据结构的第一结点不同,第一数量是预先配置的;基于第一图数据结构,训练图神经网络。本公开能够对于不同数据量的原始图数据结构,均可以进行图神经网络的训练,并支持在线训练,训练效率高。训练效率高。训练效率高。

【技术实现步骤摘要】
图神经网络的训练方法和系统


[0001]本公开的实施方式涉及计算机
,更具体地,本公开的实施方式涉及一种图神经网络的训练方法和系统。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]图神经网络是一种新型的人工智能神经网络,其输入为图结构数据,输出为表征向量,用于表示对性质特征的高度概括。其中,图结构数据中的结点为对象,边为对象之间的关联关系。训练得到的图神经网络可以用于对对象的性质预测、分类以及回归。
[0004]目前的图神经网络的训练方式,采用单机对结点和/或边的数量较小的图结构数据进行训练,采用多机对结点和/或边的数量较大的图结构数据进行训练。但是对于结点和/或边的数量较大的图结构数据,如果训练机器较少时,会存在无法载入该图结构数据,进而出现无法训练的问题。

技术实现思路

[0005]在本上下文中,本公开的实施方式期望提供一种图神经网络的训练方法和系统,以解决现有技术无法采用较少的训练机器对数据量较大的图结构数据进行训练的问题。
[0006]在本公开实施方式的第一方面中,提供了一种图神经网络的训练方法,包括:获取原始图数据结构,原始图数据结构包括:多个原始结点和原始边,原始边用于表示相连的原始结点之间的关联关系;基于图神经网络的第一数量,将原始图数据结构分为第一数量的第一图数据结构,第一图数据结构包括至少一个第一结点和至少一个第二结点,第二结点与至少一个第一结点通过原始边连接,其中,不同第一图数据结构的第一结点不同,第一数量是预先配置的;基于第一图数据结构,训练图神经网络。
[0007]在本公开的再一个实施例中,基于第一图数据结构,训练图神经网络,包括:基于第一图数据结构,确定多个目标线数据结构,目标线数据结构包括主结点和至少一个辅结点,其中主结点和其中一个辅结点通过原始边连接,辅结点之间通过原始边连接,主结点和辅结点的数量之和为预先配置的采样长度,采样长度为大于1的正整数,主结点为第一图数据结构中的第一结点,任一辅结点为第一图数据结构中第一结点或第二结点;根据多个目标线数据结构,训练图神经网络。
[0008]在本公开的再一个实施例中,基于第一图数据结构,确定多个目标线数据结构,包括:提取预设个数的第一图数据结构,组合成第二图数据结构;确定第二图数据结构内的任一第一结点为键结点,与键结点具有关联关系的结点为值结点;根据键结点和值结点,确定第二图数据结构对应的多个结点序列;基于结点序列,确定多个目标线数据结构。
[0009]在本公开的再一个实施例中,基于结点序列,确定多个目标线数据结构,包括:在第一图数据结构中获取多个第一结点;对于任一第一结点,在结点序列中查询与第一结点
相同的第一键结点;确定与第一键结点属于同一结点序列的一个值结点;执行结点序列查询步骤:根据当前采样长度,在结点序列中查询当前值结点作为新的键结点所在的结点序列,在结点序列中确定新的键结点所对应的一个值结点作为辅结点或停止采样,其中,新的键结点为除第一键结点之外的其他键结点;在第一键结点和对应的所有辅结点数量未达到采样长度的情况下,继续执行结点序列查询步骤;在第一键结点和对应的所有辅结点数量达到采样长度的情况下,则将第一键结点作为目标线数据结构的主结点,根据所有辅结点之间的采样顺序,构成目标线数据结构。
[0010]在本公开的再一个实施例中,图神经网络的训练方法,还包括:接收第一配置参数,第一配置参数包括:第二数量的查询服务器;调度第二数量的查询服务器,并将属于同一第二图数据结构的结点序列对应存储在各查询服务器中。
[0011]在本公开的再一个实施例中,基于图神经网络的第一数量,将原始图数据结构分为第一数量的第一图数据结构,包括:基于图神经网络的第一数量和原始图数据结构中原始结点的序号,确定原始结点对应的标识信息;将标识信息相同的原始结点作为第一结点归类;遍历与第一结点直接相连的第二结点;根据第一结点和第二结点构建第一图数据结构。
[0012]在本公开的再一个实施例中,提取预设个数的第一图数据结构,组合成第二图数据结构,包括:获取第一图数据结构的标识信息,标识信息为大于或等于1的正整数,各第一数据结构的标识信息按照从小到大的顺序排序;基于标识信息与预设第二图数据结构的数量,确定对应的哈希值;将哈希值相同的第一图数据结构进行提取,并组合成第二图数据结构。
[0013]在本公开的再一个实施例中,根据多个目标线数据结构,训练图神经网络,包括:接收第二配置参数,第二配置参数包括:第一数量的容器;在资源库中调度第一数量的容器及容器对应的参数服务器;将多个目标线数据结构,对应分配给第一数量的容器;采用容器和参数服务器,训练图神经网络。
[0014]在本公开的再一个实施例中,图神经网络的训练方法,还包括:获取第一对象结点信息,将第一对象结点信息输入图神经网络,输出与第一对象结点信息相关联的第二对象结点信息。
[0015]在本公开实施方式的第三方面中,提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序指令,计算机程序指令被执行时,实现如上述任一项的方法。
[0016]在本公开实施方式的第二方面中,提供了一种图神经网络的训练系统,包括:分布式存储器和训练装置;
[0017]分布式存储器用于获取原始图数据结构,原始图数据结构包括:多个原始结点和原始边,原始边用于表示相连的原始结点之间的关联关系,以及
[0018]基于图神经网络的第一数量,将原始图数据结构分为第一数量的第一图数据结构,第一图数据结构包括至少一个第一结点和至少一个第二结点,第二结点与至少一个第一结点通过原始边连接,其中,不同第一图数据结构的第一结点不同,第一数量是预先配置的;
[0019]训练装置用于基于第一图数据结构,训练图神经网络。
[0020]在本公开的再一个实施例中,训练装置包括:查询服务器和训练单元;
[0021]查询服务器用于,基于第一图数据结构,确定多个目标线数据结构,目标线数据结构包括主结点和至少一个辅结点,其中主结点和其中一个辅结点通过原始边连接,辅结点之间通过原始边连接,主结点和辅结点的数量之和为预先配置的采样长度,采样长度为大于1的正整数,主结点为第一图数据结构中的第一结点,任一辅结点为第一图数据结构中第一结点或第二结点;
[0022]训练单元,用于根据多个目标线数据结构,训练图神经网络。
[0023]在本公开的再一个实施例中,查询服务器具体用于:提取预设个数的第一图数据结构,组合成第二图数据结构;确定第二图数据结构内的任一第一结点为键结点,与键结点具有关联关系的结点为值结点;根据键结点和值结点,确定第二图数据结构对应的多个结点序列;基于结点序列,确定多个目标线数据结构。
[0024]在本公开的再一个实施例中,查询服务器在基于结点序列,确定多个目标线数据结构时,具体用于:在第一图数据结构中获取多个第一结点;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图神经网络的训练方法,包括:获取原始图数据结构,所述原始图数据结构包括:多个原始结点和原始边,所述原始边用于表示相连的原始结点之间的关联关系;基于图神经网络的第一数量,将所述原始图数据结构分为所述第一数量的第一图数据结构,所述第一图数据结构包括至少一个第一结点和至少一个第二结点,所述第二结点与至少一个所述第一结点通过所述原始边连接,其中,不同所述第一图数据结构的第一结点不同,所述第一数量是预先配置的;基于所述第一图数据结构,训练所述图神经网络。2.根据权利要求1所述的图神经网络的训练方法,所述基于所述第一图数据结构,训练所述图神经网络,包括:基于所述第一图数据结构,确定多个目标线数据结构,所述目标线数据结构包括主结点和至少一个辅结点,其中所述主结点和其中一个辅结点通过所述原始边连接,所述辅结点之间通过所述原始边连接,所述主结点和所述辅结点的数量之和为预先配置的采样长度,所述采样长度为大于1的正整数,所述主结点为所述第一图数据结构中的第一结点,任一所述辅结点为所述第一图数据结构中第一结点或第二结点;根据多个所述目标线数据结构,训练所述图神经网络。3.根据权利要求2所述的图神经网络的训练方法,所述基于所述第一图数据结构,确定多个目标线数据结构,包括:提取预设个数的所述第一图数据结构,组合成第二图数据结构;确定所述第二图数据结构内的任一所述第一结点为键结点,与所述键结点具有关联关系的结点为值结点;根据所述键结点和所述值结点,确定所述第二图数据结构对应的多个结点序列;基于所述结点序列,确定多个所述目标线数据结构。4.根据权利要求3所述的图神经网络的训练方法,所述基于所述结点序列,确定多个所述目标线数据结构,包括:在第一图数据结构中获取多个所述第一结点;对于任一第一结点,在所述结点序列中查询与所述第一结点相同的第一键结点;确定与所述第一键结点属于同一结点序列的一个值结点;执行结点序列查询步骤:根据当前采样长度,在所述结点序列中查询当前值结点作为新的键结点所在的结点序列,在所述结点序列中确定所述新的键结点所对应的一个值结点作为辅结点或停止采样,其中,所述新的键结点为除所述第一键结点之外的其他键结点;在所述第一键结点和对应的所有辅结点数量未达到采样长度的情况下,继续执行所述执行结点序列查询步骤;在所述第一键结点和对应的所有辅结...

【专利技术属性】
技术研发人员:段石石刘长伟王军正谭钧心程纯陆超红汪磊朱一飞苏杭李宽蒋文伟赵荣生
申请(专利权)人:杭州网易云音乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1