一种图数据处理方法及相关装置制造方法及图纸

技术编号:39320816 阅读:6 留言:0更新日期:2023-11-12 16:01
本申请实施例公开了一种人工智能领域的图数据处理方法及相关装置,其中该方法包括:对图数据的邻接矩阵进行奇异值分解处理,得到特征分解结果,并根据特征分解结果和邻接矩阵,确定图数据的结构信息;根据图数据的初始节点特征、图数据的拉普拉斯矩阵以及结构信息,构建图数据对应的图字典;基于训练样本数据和图字典,对图神经网络进行迭代训练,直至图神经网络满足训练结束条件;通过图神经网络,根据图字典,确定图数据中各个节点各自对应的表示向量。该方法能够提高所确定的图数据中节点对应的表示向量的准确性,进而有利于提高相关的下游任务的执行效果。高相关的下游任务的执行效果。高相关的下游任务的执行效果。

【技术实现步骤摘要】
一种图数据处理方法及相关装置


[0001]本申请涉及人工智能
,尤其涉及一种图数据处理方法及相关装置。

技术介绍

[0002]图是一种由节点集合和连接边集合组成的数据结构,其能够反映该节点集合中各节点之间的关联关系。图数据可以符号化表示为G=(V,E),其中,V={v
i
}、|V|=n表示包括n个节点的节点集合,E={e
i
}、|E|=m表示包括m条连接边的连接边集合。
[0003]在实际应用中,将图数据应用至相关的下游任务中时,需要针对图数据中的每个节点学习一个对应的表示向量,从而便于基于图数据中节点对应的表示向量执行相关的下游任务,如执行好友推荐任务、信息推荐任务等。
[0004]然而,目前学习图数据中的节点对应的表示向量的方法,所取得的效果普遍不够理想,即通过这些方法确定的节点对应的表示向量不够准确,基于这些表示向量难以较好地执行相关的下游任务。

技术实现思路

[0005]本申请实施例提供了一种图数据处理方法及相关装置,能够提高所确定的图数据中节点对应的表示向量的准确性,进而有利于提高相关的下游任务的执行效果。
[0006]有鉴于此,本申请第一方面提供了一种图数据处理方法,所述方法包括:
[0007]对图数据的邻接矩阵进行奇异值分解处理,得到特征分解结果,并根据所述特征分解结果和所述邻接矩阵,确定所述图数据的结构信息;
[0008]根据所述图数据的初始节点特征、所述图数据的拉普拉斯矩阵以及所述结构信息,构建所述图数据对应的图字典;
[0009]基于训练样本数据和所述图字典,对图神经网络进行迭代训练,直至所述图神经网络满足训练结束条件;
[0010]通过所述图神经网络,根据所述图字典,确定所述图数据中各个节点各自对应的表示向量。
[0011]本申请第二方面提供了一种图数据处理装置,所述装置包括:
[0012]结构确定模块,用于对图数据的邻接矩阵进行奇异值分解处理,得到特征分解结果,并根据所述特征分解结果和所述邻接矩阵,确定所述图数据的结构信息;
[0013]图字典构建模块,用于根据所述图数据的初始节点特征、所述图数据的拉普拉斯矩阵以及所述结构信息,构建所述图数据对应的图字典;
[0014]模型训练模块,用于基于训练样本数据和所述图字典,对图神经网络进行迭代训练,直至所述图神经网络满足训练结束条件;
[0015]向量确定模块,用于通过所述图神经网络,根据所述图字典,确定所述图数据中各个节点各自对应的表示向量。
[0016]本申请第三方面提供了一种计算机设备,所述设备包括处理器以及存储器:
[0017]所述存储器用于存储计算机程序;
[0018]所述处理器用于根据所述计算机程序,执行如上述第一方面所述的图数据处理方法的步骤。
[0019]本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述第一方面所述的图数据处理方法的步骤。
[0020]本申请第五方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面所述的图数据处理方法的步骤。
[0021]从以上技术方案可以看出,本申请实施例具有以下优点:
[0022]本申请实施例提供了一种图数据处理方法,该方法包括:对图数据的邻接矩阵进行奇异值分解(Singular Value Decomposition,SVD)处理,得到特征分解结果,并根据该特征分解结果和该邻接矩阵,确定图数据的结构信息;然后,根据图数据的初始节点特征、拉普拉斯矩阵以及上述结构信息,构建该图数据对应的图字典;进而,基于训练样本数据和该图字典,对图神经网络进行迭代训练,直至该图神经网络满足训练结束条件;最终,通过该图神经网络,根据图字典确定该图数据中各个节点各自对应的表示向量。该方法创新性地对图数据的邻接矩阵进行SVD处理,并根据由此得到的特征分解结果和该邻接矩阵,确定图数据的结构信息,进而将该结构信息连同图数据的初始节点特征和拉普拉斯矩阵,一同引入对于图数据中节点对应的表示向量的建模过程;通过引入图数据的结构信息,可以扩展图神经网络的建模空间,使得图神经网络能够在同配图数据和异配图数据中均取得不错的表现,也即提高通过该图神经网络确定的各类图数据中节点对应的表示向量的准确性,进而提高基于图数据的相关下游任务的执行效果。
附图说明
[0023]图1为本申请实施例提供的图数据处理方法的应用场景示意图;
[0024]图2为本申请实施例提供的图数据处理方法的流程示意图;
[0025]图3为本申请实施例提供的方法在该道具推荐或好友推荐的场景下的实现原理示意图;
[0026]图4为本申请实施例提供的道具推荐任务的执行架构示意图;
[0027]图5为本申请实施例提供的好友推荐任务的执行架构示意图;
[0028]图6为本申请实施例提供的图数据处理装置的结构示意图;
[0029]图7为本申请实施例提供的终端设备的结构示意图;
[0030]图8为本申请实施例提供的服务器的结构示意图。
具体实施方式
[0031]为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0032]本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0033]人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0034]人工智能技术是一门综合学科,涉及领域广泛,既本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图数据处理方法,其特征在于,所述方法包括:对图数据的邻接矩阵进行奇异值分解处理,得到特征分解结果,并根据所述特征分解结果和所述邻接矩阵,确定所述图数据的结构信息;根据所述图数据的初始节点特征、所述图数据的拉普拉斯矩阵以及所述结构信息,构建所述图数据对应的图字典;基于训练样本数据和所述图字典,对图神经网络进行迭代训练,直至所述图神经网络满足训练结束条件;通过所述图神经网络,根据所述图字典,确定所述图数据中各个节点各自对应的表示向量。2.根据权利要求1所述的方法,其特征在于,所述对图数据的邻接矩阵进行奇异值分解处理,得到特征分解结果,并根据所述特征分解结果和所述邻接矩阵,确定所述图数据的结构信息,包括:对所述图数据的邻接矩阵进行奇异值分解处理,得到n个特征值和所述n个特征值各自对应的特征向量;所述n为大于1的整数,所述n为所述图数据中包括的节点的数量;确定所述n个特征值中较大的k个特征值;所述k为大于1、且小于所述n的整数;利用所述k个特征值各自对应的特征向量,对所述邻接矩阵进行压缩处理,得到所述图数据的结构信息。3.根据权利要求1所述的方法,其特征在于,所述根据所述图数据的初始节点特征、所述图数据的拉普拉斯矩阵以及所述结构信息,构建所述图数据对应的图字典,包括:基于第i阶多项式处理所述图数据的拉普拉斯矩阵,得到第i阶多项式处理结果,根据所述第i阶多项式处理结果和所述图数据的初始节点特征,确定第i阶图数据特征;所述i包括大于等于0、小于等于K的各个整数,所述K为大于1的整数;将第0阶图数据特征至第K阶图数据特征、以及所述结构信息并联起来,得到所述图数据对应的图字典。4.根据权利要求1所述的方法,其特征在于,所述基于训练样本数据和所述图字典,对图神经网络进行迭代训练,包括:在第j轮模型训练中,根据所述图神经网络的第j

1轮模型参数以及所述图字典,确定所述图数据中各个节点各自对应的第j轮表示向量;根据所述图数据中各个节点各自对应的第j轮表示向量,执行所述训练样本数据对应的训练任务,得到第j轮任务预测结果;根据所述训练样本数据包括的标签和所述第j轮任务预测结果,调整所述图神经网络的第j

1轮模型参数,得到所述图神经网络的第j轮模型参数;其中,所述j为大于等于1的整数;当所述j等于1时,所述图神经网络的第j

1轮模型参数为所述图神经网络的初始模型参数。5.根据权利要求1或4所述的方法,其特征在于,所述图数据包括多个对象节点、多个...

【专利技术属性】
技术研发人员:孙嘉齐赵胜林陈翔宇
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1