基于分布式隐私图注意力网络模型的图数据预测方法技术

技术编号：41283345 阅读：6 留言：0更新日期：2024-05-11 09:33

本发明专利技术公开了一种基于分布式隐私图注意力网络模型的图数据预测方法，包括：将待预测图数据输入至训练好的分布式隐私图注意力网络模型，得到待预测图数据的预测特征；分布式隐私图注意力网络模型是根据来自不同数据持有端的同性化数据训练的，同性化数据是数据持有端根据本地图数据的集群特征点和数据平均特征点之间的欧氏距离对本地图数据进行异构性消除处理得到的。根据本发明专利技术提供的方法，通过根据来自不同数据持有端的同性化数据训练得到的训练好的分布式隐私图注意力网络模型来预测图数据特征，能够实现多源图数据的有效融合，避免数据异构对预测准确率的影响。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图数据处理，具体涉及一种基于分布式隐私图注意力网络模型的图数据预测方法。

技术介绍

1、在人工智能和深度学习技术迅猛发展的今天，非欧氏空间数据的信息挖掘需求显著增加。图数据作为非欧式空间数据的代表，凭借其特殊的信息承载能力，在多个领域发挥着重要作用，如通过社交关系图推荐商品，利用化学结构图推断新分子，或者使用代码结构图挖掘软件漏洞。为有效挖掘图数据的价值，图神经网络(graph neural networks，gnn)应运而生，特别是图卷积神经网络(graph convolutional networks，gcn)因其对图结构特征的高效提取而受到重视。尽管gcn在特征提取上取得了进展，但它们在处理权重分配、全局信息聚合以及大规模图数据时面临着固有的限制。为克服这些限制，图注意力网络(graphattention networks，gat)被提出，引入自注意力机制以灵活地调整邻居节点的权重分配，并提高全局信息的捕捉能力。然而，gat在实际生产环境中的应用仍受到数据异构性的挑战。

2、由于在实际生产环境中图数据往往来源于不同的数据采集方，而数据采集方在采集图数据时的标准不一致，从而导致图数据在节点数值，节点值域方面出现不对等的情况，因此针对同一对象的所采集的图数据往往不能使用gat或gcn直接进行处理。

3、在解决数据异构方面，有一种基于层级注意力的新型异质图神经网络的方法。这种方法包括节点级和语义级注意力，可以有效的将来源不同的异构数据转化为同质的节点和语义嵌入，然而这种转化方法无法保留异构数

4、因此，传统的异构数据同化方法不能够在消除数据的异构性的同时保留数据的多样化信息。

技术实现思路

1、本专利技术实施例提供了一种基于分布式隐私图注意力网络模型的图数据预测方法，可以解决传统的异构数据同化方法不能够在消除数据的异构性的同时保留数据的多样化信息的问题。

2、第一方面，本专利技术实施例提供的一种基于分布式隐私图注意力网络模型的图数据预测方法方法，所述方法应用于算力服务器，所述方法包括：

3、将待预测图数据输入至训练好的分布式隐私图注意力网络模型，得到待预测图数据的预测特征；

4、其中，分布式隐私图注意力网络模型是根据来自不同数据持有端的同性化数据训练的，同性化数据是数据持有端根据本地图数据的集群特征点和数据平均特征点之间的欧氏距离对本地图数据进行异构性消除处理得到的；集群特征点的坐标为本地图数据中所有图数据在欧式空间中坐标的平均值，数据平均特征点的坐标为来自不同数据持有端的本地图数据的集群特征点坐标的平均值。

5、在第一方面的一种可能的实现方式中，同性化数据是数据持有端将本地图数据向同化方向平移同化距离后得到的。

6、示例性的，同化方向由集群特征点指向数据平均特征点。

7、示例性的，同化距离为集群特征点与数据平均特征点之间的欧氏距离。

8、在第一方面的一种可能的实现方式中，所述分布式隐私图注意网络模型的训练方法包括：

9、向至少一个数据持有端发送待学习平面，接收来自数据持有端的平面投影向量；

10、通过计算平面投影向量和待学习向量的内积，来计算待学习矩阵和同性化数据的内积，得到升维后的特征向量；

11、根据升维后的特征向量，确定损失函数；

12、在损失函数的约束下，训练分布式隐私图注意力网络模型，得到训练好的分布式隐私图注意力网络模型。

13、示例性的，平面投影向量为同性化数据在待学习平面上的投影向量。

14、示例性的，待学习平面为过待学习向量的一个平面。

15、示例性的，待学习向量为待学习矩阵中的一个行向量。

16、在第一方面的一种可能的实现方式中，分布式隐私图注意力网络模型包括多个待学习矩阵，待学习矩阵由分布式隐私图注意力网络模型中的至少一个节点共享。

17、在第一方面的一种可能的实现方式中，可以在损失函数的约束下，训练分布式隐私图注意力网络模型，得到每轮迭代训练结束后的待学习矩阵；在最后一轮迭代训练结束之后，得到待确定的分布式隐私图注意力网络模型；根据待学习矩阵的步长之和，从待确定的分布式隐私图注意力网络模型中确定问题节点；从待确定的分布式隐私图注意力网络模型中删除问题节点，得到训练好的分布式隐私图注意力网络模型。

18、示例性的，待学习矩阵的步长为相邻两轮迭代训练结束后的待学习矩阵的差值的绝对值。

19、在第一方面的一种可能的实现方式中，可以基于t检验法，根据待学习矩阵的步长之和，从待确定的分布式隐私图注意力网络模型中确定问题节点。

20、示例性的，设置于问题节点上的待学习矩阵的步长与设置于正常节点上的待学习矩阵的步长差异较大。

21、第二方面，本专利技术实施例提供了一种基于分布式隐私图注意力网络模型的图数据预测方法，所述方法应用于图数据预测系统，所述系统包括至少一个数据持有端和算力服务器，所述方法包括：

22、数据持有端根据本地图数据的集群特征点和数据平均特征点之间的欧氏距离对本地图数据进行异构性消除处理，得到同性化数据；

23、其中，集群特征点的坐标为本地图数据中所有图数据在欧式空间中坐标的平均值，数据平均特征点的坐标为来自不同数据持有端的本地图数据的集群特征点坐标的平均值；

24、算力服务器将待预测图数据输入至训练好的分布式隐私图注意力网络模型，得到待预测图数据的预测特征；

25、其中，分布式隐私图注意力网络模型是根据来自不同数据持有端的同性化数据训练的。

26、第三方面，本专利技术实施例提供了一种图数据预测系统，系统包括至少一个数据持有端和算力服务器；

27、数据持有端用于根据本地图数据的集群特征点和数据平均特征点之间的欧氏距离对本地图数据进行异构性消除处理，得到同性化数据；

28、其中，集群特征点的坐标为本地图数据中所有图数据在欧式空间中坐标的平均值，数据平均特征点的坐标为来自不同数据持有端的本地图数据的集群特征点坐标的平均值；

29、算力服务器用于将待预测图数据输入至训练好的分布式隐私图注意力网络模型，得到待预测图数据的预测特征；

30、其中，分布式隐私图注意力网络模型是根据来自不同数据持有端的同性化数据训练的。

31、第四方面，本专利技术实施例提供了一种数据持有端，数据持有端包括处理单元；处理单元用于：

32、根据本地图数据的集群特征点和数据平均特征点之间的欧氏距离对本地本文档来自技高网...

【技术保护点】

1.一种基于分布式隐私图注意力网络模型的图数据预测方法，其特征在于，应用于算力服务器，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述同性化数据是所述数据持有端将所述本地图数据向同化方向平移同化距离后得到的；

3.根据权利要求2所述的方法，其特征在于，所述分布式隐私图注意网络模型的训练方法包括：

4.根据权利要求3所述的方法，其特征在于，所述分布式隐私图注意力网络模型包括多个所述待学习矩阵，所述待学习矩阵由所述分布式隐私图注意力网络模型中的至少一个节点共享。

5.根据权利要求4所述的方法，其特征在于，所述在所述损失函数的约束下，训练所述分布式隐私图注意力网络模型，得到所述训练好的分布式隐私图注意力网络模型，包括：

6.根据权利要求5所述的方法，其特征在于，所述根据所述待学习矩阵的步长之和，从所述待确定的分布式隐私图注意力网络模型中确定问题节点，包括：

7.一种基于分布式隐私图注意力网络模型的图数据预测方法，其特征在于，应用于图数据预测系统，所述系统包括至少一个数据持有端和算力服务器，所述方法包括：

8.一种图数据预测系统，其特征在于，包括至少一个数据持有端和算力服务器；

9.一种数据持有端，其特征在于，包括处理单元，所述处理单元用于：

10.一种算力服务器，其特征在于，包括处理单元，所述处理单元用于：

...

【技术特征摘要】

1.一种基于分布式隐私图注意力网络模型的图数据预测方法，其特征在于，应用于算力服务器，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述同性化数据是所述数据持有端将所述本地图数据向同化方向平移同化距离后得到的；

3.根据权利要求2所述的方法，其特征在于，所述分布式隐私图注意网络模型的训练方法包括：

5.根据权利要求4所述的方法，其特征在于，所述在所述损失函数的约束下，训练所述分布式隐私图注意...

【专利技术属性】
技术研发人员：丁文秀，蔡宇轩，肖昱翾，闫峥，王明君，王普，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人