一种可扩展的隐私保护图神经网络预测方法技术

技术编号：41381033 阅读：4 留言：0更新日期：2024-05-20 10:22

一种可扩展的隐私保护图神经网络预测方法利用2‑out‑of‑2加性秘密共享技术、定制化数组结构的图数据存储方法、GNN预测技术和多云服务器计算框架，实现了隐私保护和可扩展的GNN模型推理预测。具体地，通过构造定制化数组结构实现相关图数据的存储，基于2‑out‑of‑2加性秘密共享技术实现图神经网络模型和相关图数据加密，基于多云服务器计算框架实现远程模型推理的可扩展的隐私保护图神经网络预测方法。有益效果在于：在数据机密性、模型机密性、可扩展性、计算和通信开销以及系统可靠性方面具有显著优势。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及的方案属于人工智能与信息安全隐私保护，具体为远程模型推理应用场景中的可扩展的隐私保护图神经网路预测的。

技术介绍

1、随着深度学习的快速发展，图神经网络因其在处理图数据方面的独特优势而备受关注，随着云计算的日益普及。越来越多的企业将gnn模型外包，以提供更高质量的预测服务。这种深度学习即服务的范式极大地促进了gnn模型在各种领域中的广泛应用，包括推荐系统、金融风险控制和自动驾驶等等。

2、尽管有上述优势，但在云环境中，现有的模型预测生态系统存在严重的隐私问题。一方面，高质量的gnn模型往往具有商业价值，模型所有者不愿向其他实体披露相关模型参数。另一方面，近年来随着各国数据安全相关法律的颁布，对用户隐私数据的保护越来越受到重视。图包含了丰富的结构信息，涉及到大量的敏感数据。例如，在社交网络图中，每个节点的特征代表用户的兴趣爱好，节点之间的连接代表社交关系。未经授权披露这些信息可能被恶意利用。因此，一个理想的保护隐私的gnn预测方案应该保证模型和数据的机密性。此外，为了满足实践中对快速预测的需求，部署在云中的gnn预测方案应该能够快速生成未见节点或全新（子）图的嵌入。这种归纳能力对于高吞吐量生产深度学习系统是必不可少的，它经常在不断发展的动图上运行，并不断遇到新的节点（例如，youtube上的用户和视频）。因此，可扩展性对于保护隐私的gnn预测服务也至关重要。

3、目前为止，研究人员已经提出了一些方法来应对gnn预测中的隐私问题。例如，lin等人提出了一种去中心化网络图中隐私保护学习的框架，利用

4、目前已有一些研究为归纳式任务设计gnn预测方案，但均未解决模型机密性和数据机密性的保护问题。

5、总而言之，目前仍然迫切需要设计一种适用于远程模型推理场景中可以同时保证数据机密性、模型机密性和可扩展性的图神经网络预测方法。

技术实现思路

1、本专利技术的目的是针对现有技术存在的不足，在远程图神经网络模型推理场景下，如何同时保证预测过程中数据机密性、模型机密性和可扩展性，是本专利技术需要解决的问题。

2、本专利技术所述一种可扩展的隐私保护图神经网络预测方法的具体步骤为：

3、步骤一：模型所有者mo基于秘密共享技术，加密所需计算的模型参数并进行上传；

4、步骤二：模型用户基于定制化的数组结构存储图结构数据，随后基于秘密共享技术，模型用户mu安全地共享输入图数据并进行上传；

5、步骤三：模型推理，云服务器基于多云服务器计算框架，在接收模型所有者上传的各聚合层模型参数的秘密共享和模型用户上传的节点特征与邻居列表的秘密共享后，按照给定的计算协议，将所述秘密共享作为输入在密态下进行相应的计算，输出密文形式的推理结果，最后两个主要负责计算的云服务器将结果返回给模型用户；

6、步骤四：模型预测结果重构：模型用户接收云服务器计算输出的关于其标签的加密预测结果并重构的过程。

7、优选的，步骤一所述技术方案具体实现方式为：

8、设模型所有者已经基于海量且高质量的训练数据与长时间的性能调优，得到了一个高质量的图神经网络模型；

9、针对自行训练好的gnn模型的两个聚合层的权重系数的明文，根据明文向量的维度依次随机选择一个向量，并将分别加密为：；

10、模型所有者分别将加密后的图神经网络模型各聚合层的权重系数上传到两个主要负责计算的云服务器中。

11、优选的，步骤二所述技术方案具体实现方式为：

12、将第i个模型用户的非结构化数据如特征向量和采用定制化数组结构存储的结构化数据如邻居列表作为输入，并生成特征向量和邻居列表的秘密共享作为输出，具体地：

13、对于非结构化数据，模型用户随机生成一个随机向量，其中，表示由模的整数域构成的l维有限域；

14、通过对特征向量采用算术共享生成；对于非结构化数据，引入定制的数组结构，用于有效加密和表示结构信息；每个数组元素都包含一个邻居id列表，该列表是根据第一个聚合层对应邻居节点随机抽样的，数组索引对应于所需预测节点的id，在完成对预测邻居节点的随机抽样后，模型用户秘密共享安全采样的邻居id列表，

15、，其中，表示第一个聚合层抽样的邻居数；

16、随后模型用户分别将特征向量的秘密共享和抽样的邻居id列表的秘密共享发送给云服务器。

17、优选的，步骤三所述秘密共享作为输入在密态下进行相应计算的基本操包括：

18、（1）线性运算：对秘密共享值的操作只需要局部计算；在算术共享中，如果为公开常数，为秘密共享值，则；各方根据各自持有的秘密在本地计算各自的份额；

19、（2）乘法运算：秘密共享值的乘法运算需要一轮在线通信；为了将两个秘密共享值相乘，，双方应该首先在离线阶段共享一个beaver三元组；之后，两方云服务器本地计算和，随后互相共享；最后持有。

20、优选的，所述加密采用的技术为加性秘密共享，直接将预测结果的秘密共享做加法运算即可恢复出模型预测结果的明文。

21、进一步的，所述恢复出模型预测结果的明文的具体步骤如下：

22、（1）模型所有者基于2-out-of-2秘密共享技术分别加密训练好的gnn模型的两个聚合层的权重系数的明文，根据明文向量的维度依次随机选择一个向量，并将分别加密为：；

23、模型所有者分别将加密后的图神经网络模型各聚合层的权重系数上传到两个主要负责计算的云服务器中；

24、（2）首先，针对非结构化数据如节点特征向量，模型用户随机生成一个随机向量，其中，表示由模的整数域构成的l维有限域；然后通过对特征向量采用算术共享生成；

25、之后，针对非结构化数据，引入定制的数组结构，用于有效加密和表示结构信息，每个数组元素都包含一个邻居id列表，该列表是根据第一个聚合层对应邻居节点随机抽样的，数组索引对应于所需预测节点的id，在完成对预测邻居节点的随机抽样后，模型用户秘密共享安全采样的邻居id列表，

26、，其中，表示第一个聚合层抽样的邻居数；

27、最后，模型用户分别将特征向量的秘密共享和抽样的邻居id列表的秘密共享发送给云服务器；

28、（3）首先，云服务器需要对节点特征向量进行归一化处理，，其中l表示特征向量的维数，表示特征向量第j维的数据，表示归一化后的值；

29、其次，通过本文档来自技高网...

【技术保护点】

1.一种可扩展的隐私保护图神经网络预测方法，其特征在于，所述隐私保护图神经网络预测方法的具体步骤为：

2.如权利要求1所述的一种可扩展的隐私保护图神经网络预测方法，其特征在于，步骤一所述技术方案具体实现方式为：

3.如权利要求1所述的一种可扩展的隐私保护图神经网络预测方法，其特征在于，步骤二所述技术方案具体实现方式为：

4.如权利要求1所述的一种可扩展的隐私保护图神经网络预测方法，其特征在于，步骤三所述秘密共享作为输入在密态下进行相应计算的基本操作包括：

5.如权利要求1所述的一种可扩展的隐私保护图神经网络预测方法，其特征在于，所述加密采用的技术为加性秘密共享，直接将预测结果的秘密共享做加法运算即可恢复出模型预测结果的明文。

6.如权利要求5所述的一种可扩展的隐私保护图神经网络预测方法，其特征在于，所述恢复出模型预测结果的明文的具体步骤如下：

7.如权利要求1所述的一种可扩展的隐私保护图神经网络预测方法，其特征在于，由于模型用户上传到云服务器的邻居ID是加密的，因此设计了一种安全访问协议，便于云服务器对邻居节

8.如权利要求1所述的一种可扩展的隐私保护图神经网络预测方法，其特征在于，在秘密共享域中并不直接支持比较操作，通过测试激活函数的密文输入的最高有效位是否为0来完成比较运算以实现在秘密共享域中不直接支持比较操作技术问题，其中，表示模的整数域。

...

【技术特征摘要】

1.一种可扩展的隐私保护图神经网络预测方法，其特征在于，所述隐私保护图神经网络预测方法的具体步骤为：

2.如权利要求1所述的一种可扩展的隐私保护图神经网络预测方法，其特征在于，步骤一所述技术方案具体实现方式为：

3.如权利要求1所述的一种可扩展的隐私保护图神经网络预测方法，其特征在于，步骤二所述技术方案具体实现方式为：

4.如权利要求1所述的一种可扩展的隐私保护图神经网络预测方法，其特征在于，步骤三所述秘密共享作为输入在密态下进行相应计算的基本操作包括：

5.如权利要求1所述的一种可扩展的隐私保护图神经网络预测方法，其特征在于，所述加密采用的技术为加性秘密共享，直接将预测结果的秘密共...

【专利技术属性】
技术研发人员：袁艳丽，雷典，王小雨，祝烈煌，王亚杰，伊鹏达，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人