一种多方联邦隐私数据资源交互方法、装置和介质制造方法及图纸

技术编号：37975530 阅读：5 留言：0更新日期：2023-06-30 09:50

本发明专利技术公开了一种多方联邦隐私数据资源交互方法、装置和介质，该方法采用博弈论确定数据需求节点发布的数据总价及多个数据供应节点训练预设模型而从各自的第二预设数据集中提取的至少部分数据，运用联邦学习训练预设模型，并根据差分隐私模型对各自的训练过程进行隐私扰动，以获取各自的训练参数，再重新确定第一模型精度，进而重新确定第一效用值，以获取各数据供应节点提取的至少部分数据。本发明专利技术在数据总价与数据量谈判的过程中不需要传输数据，仅需在各自本地对预设模型进行训练确定数据总价和数据量，并在交互完成后进行数据资源的交换，有助于提升数据资源的交换效率；通过差分隐私模型对训练过程进行隐私扰动，保证了数据安全。证了数据安全。证了数据安全。

全部详细技术资料下载

【技术实现步骤摘要】
一种多方联邦隐私数据资源交互方法、装置和介质

[0001]本专利技术涉及计算机技术应用的数据资源交互领域，尤其涉及一种多方联邦隐私数据资源交互方法、装置和介质。

技术介绍

[0002]计算机信息与通信技术为人们提供了一个全新的信息处理与交流平台，并在信息处理与交流的过程中生成了大量的数据资源，为大数据的分析提供了数据基础。然而，这些数据通常是私密和敏感的，且易与其它隐私联系起来，产生了严重的隐私问题，进而导致数据资源供应方不愿意无偿且透明地将个人数据用于大数据的分析中，并由此产生数据资源交换效率低下的问题。
[0003]联邦学习作为一种分布式机器学习技术，通过在多个拥有本地数据的数据源之间进行分布式模型训练，在不需要交换本地个体或样本数据的前提下，仅通过交换模型参数或中间结果的方式，构建基于虚拟融合数据下的全局模型，这在一定程度上解决了数据透明的问题。然而，联邦学习引入了大量参数进行交换，不仅和集中式训练一样会受到模型使用者的威胁，还可能受到来自不可信的参与设备攻击。为避免来自各方的威胁与攻击，同态加密、安全多方计算、差分隐私等隐私保护技术被广泛普及并应用。其中，差分隐私能够保证机密数据被用于数据的准确分析之中，而无需进行数据脱敏、达成数据使用协议、指定数据保护计划等，并能够保证对个人数据一无所知的情况下获得群体的有用信息。此外，差分隐私还能够根据一个给定的隐私算子来添加噪声，这让模型使用者能够主动选择数据的隐私程度。
[0004]虽然联邦学习与差分隐私在数据的分析处理中实现了分布式机器学习以及隐私保...

【技术保护点】

【技术特征摘要】
1.一种多方联邦隐私数据资源交互方法，其特征在于，包括以下步骤：S1、数据需求节点在其本地服务器中使用第一预设数据集训练预设模型，以获取所述预设模型的第一模型精度，并根据所述第一模型精度确定第一效用值，判断所述第一效用值是否大于等于目标效用值，其中所述第一效用值与所述第一模型精度正相关，若是，则过程终止；否则，所述数据需求节点发送所述预设模型给多个数据供应节点并进入步骤S2；S2、所述数据需求节点与多个所述数据供应节点发送隐私请求给隐私供应节点，所述隐私供应节点根据所述隐私请求发送差分隐私模型给数据需求节点与多个数据供应节点；S3、所述数据需求节点发布数据总价给多个所述数据供应节点，其中所述数据总价根据所述第一模型精度确定，以获取最大第一效用值并将所述最大第一效用值重新确定为目标效用值，多个所述数据供应节点根据所述数据总价及该数据供应节点的预期最大第二效用值从各自的第二预设数据集中提取至少部分数据训练所述预设模型，所述第二效用值与所述数据供应节点训练所述预设模型提取的至少部分数据正相关；S4、所述数据需求节点及多个所述数据供应节点进行联邦学习训练所述预设模型，并根据所述差分隐私模型对各自训练所述预设模型的过程进行隐私扰动，以获取各自的训练参数，所述数据需求节点获取各数据供应节点的训练参数并结合自身的训练参数重新确定所述预设模型的第一模型精度，直至重新确定的所述预设模型的第一模型精度收敛；S5、基于重新确定的所述预设模型的第一模型精度重新确定第一效用值，判断重新确定的第一效用值是否大于等于所述步骤S3中重新确定的目标效用值，若是，则获取所述步骤S3中各数据供应节点提取的至少部分数据；否则，基于重新确定的所述预设模型的第一模型精度更新所述数据总价，返回所述步骤S3。2.根据权利要求1所述的多方联邦隐私数据资源交互方法，其特征在于，所述第一效用值的获取方法具体为：根据所述第一模型精度、所述数据总价及多个所述数据供应节点训练预设模型提取的至少部分数据获取第一效用值。3.根据权利要求1所述的多方联邦隐私数据资源交互方法，其特征在于，所述隐私请求为预设格式数据。4.根据权利要求1所述的多方联邦隐私数据资源交互方法，其特征在于，所述第二效用值的获取方法具体为：多个所述数据供应节点根据所述数据总价、该数据供应节点训练所述预设模型提取的至少部分数据及其他数据供应节点训练所述预设模型提取的至少部分数据确定第二效用值。5.根据权利要求1所述的多方联邦隐私数据资源交互方法，其特征在于，...

【专利技术属性】
技术研发人员：王海军，那崇宁，卢冰洁，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人