当前位置: 首页 > 专利查询>之江实验室专利>正文

一种多方联邦隐私数据资源交互方法、装置和介质制造方法及图纸

技术编号:37975530 阅读:5 留言:0更新日期:2023-06-30 09:50
本发明专利技术公开了一种多方联邦隐私数据资源交互方法、装置和介质,该方法采用博弈论确定数据需求节点发布的数据总价及多个数据供应节点训练预设模型而从各自的第二预设数据集中提取的至少部分数据,运用联邦学习训练预设模型,并根据差分隐私模型对各自的训练过程进行隐私扰动,以获取各自的训练参数,再重新确定第一模型精度,进而重新确定第一效用值,以获取各数据供应节点提取的至少部分数据。本发明专利技术在数据总价与数据量谈判的过程中不需要传输数据,仅需在各自本地对预设模型进行训练确定数据总价和数据量,并在交互完成后进行数据资源的交换,有助于提升数据资源的交换效率;通过差分隐私模型对训练过程进行隐私扰动,保证了数据安全。证了数据安全。证了数据安全。

【技术实现步骤摘要】
一种多方联邦隐私数据资源交互方法、装置和介质


[0001]本专利技术涉及计算机技术应用的数据资源交互领域,尤其涉及一种多方联邦隐私数据资源交互方法、装置和介质。

技术介绍

[0002]计算机信息与通信技术为人们提供了一个全新的信息处理与交流平台,并在信息处理与交流的过程中生成了大量的数据资源,为大数据的分析提供了数据基础。然而,这些数据通常是私密和敏感的,且易与其它隐私联系起来,产生了严重的隐私问题,进而导致数据资源供应方不愿意无偿且透明地将个人数据用于大数据的分析中,并由此产生数据资源交换效率低下的问题。
[0003]联邦学习作为一种分布式机器学习技术,通过在多个拥有本地数据的数据源之间进行分布式模型训练,在不需要交换本地个体或样本数据的前提下,仅通过交换模型参数或中间结果的方式,构建基于虚拟融合数据下的全局模型,这在一定程度上解决了数据透明的问题。然而,联邦学习引入了大量参数进行交换,不仅和集中式训练一样会受到模型使用者的威胁,还可能受到来自不可信的参与设备攻击。为避免来自各方的威胁与攻击,同态加密、安全多方计算、差分隐私等隐私保护技术被广泛普及并应用。其中,差分隐私能够保证机密数据被用于数据的准确分析之中,而无需进行数据脱敏、达成数据使用协议、指定数据保护计划等,并能够保证对个人数据一无所知的情况下获得群体的有用信息。此外,差分隐私还能够根据一个给定的隐私算子来添加噪声,这让模型使用者能够主动选择数据的隐私程度。
[0004]虽然联邦学习与差分隐私在数据的分析处理中实现了分布式机器学习以及隐私保护,但尚未解决数据资源供应方不愿意无偿将个人数据用于分析以及由此产生的数据资源交换效率低下问题。于是,数据资源需求节点通过价格支付的方式有偿获取数据资源供应节点的一定量数据便成为解决数据资源交换效率低下问题的关键方面。在此情况下,激励机制被提出来确定数据的价格以及数据的数量,但激励机制设计的出发点是在特定数量的数据已经被投入使用并获得满意结果后再对数据资源供应方进行补偿,这导致数据的交换局限在一个组织或机构内部各部门之间,尚不能实现跨越不同组织或机构间的数据高效交换。
[0005]现有的困境包括:不同组织或机构间往往需要从这些组织或机构的效用最大化出发促成数据的交换,而非以技术分析后的满意结果作为补偿数据资源供应节点的依据;不同组织或机构通常在数据供应达成一致之前不会将自有数据资源用于数据交换,而没有数据资源交换的情况下便无法进一步进行技术的应用;数据资源需求方和多个数据资源供应方之间数据数量的不确定性以及多方多次的复杂数据交互过程导致了数据资源交换效率低下。

技术实现思路

[0006]本专利技术的目的在于针对现有技术的不足,提供一种多方联邦隐私数据资源交互方法、装置和介质。
[0007]本专利技术的目的是通过以下技术方案来实现的:本专利技术实施例第一方面提供了一种多方联邦隐私数据资源交互方法,包括以下步骤:S1、数据需求节点在其本地服务器中使用第一预设数据集训练预设模型,以获取所述预设模型的第一模型精度,并根据所述第一模型精度确定第一效用值,判断所述第一效用值是否大于等于目标效用值,其中所述第一效用值与所述第一模型精度正相关,若是,则过程终止;否则,所述数据需求节点发送所述预设模型给多个数据供应节点并进入步骤S2;S2、所述数据需求节点与多个所述数据供应节点发送隐私请求给隐私供应节点,所述隐私供应节点根据所述隐私请求发送差分隐私模型给数据需求节点与多个数据供应节点;S3、所述数据需求节点发布数据总价给多个所述数据供应节点,其中所述数据总价根据所述第一模型精度确定,以获取最大第一效用值并将所述最大第一效用值重新确定为目标效用值,多个所述数据供应节点根据所述数据总价及该数据供应节点的预期最大第二效用值从各自的第二预设数据集中提取至少部分数据训练所述预设模型,所述第二效用值与所述数据供应节点训练所述预设模型提取的至少部分数据正相关;S4、所述数据需求节点及多个所述数据供应节点进行联邦学习训练所述预设模型,并根据所述差分隐私模型对各自训练所述预设模型的过程进行隐私扰动,以获取各自的训练参数,所述数据需求节点获取各数据供应节点的训练参数并结合自身的训练参数重新确定所述预设模型的第一模型精度,直至重新确定的所述预设模型的第一模型精度收敛;S5、基于重新确定的所述预设模型的第一模型精度重新确定第一效用值,判断重新确定的第一效用值是否大于等于所述步骤S3中重新确定的目标效用值,若是,则获取所述步骤S3中各数据供应节点提取的至少部分数据;否则,基于重新确定的所述预设模型的第一模型精度更新所述数据总价,返回所述步骤S3。
[0008]进一步地,所述第一效用值的获取方法具体为:根据所述第一模型精度、所述数据总价及多个所述数据供应节点训练预设模型提取的至少部分数据获取第一效用值。
[0009]进一步地,所述隐私请求为预设格式数据。
[0010]进一步地,所述第二效用值的获取方法具体为:多个所述数据供应节点根据所述数据总价、该数据供应节点训练所述预设模型提取的至少部分数据及其他数据供应节点训练所述预设模型提取的至少部分数据确定第二效用值。
[0011]进一步地,所述第一效用值与所述数据总价负相关;所述第一模型精度与多个所述数据供应节点训练预设模型提取的至少部分数据正相关;
[0012]所述第二效用值与所述数据总价正相关,所述第二效用值与数据供应节点训练所述预设模型提取的至少部分数据正相关,且与其他数据供应节点训练所述预设模型提取的至少部分数据负相关。
[0013]进一步地,所述步骤S4包括以下子步骤:
S41、所述数据需求节点在该数据需求节点的本地服务器中使用所述第一预设数据集进行联邦学习训练所述预设模型,多个所述数据供应节点在其本地服务器中使用从各自第二预设数据集中提取的至少部分数据进行联邦学习训练所述预设模型,并根据所述差分隐私模型对各自训练所述预设模型的过程进行隐私扰动,以获取各自的训练参数;S42、所述数据需求节点获取各数据供应节点的训练参数并结合自身的训练参数,将所有的训练参数进行聚合,以获取所述预设模型的全局参数;S43、所述数据需求节点及多个所述数据供应节点获取所述预设模型的全局参数,并根据所述全局参数更新各自的训练参数,以获取参数更新后的预设模型;S44、所述数据需求节点在该数据需求节点的本地服务器中使用所述第一预设数据集进行联邦学习训练参数更新后的预设模型,以重新确定预设模型的第一模型精度;S45、重复所述步骤S41

所述步骤S44,直至重新确定的预设模型的第一模型精度收敛。
[0014]进一步地,所述根据所述差分隐私模型对各自训练所述预设模型的过程进行隐私扰动具体包括:所述数据需求节点与多个所述数据供应节点在各自本地对所述预设模型进行训练的过程中,根据所述差分隐私模型对所述预设模型的参数更新过程中的梯度添加隐私扰动,以生成各自的隐私的训练参数。
[0015]进一步地,所述获取预设模型的全局参数具体为:所述数据需求节点将所有的训练参数根本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多方联邦隐私数据资源交互方法,其特征在于,包括以下步骤:S1、数据需求节点在其本地服务器中使用第一预设数据集训练预设模型,以获取所述预设模型的第一模型精度,并根据所述第一模型精度确定第一效用值,判断所述第一效用值是否大于等于目标效用值,其中所述第一效用值与所述第一模型精度正相关,若是,则过程终止;否则,所述数据需求节点发送所述预设模型给多个数据供应节点并进入步骤S2;S2、所述数据需求节点与多个所述数据供应节点发送隐私请求给隐私供应节点,所述隐私供应节点根据所述隐私请求发送差分隐私模型给数据需求节点与多个数据供应节点;S3、所述数据需求节点发布数据总价给多个所述数据供应节点,其中所述数据总价根据所述第一模型精度确定,以获取最大第一效用值并将所述最大第一效用值重新确定为目标效用值,多个所述数据供应节点根据所述数据总价及该数据供应节点的预期最大第二效用值从各自的第二预设数据集中提取至少部分数据训练所述预设模型,所述第二效用值与所述数据供应节点训练所述预设模型提取的至少部分数据正相关;S4、所述数据需求节点及多个所述数据供应节点进行联邦学习训练所述预设模型,并根据所述差分隐私模型对各自训练所述预设模型的过程进行隐私扰动,以获取各自的训练参数,所述数据需求节点获取各数据供应节点的训练参数并结合自身的训练参数重新确定所述预设模型的第一模型精度,直至重新确定的所述预设模型的第一模型精度收敛;S5、基于重新确定的所述预设模型的第一模型精度重新确定第一效用值,判断重新确定的第一效用值是否大于等于所述步骤S3中重新确定的目标效用值,若是,则获取所述步骤S3中各数据供应节点提取的至少部分数据;否则,基于重新确定的所述预设模型的第一模型精度更新所述数据总价,返回所述步骤S3。2.根据权利要求1所述的多方联邦隐私数据资源交互方法,其特征在于,所述第一效用值的获取方法具体为:根据所述第一模型精度、所述数据总价及多个所述数据供应节点训练预设模型提取的至少部分数据获取第一效用值。3.根据权利要求1所述的多方联邦隐私数据资源交互方法,其特征在于,所述隐私请求为预设格式数据。4.根据权利要求1所述的多方联邦隐私数据资源交互方法,其特征在于,所述第二效用值的获取方法具体为:多个所述数据供应节点根据所述数据总价、该数据供应节点训练所述预设模型提取的至少部分数据及其他数据供应节点训练所述预设模型提取的至少部分数据确定第二效用值。5.根据权利要求1所述的多方联邦隐私数据资源交互方法,其特征在于,...

【专利技术属性】
技术研发人员:王海军那崇宁卢冰洁
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1