基于隐私安全求交和秘密分享的联邦分组统计量计算方法技术

技术编号:33705074 阅读:12 留言:0更新日期:2022-06-06 08:25
本申请涉及基于隐私安全求交和秘密分享的联邦分组统计量计算方法、系统、装置和存储介质,属于联邦学习技术领域,该方法包括:第一参与方与第二参与方进行隐私保护集合求交,得到元素交集,其中,第一参与方存储有原始分组信息,且各原始分组中至少包含一个元素,第二参与方存储有元素的特征信息;第二参与方对元素交集中的各元素提取特征信息;第一参与方根据原始分组信息对元素交集中的元素进行分组,得到联邦分组,分别根据各联邦分组中所包含的元素,计算出元素交集中各元素的掩码;基于交集中各元素的掩码和特征信息,通过秘密分享算法计算每个联邦分组在每一维特征上的统计量。能够充分保护各方数据的隐私安全,并且能够提高计算效率。高计算效率。高计算效率。

【技术实现步骤摘要】
基于隐私安全求交和秘密分享的联邦分组统计量计算方法


[0001]本申请涉及联邦学习
,特别是涉及基于隐私安全求交和秘密分享的联邦分组统计量计算方法、系统、装置和存储介质。

技术介绍

[0002]在现实的联邦场景中,常常会出现分组信息和元素的特征信息在不同参与方的情况,为了计算分组统计量,可以通过原始数据的共享来进行计算,但在数据共享的过程中很容易导致数据泄露,存在安全隐患。因此,现有技术中常通过数据同态加密来实现和值、平均值等分组统计量的计算,能够避免泄露原始数据,提高数据的安全性。但是,同态加密的方式具有以下两个缺陷:一方面,现有的同态加密算法无法直接进行密文的比较操作;另一方面,同态加密生成的数据位数较多,且需要对每个隐私数据都加密,计算量大,导致分组统计量的计算效率低,尤其是当真实业务数据量较大时,同态加密耗时更多,因此效率更低。

技术实现思路

[0003]本申请实施例提供了一种基于隐私安全求交和秘密分享的联邦分组统计量计算方法、系统、装置和存储介质,以至少解决如何在保证数据安全的前提下提高分组统计量计算效率的问题。
[0004]第一方面,本申请实施例提供了一种基于隐私安全求交和秘密分享的联邦分组统计量计算方法,应用于第一参与方,所述第一参与方存储有原始分组信息,且各原始分组中至少包含一个元素,所述方法包括:
[0005]与第二参与方所拥有元素进行隐私保护集合求交,得到元素交集,其中,所述第二参与方存储有元素的特征信息,所述元素交集中的各元素通过所述第二参与方提取特征信息;
[0006]根据所述原始分组信息对所述元素交集中的元素进行分组,得到联邦分组,分别根据各所述联邦分组中所包含的元素,计算出所述元素交集中各元素在每个联邦分组中的掩码;
[0007]基于所述元素交集中各元素在每个联邦分组中的掩码和所述第二参与方提取的元素交集中元素的特征信息,通过秘密分享算法计算所述每个联邦分组在每一维特征上的统计量。
[0008]在其中一些实施例中,第一参与方与第二参与方所拥有元素进行隐私保护集合求交,得到元素交集包括:
[0009]第一参与方与第二参与方分别通过预先协商的相同的脱敏规则对各自的元素信息进行脱敏,基于脱敏后的元素进行隐私保护集合求交,得到元素交集。
[0010]在其中一些实施例中,基于所述元素交集中各元素在每个联邦分组中的掩码和所述第二参与方提取的元素交集中元素的特征信息,通过秘密分享算法计算所述每个联邦分
组在每一维特征上的统计量包括:
[0011]针对所述元素交集中的每个元素,基于所述第一参与方所拥有的该元素在该联邦分组中的掩码和所述第二参与方所拥有该元素的每一维特征值,执行秘密分享算法的乘法运算,所述第一参与方得到第一乘法运算结果,所述第二参与方得到第二乘法运算结果;
[0012]所述第一参与方和所述第二参与方分别对所述第一乘法运算结果和所述第二乘法运算结果进行累和,得到第一累和结果及第二累和结果,且将所述第二累和结果发送至所述第一参与方;
[0013]所述第一参与方根据所述第一累和结果及所述第二累和结果,恢复出所述联邦分组中所有元素在每一维特征上的累和结果。
[0014]在其中一些实施例中,针对所述元素交集中的每个元素,基于所述第一参与方所拥有的该元素在该联邦分组中的掩码和所述第二参与方所拥有该元素的每一维特征值,执行秘密分享算法的乘法运算包括以下步骤:
[0015]通过可信第三方选择第一随机数a和第二随机数b,并将所述第一随机数和所述第二随机数相乘得到第三随机数ab;
[0016]将所述第一随机数a、所述第二随机数b和所述第三随机数ab随机拆分,得到用于分享给第一参与方的第一分享值[a_A]、第二分享值[b_A]和第三分享值[ab_A],以及用于分享给第二参与方的第一分享值[a_B]、第二分享值[b_B]和第三分享值[ab_B],其中a=[a_A]+[b_A],b=[b_A]+[b_B],ab=[ab_A]+[ab_B];
[0017]所述第一参与方将该元素的掩码X随机拆分成第一分享值[X_A]和第二分享值[X_B],并将所述第一分享值[X_A]保留在本地,将所述第二分享值[X_B]发送给所述第二参与方,其中掩码X=[X_A]+[X_B],X取值为0或者1,当X=0时,表明该元素不在所述联邦分组中,当X=1时表明该元素存在于所述联邦分组中;
[0018]所述第二参与方将该元素的每一维特征信息Y随机拆分成第一分享值[Y_A]和第二分享值[Y_B],并将所述第二分享值[Y_B]保留在本地,将所述第一分享值[Y_A]发送给所述第一参与方,其中Y=[Y_A]+[Y_B];
[0019]所述第一参与方计算差值[e_A]=[X_A]‑
[a_A],[f_A]=[Y_A]‑
[b_A];
[0020]所述第二参与方计算差值[e_B]=[Y_B]‑
[a_B],[f_B]=[Y_B]‑
[b_B];
[0021]所述第一参与方将[e_A]和[f_A]分享给所述第二参与方,且所述第二参与方将[e_B]和[f_B]分享给所述第一参与方,在所述第一参与方和所述第二参与方中恢复出结果e和f;
[0022]所述第一参与方计算所述第一乘法运算结果[XY_A]=f*[a_A]+e*[b_A]+[ab_A],所述第二参与方计算所述第二乘法运算结果[XY_B]=e*f+f*[a_B]+e*[b_B]+[ab_B]。
[0023]在其中一些实施例中,在恢复出所述联邦分组中所有元素在每一维特征上的累和结果之后,所述方法还包括:
[0024]所述第一参与方根据所述联邦分组的累和结果以及所述联邦分组中元素的数量,计算出所述联邦分组中所有元素在每一维特征上的平均结果。
[0025]在其中一些实施例中,在恢复出所述联邦分组中所有元素在每一维特征上的累和结果之后,所述方法还包括:
[0026]基于所述第一乘法运算结果和所述第二乘法运算结果,执行秘密分享算法的减法
运算,所述第一参与方得到第一减法运算结果,所述第二参与方得到第二减法运算结果,其中,所述第二减法运算结果被发送至所述第一参与方;
[0027]基于所述第一减法运算结果和所述第二减法运算结果,恢复出两个元素在每一维特征上的的比较结果;
[0028]当所有元素都比较完成,得到所述联邦分组中所有元素在每一维特征上的最大值和最小值。
[0029]第二方面,本申请实施例提供一种基于隐私安全求交和秘密分享的联邦分组统计量计算方法,应用于包含第一参与方和第二参与方的系统,所述第一参与方存储有原始分组信息,且各原始分组中至少包含一个元素,所述第二参与方存储有元素的特征信息,所述方法包括:
[0030]所述第一参与方与所述第二参与方所拥有元素进行隐私保护集合求交,得到元素交集;
[0031]所述第二参与方对所述元素交集中的各元素提取特征信息;...

【技术保护点】

【技术特征摘要】
1.一种基于隐私安全求交和秘密分享的联邦分组统计量计算方法,其特征在于,应用于第一参与方,所述第一参与方存储有原始分组信息,且各原始分组中至少包含一个元素,所述方法包括:与第二参与方所拥有元素进行隐私保护集合求交,得到元素交集,其中,所述第二参与方存储有元素的特征信息,所述元素交集中的各元素通过所述第二参与方提取特征信息;根据所述原始分组信息对所述元素交集中的元素进行分组,得到联邦分组,分别根据各所述联邦分组中所包含的元素,计算出所述元素交集中各元素在每个联邦分组中的掩码;基于所述元素交集中各元素在每个联邦分组中的掩码和所述第二参与方提取的元素交集中元素的特征信息,通过秘密分享算法计算所述每个联邦分组在每一维特征上的统计量。2.根据权利要求1所述的方法,其特征在于,第一参与方与第二参与方所拥有元素进行隐私保护集合求交,得到元素交集包括:第一参与方与第二参与方分别通过预先协商的相同的脱敏规则对各自的元素信息进行脱敏,基于脱敏后的元素进行隐私保护集合求交,得到元素交集。3.根据权利要求1或2所述的方法,其特征在于,基于所述元素交集中各元素在每个联邦分组中的掩码和所述第二参与方提取的元素交集中元素的特征信息,通过秘密分享算法计算所述每个联邦分组在每一维特征上的统计量包括:针对所述元素交集中的每个元素,基于所述第一参与方所拥有的该元素在该联邦分组中的掩码和所述第二参与方所拥有该元素的每一维特征值,执行秘密分享算法的乘法运算,所述第一参与方得到第一乘法运算结果,所述第二参与方得到第二乘法运算结果;所述第一参与方和所述第二参与方分别对所述第一乘法运算结果和所述第二乘法运算结果进行累和,得到第一累和结果及第二累和结果,且将所述第二累和结果发送至所述第一参与方;所述第一参与方根据所述第一累和结果及所述第二累和结果,恢复出所述联邦分组中所有元素在每一维特征上的累和结果。4.根据权利要求3所述的方法,其特征在于,针对所述元素交集中的每个元素,基于所述第一参与方所拥有的该元素在该联邦分组中的掩码和所述第二参与方所拥有该元素的每一维特征值,执行秘密分享算法的乘法运算包括以下步骤:通过可信第三方选择第一随机数a和第二随机数b,并将所述第一随机数和所述第二随机数相乘得到第三随机数ab;将所述第一随机数a、所述第二随机数b和所述第三随机数ab随机拆分,得到用于分享给第一参与方的第一分享值[a_A]、第二分享值[b_A]和第三分享值[ab_A],以及用于分享给第二参与方的第一分享值[a_B]、第二分享值[b_B]和第三分享值[ab_B],其中a=[a_A]+[b_A],b=[b_A]+[b_B],ab=[ab_A]+[ab_B];所述第一参与方将该元素在该联邦分组中的掩码X随机拆分成第一分享值[X_A]和第二分享值[X_B],并将所述第一分享值[X_A]保留在本地,将所述第二分享值[X_B]发送给所述第二参与方,其中掩码X=[X_A]+[X_B],X取值为0或者1,当X=0时,表明元素不在所述联邦分组中,当X=1时表明该元素存在于所述联邦分组中;
所述第二参与方将该元素的每一维特征信息Y随机拆分成第一分享值[Y_A]和第二分享值[Y_B],并将所述第二分享值[Y_B]保留在本地,将所述第一分享值[Y_A]发送给所述第一参与方,其中Y=[Y_A]+[Y_B];所述第一参与方计算差值[e_A]=[X_A]

[a_A],[f_A]=[Y_A]

[b_A];所述第二参与方计算差值[e_B]=[Y_B]

[a_B],[f_B]=[Y_B]

[b_B];所述第一参与方将[e_A]和[f_A]分享给所述第二参与方,且所述...

【专利技术属性】
技术研发人员:朱帆傅致晖孟丹李晓林
申请(专利权)人:杭州博盾习言科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1