一种联邦学习中半诚实模型下高效匿踪查询方法技术

技术编号:38843662 阅读:18 留言:0更新日期:2023-09-17 09:56
本发明专利技术是一种联邦学习中半诚实模型下高效匿踪查询方法,包括联邦学习的参与方之间进行隐私求交的步骤,查询方随机筛选一个包含隐私交集的待查询数据库,并将对应的隐私求交中间结果作为索引{index}发送给隐私数据库持有方;隐私数据库持有方筛选待查询数据库的步骤;隐私数据库持有方将待查询数据库做一个加法秘密共享得到sharel和share2,并分别发送给查询方和一个半诚实第三方的步骤;查询方筛选得到的数据库秘密共享分片share1,得到share11;半诚实第三方通过查询索引{index}对数据库秘密共享后的分片share2进行筛选,得到新的数据秘密共享分片share22的步骤,最后查询方计算sharel1+share22得到最终的匿踪查询结果。本发明专利技术提高联邦学习中匿踪查询的效率的同时提高联邦学习中匿踪查询的安全性。同时提高联邦学习中匿踪查询的安全性。同时提高联邦学习中匿踪查询的安全性。

【技术实现步骤摘要】
一种联邦学习中半诚实模型下高效匿踪查询方法


[0001]本专利技术涉及联邦学习中半诚实模型下高效匿踪查询方法领域。

技术介绍

[0002]匿踪查询,英文叫Private Information Retrieval(缩写为PIR),是安全多方计算中非常实用的一门技术与应用,可以用来保护用户的查询隐私,进而也可以保护用户的查询结果。在PIR查询中,查询方的查询对象关键词或客户ID信息被隐藏。数据查询服务方提供匹配的查询结果却无法获知具体对应哪个查询对象。联邦学习是隐私计算在机器学习领域的应用,在不泄露各方隐私数据的情况下,能够融合多方的数据,通过机器学习算法,训练更精准的模型,进行预测。联邦学习属于安全计算的应用范围,一般会结合多种安全计算技术,如多方安全计算、同态加密、差分隐私等等。
[0003]多方计算中,一种通用的多方安全计算安全模型,在半诚实模型中,攻击者会严格遵守多方计算的协议流程,但它会好奇其他参与方的隐私数据,试图通过接收到的中间数据还原其他参与方的隐私数据。
[0004]秘密共享也叫Secret Sharing,是密码学中一种常见的技术,用于把隐私的秘密数据以适当的方式拆分成多份数据,拆分后的每一份数据由不同的参与者管理,单个参与者无法恢复秘密信息,只有若干个参与者一同协作才能恢复秘密消息。更重要的是,当其中任何相应范围内参与者出问题时,秘密仍可以完整恢复。
[0005]常见的秘密共享方案有Shamir秘密共享,以及Additive秘密共享。
[0006]秘密共享常用来构造安全多方计算协议,如SPDZ,ABY3等。
[0007]联邦学习是近几年兴起的一个概念,属于隐私计算的一个热门领域。其在2017年由Google提出,通过融合多个用户的数据,通过机器学习算法,训练更准确的模型,以便更好的为用户提供推荐等服务。同时,为了更好保护用户的隐私,用户无需传递隐私数据给Google这样的中间服务商,所有机器学习训练对数据的计算都在用户本地完成,所有用户只需要将梯度等最终结果传输给中间服务商即可,最后由中间服务商做最终结果的整合,整合好后,将新的模型发送给所有用户。所有用户进行新的一轮的学习训练过程,周而复始,直至有满意的模型输出。
[0008]联邦学习由于能够在保护用户数据隐私的条件下,消除数据孤岛,联合各方数据训练更好的预测模型,提供更好的服务。因此自此概念提出后,便受到各方关注,不少互联网,金融等企业纷纷踏足联邦学习领域。
[0009]目前常见的PIR协议主要分为单服务器(Single

server)PIR和多服务器PIR。
[0010](1)单服务器(single

database computational PIR)PIR,这类PIR常基于公钥密码学,0T,同态加密等,需要进行大量的密文运算,也需要进行密文传输。如[ACLS 2018],S.Angel,H.Chen,K.Laine,S.Setty,PIR with compressed queries and amortized query processing;IEEE Symposium on Security and Privacy(S&P),2018。
[0011](2)多服务器PIR,也叫information

theoretically secure PIR,这种方案中,查
询者通常将自己的查询请求做secret share,并发送给多个服务器处理share后的查询请求,多个服务器处理share的查询请求后生成response应答,查询客户端得到多个应答后,合并得到最终应答。这类方案通常需要将隐私数据库备份到多个服务器,并要求处理查询请求时,多服务器之间不共谋。具体例子有,[Cappos 2013]J.Cappos,Avoiding theoretical optimality to efficiently and privately retrieve security updates,International Conference on Financial Cryptography and Data Security(FC),2013。
[0012](3)特有联邦学习中的PIR方案,如FATE[Webank2023 Federated AI Technology Enabler.https://github.com/FederatedAI/FATE.Last Accessed March 27th,2023.]的基于隐私求交,OT传输加密密钥,及对称加密的PIR。
[0013]上述三种PIR下各有不足:
[0014]单服务器PIR的缺点:涉及大量计算消耗较大的加密计算,且通常与数据库成线性关系,整体计算效率偏低,有的P IR方案还涉及大量密文传输,同样造成较大通讯开销。
[0015]多服务器PIR的缺点:需要将隐私数据库共享给多个并不信任的服务器,有数据泄露风险,且数据库需要些额外复杂的编码。
[0016]特有联邦学习中的PIR方案不考虑PSI开销的情况下,PIR阶段需要大量的对称加密运算及密文传输,同时PSI数据集中有特定模式的情况下,PIR有数据泄露风险,且安全等级参数设置越高的情况下,通讯计算开销越大6
[0017]因此,目前,PIR匿踪查询,属于一种应用非常广泛的多方安全计算协议,目前已应用在联邦学习中,但由于涉及大量的公钥加密,密文传输等,容易成为联邦学习的性能瓶颈。目前,联邦学习中半模型下匿踪查询的安全性和效率都有待提高。

技术实现思路

[0018]本专利技术针对目前邦学习中半模型下匿踪查询的安全性和效率都有待提高,提供一种联邦学习中半诚实模型下高效匿踪查询方法。
[0019]本专利技术为实现其技术目的所采用的技术方案是:一种联邦学习中半诚实模型下高效匿踪查询方法,该方法中,联邦学习的参与方包括查询方、隐私数据库持有方和半诚实三方;包括以下步骤:
[0020]S1、联邦学习的参与方之间进行隐私求交,查询方获取隐私交集,保存中间结果;
[0021]S2、查询方随机筛选一个包含隐私交集的待查询数据库,并将对应的隐私求交中间结果作为索引{index}发送给隐私数据库持有方;隐私数据库持有方筛选待查询数据库;
[0022]S3、隐私数据库持有方将待查询数据库做一个加法秘密共享得到share 1和share2,并分别发送给查询方和一个半诚实第三方;
[0023]S4、查询方将隐私交集的中间结果作为查询索引{index}I,筛选得到的数据库秘密共享分片share1,得到share11;
[0024]S5、查询方将隐私交集的中间结果作为查询索引{index}
I
发送给半诚实第三方;
[0025]S6、半诚实第三方通过查询索引{index}
I
对数据库秘密共享后的分片share2本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种联邦学习中半诚实模型下高效匿踪查询方法,该方法中,联邦学习的参与方包括查询方、隐私数据库持有方和半诚实三方;其特征在于:包括以下步骤:S1、联邦学习的参与方之间进行隐私求交,查询方获取隐私交集,保存中间结果;S2、查询方随机筛选一个包含隐私交集的待查询数据库,并将对应的隐私求交中间结果作为索引{index}发送给隐私数据库持有方;隐私数据库持有方筛选待查询数据库;S3、隐私数据库持有方将待查询数据库做一个加法秘密共享得到share1和share2,并分别发送给查询方和一个半诚实第三方;S4、查询方将隐私交集对应的中间结果作为查询索引{index}
I
,筛选得到的数据库秘密共享分片share1,得到share11;S5、查询方将隐私交集对应的查询索引{index}
I
发送给半诚实第三方;S6、半诚实第三方通过隐私交集对应的查询索引{index}
I
对数据库秘密共享后的分片share2进行筛选,得到新的数据秘密共享分片share22,并返回给查询方;S7、查询方计算share11+share22得到最终的匿踪查询结果。2.根据权利要求1所述的联邦学习中半诚实...

【专利技术属性】
技术研发人员:谈扬彭彦雄
申请(专利权)人:深圳前海新心数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1