【技术实现步骤摘要】
一种基于PSI技术保护联邦学习预测阶段隐私的方法
本专利技术涉及信息安全领域和人工智能领域,特别涉及PSI技术在联邦学习中的应用,实现联邦学习预测阶段的隐私保护,为一种基于PSI技术保护联邦学习预测阶段隐私的方法。
技术介绍
大数据、云计算、物联网等新兴技术的迅猛发展,导致数据爆炸式增长,而这些数据又由不同的实体机构掌握。一方面,随着我国《网络安全法》、欧盟《通用数据保护条例》(GDPR)等法律法规的颁布,各国政府对用户数据隐私保护的要求将会越来越严,仅仅依靠传统方法对大数据使用、分析已经出现瓶颈;另一方面,掌握大量数据的各个实体机构既希望能够实现数据共享,挖掘数据潜在的巨大价值,又不希望泄露自身数据。因此,在大数据应用过程中,数据隐私安全得到越来越多的重视。常用的隐私保护技术有k-匿名、差分隐私、同态加密、安全多方计算等。2016年谷歌提出的联邦学习技术,被认为是走出上述困境的技术之一,得到越来越多的关注。联邦学习实际上是一种基于密码学的分布式学习技术,各参与实体机构在不泄露自有数据的前提下地位平等地训练模型,称为 ...
【技术保护点】
1.一种基于PSI技术保护联邦学习预测阶段隐私的方法,其特征在于在联邦学习的预测阶段,数据基于隐私集合求交PSI技术进行交互,并在交互过程中对交互信息进行加密,对联邦学习的参与方进行隐私保护。/n
【技术特征摘要】
1.一种基于PSI技术保护联邦学习预测阶段隐私的方法,其特征在于在联邦学习的预测阶段,数据基于隐私集合求交PSI技术进行交互,并在交互过程中对交互信息进行加密,对联邦学习的参与方进行隐私保护。
2.根据权利要求1所述的一种基于PSI技术保护联邦学习预测阶段隐私的方法,其特征在于所述联邦学习为纵向联邦学习,联邦学习的参与方包括预测需求方Alice,预测服务方Bob和可信第三方Carol,Alice和Bob在Carol的帮助下通过联邦学习分别获得联邦学习模型的对应部分ModelA和ModelB,在预测阶段,Alice和Bob分别使用各自的模型ModelA和ModelB计算出预测结果再进行合并预测:在合并预测中基于PSI对Alice和Bob进行隐私保护,其中Bob对发出的预测结果进行加密,Alice在基于PSI与Bob完成集合求交后,对交集部分对应的预测结果进行解密,得到所需求的预测数据,使得Alice在获得Bob的预测结果的同时,不会泄露自身的隐私信息,Bob在提供预测数据时也不会泄露自身的隐私信息。
3.根据权利要求2所述的一种基于PSI技术保护联邦学习预测阶段隐私的方法,其特征在于联邦学习模型中,数据样本(id,f)由关键字id和特征值f构成,将id的集合记为ID,特征集合记为F,设Alice和Bob用作预测的数据集分别为DataA和DataB,其对应的关键字集合分别为IDA、IDB,对应的特征集合分别为FA、FB,DataA和DataB关键字具有交集,特征值均不相同;DataA和DataB数据集中的样本分别为(id,fA,id)和(id,fB,id),其中fA,id和fB,id分别表示Alice和Bob各自的关键字id对应的特征值,Alice需要在Bob的配合下计算id∈IDA的预测结果,当Alice发出预测请求时,Alice和Bob执行以下步骤:
S1)Bob利用模型ModelB对自有数据集DataB进行计算,得到scoreB,id=ModelB(fB,id),对于所有的id∈IDB,形成新的数据集记为PredictB={(id,scoreB,id)|id∈IDB};
S2)Alice和Bob执行PSI协议,将Bob的数据集PredictB变换为ePB={(eidB,id,scoreB,id)|id∈IDB},这里同一个id可能对应多个eidB,id,Alice的关键字集合IDA变换为eIDA={eidA,id|id∈IDA},这里同一个id只对应一个eidA,id;
S3)对每个(eidB,id,scoreB,id)∈ePB,Bob使用密钥导出函数KDF得到对称加密密钥kid=KDF(eidB,id,id,iter,klen),其中eidB,id表示口令,id作为密钥的盐值,iter表示迭代次数,kl...
【专利技术属性】
技术研发人员:张韶峰,单进勇,
申请(专利权)人:百融云创科技股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。