【技术实现步骤摘要】
基于多方多模型隐私求交的联邦学习内容推送方法及装置
[0001]本专利技术涉及联邦学习
,具体而言,涉及一种基于多方多模型隐私求交的联邦学习内容推送方法、装置、电子设备及计算机可读介质。
技术介绍
[0002]在机器学习建模过程中,样本数据会涉及到不同领域的数据,例如个人身份信息、金融消费信息、互联网行为信息、地理位置信息等等。为保护用户隐私安全,通常需要使用联邦学习来聚合这些不同领域的数据隐私进行建模,达到“数据可用不可见”的效果。
[0003]现有的联邦学习中,通常采取隐私交集(Private Set Intersection,简称为PSI)的方法来聚合数据。多方隐私交集是指多个数据方可以分别获得所有数据方的共同交集,但是不揭露任何共同交集之外的额外信息。由于隐私交集取各个数据方数据集合的交集,因此,隐私交集后,数据集的规模一定会变小,并且数据方越多,求交集后的数据集规模越小,很可能最终的数据集规模过小,无法完成对模型的训练;又或者用较小的数据集训练得到了模型,但由于训练的数据集比较小也会导致模型的泛化能力差,无法实现精准预测。此外,如果模型的测试集也通过上述隐私求交得到,则无法保证对于全量的测试集,都有相应的模型分值产出,这将严重限制模型在生成部署中的应用范围,影响内容推送。
技术实现思路
[0004]有鉴于此,本专利技术主要目的在于提出一种基于多方多模型隐私求交的联邦学习内容推送方法、装置、电子设备及计算机可读介质,以期至少部分地解决上述技术问题中的至少之一。
[0005 ...
【技术保护点】
【技术特征摘要】
1.一种基于多方多模型隐私求交的联邦学习内容推送方法,其特征在于,所述方法包括:获取联邦学习发起方和各个联邦学习参与方的数据集合;对联邦学习发起方的数据集合与所有联邦学习参与方的数据集合求交,得到联邦学习基础训练数据集;判断所述联邦学习基础训练数据集中的数据量是否满足预设条件;若不满足,对联邦学习发起方的数据集合分别与多个不同联邦学习参与方的数据集合求交,得到多个联邦学习子训练数据集;采用每个联邦学习训练数据集训练对应的联邦学习模型,得到多个联邦学习模型;其中:所述联邦学习训练数据集包括:所述联邦学习基础训练数据集和各个联邦学习子训练数据集;每个联邦学习训练数据集对应一个求交协议和一个联邦学习模型;基于所述联邦学习模型执行内容推送操作。2.根据权利要求1所述的方法,其特征在于,参与方的总数为m,m为大于2的自然数;若不满足,对发起方的数据集合与每m
‑
i个参与方的数据集合求交,得到多个第i联邦学习子训练数据集;i=1,2
…
m
‑
1。3.根据权利要求1所述的方法,其特征在于,发起方与参与方的总数为n,参与求交的数据方数量为r;其中:n为大于等于3的自然数,r为大于等于2小于n的自然数;若不满足,对发起方的数据集合与每r
‑
1个参与方的数据集合求交,得到多个联邦学习子训练数据集;对应的,所述采用每个联邦学习训练数据集训练对应的联邦学习模型包括:根据总数n和参与求交的数据方数量r构建对应数量的联邦学习模型;将每个联邦学习训练数据集分别输入对应的联邦学习模型中进行训练。4.根据权利要求3所述的方法,其特征在于,根据总数n和参与训练模型的数据方数量r构建C(n
‑
1,r
‑
1)+1个对应数量的模型。5.根据权利要求1
‑
4任一项所述的方法,其特征在于,所述基于所述联邦学习模型执行内容推送操作包括:对预测数据采用与各个联邦学习训练数据集对应的求交协议求交,得到各个预测数据集;根据预测数据所属的预测数据集选取目标联邦学习模型进行预测;根据预测结果执行内容推送操作。6.根据权利要求5所述的方法,其特征在于,所述根据预测数据所属的预测数据集选取目标联邦学习模型进行预测包括:在预测数据所属预测数据集中,按照求交的参与方数量r选择目标联邦学习模型进行预测;或者:在预测数据所属预测数据集中,按照求交的参与方的优选级选择目标联邦学习模型进行预测;或者:在预测数据所属预测数据集中,按照预测数据集的数据量选择目标联邦学习模型进行
预测。7.一种基于多方多模型隐私求交的联邦学习内容推送装置,其特征在于,所述装置包括:获取模块,用于获取联邦学习发起方和各个联邦学习参与方的数据集合;第一求交模块,用于对联邦学习发起方的数据集合与所有联邦学习参与方的数据集合求交,得到联邦...
【专利技术属性】
技术研发人员:黄小刚,赵轶,黄强盛,费浩峻,贾毅宁,
申请(专利权)人:上海淇毓信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。