联邦学习参与方贡献度量方法、装置、存储介质及设备制造方法及图纸

技术编号：31982599 阅读：54 留言：0更新日期：2022-01-20 01:56

本公开提供了一种联邦学习参与方贡献度量方法、装置、存储介质及设备，涉及机器学习技术领域。该方法包括：确定联邦学习建模任务的各参与方的各特征对训练得到的联邦学习模型的沙普利值的边际贡献量，其中，所述各特征是所述各参与方提供的用于训练所述联邦学习模型的数据集中的特征；确定所述各参与方的所有特征的沙普利值的边际贡献量的总和，得到所述各参与方对所述联邦学习模型的贡献量。本公开实施例可更加客观的反映出联邦学习的各参与方对联邦学习模型的贡献价值，提高了评估参与方对联邦学习模型贡献价值的精度。方对联邦学习模型贡献价值的精度。方对联邦学习模型贡献价值的精度。

全部详细技术资料下载

【技术实现步骤摘要】
联邦学习参与方贡献度量方法、装置、存储介质及设备

[0001]本公开涉及机器学习
，尤其涉及一种联邦学习参与方贡献度量方法、装置、存储介质及设备。

技术介绍

[0002]目前，联邦学习以及安全多方计算已逐渐成为解决数据安全共享的主要手段和技术。在联邦学习系统中，为了科学合理的分配数据提供方在联邦学习系统中的收益，并激励更多的拥有大数据量和高数据质量的数据提供方加入联邦学习系统，提供一种科学合理的数据提供方贡献量度量措施是必要的。
[0003]在相关技术中，可从期望收益分配的角度，考虑期望指标(准确率等)与实际计算值之间的差值，并利用Softmax函数将该差值转换为权重，即为贡献值；但该方式需要第三方参与计算，对收益和损失皆采用期望值进行估计，概率难以界定，无法客观的反映出参与方在联邦学习系统中对联邦学习模型的贡献价值。此外，还可从边际损失的角度衡量数据提供方离开联邦学习系统时所产生的损失，将该损失作为贡献量。该方式同样需要第三方参与计算，且对数据提供方离开联邦学习系统时的损失计算为不放回一次性计算，离开顺序严重影响联邦学习模型性能，测算欠缺公平性，无法客观的反映出参与方在联邦学习系统中对联邦学习模型的贡献价值，此外，该方式计算复杂度高。
[0004]需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本公开提供一种联邦学习参与方贡献度量方法、装置、存储介质及设备，至少在一...

【技术保护点】

【技术特征摘要】
1.一种联邦学习参与方贡献度量方法，其特征在于，包括：确定联邦学习建模任务的各参与方的各特征对训练得到的联邦学习模型的沙普利值的边际贡献量，其中，所述各特征是所述各参与方提供的用于训练所述联邦学习模型的数据集中的特征；确定所述各参与方的所有特征的沙普利值的边际贡献量的总和，得到所述各参与方对所述联邦学习模型的贡献量。2.根据权利要求1所述的联邦学习参与方贡献度量方法，其特征在于，确定所述各参与方的所有特征的沙普利值的边际贡献量的总和，包括：对于所述各参与方的各特征，计算特征对测试集中样本测试值的实际测试值与该特征对所述样本测试值的期望测试值之间的差值，得到该特征对测试结果的边际贡献量，根据该边际贡献量计算该特征对所述联邦学习模型的沙普利值的边际贡献量。3.根据权利要求1所述的联邦学习参与方贡献度量方法，其特征在于，确定联邦学习建模任务的各参与方的各特征对训练得到的联邦学习模型的沙普利值的边际贡献量，包括：多次对数据集中的样本实例进行随机数值模拟，确定出每次随机数值模拟得到的所述各参与方的各特征对所述联邦学习模型的沙普利值的边际贡献量，其中，所述数据集中包括多个样本实例，各样本实例中包括一个参与方的多个特征；对于所述各参与方的各特征，将在多次随机数值模拟得到的多个边际贡献量的均值作为特征对所述联邦学习模型的沙普利值的边际贡献量。4.根据权利要求3所述的联邦学习参与方贡献度量方法，其特征在于，每次通过随机数值模拟确定所述各参与方的各特征对所述联邦学习模型的沙普利值的边际贡献量，包括：从所述数据集中随机抽取特征，得到随机样本实例；将目标样本实例以及所述随机样本实例以相同的随机顺序进行排序，排序后得到第一样本实例以及第二样本实例，其中，所述目标样本实例为所述数据集中的任一样本实例；根据所述第一样本实例构造包含目标特征序号的第三样本实例，根据所述第二样本实例构造不包含所述目标特征序号的第四样本...

【专利技术属性】
技术研发人员：章枝宪，李鑫超，周旭华，杨诗友，尹虹舒，
申请(专利权)人：中国电信股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人