联邦学习参与方贡献度量方法、装置、存储介质及设备制造方法及图纸

技术编号:31982599 阅读:54 留言:0更新日期:2022-01-20 01:56
本公开提供了一种联邦学习参与方贡献度量方法、装置、存储介质及设备,涉及机器学习技术领域。该方法包括:确定联邦学习建模任务的各参与方的各特征对训练得到的联邦学习模型的沙普利值的边际贡献量,其中,所述各特征是所述各参与方提供的用于训练所述联邦学习模型的数据集中的特征;确定所述各参与方的所有特征的沙普利值的边际贡献量的总和,得到所述各参与方对所述联邦学习模型的贡献量。本公开实施例可更加客观的反映出联邦学习的各参与方对联邦学习模型的贡献价值,提高了评估参与方对联邦学习模型贡献价值的精度。方对联邦学习模型贡献价值的精度。方对联邦学习模型贡献价值的精度。

【技术实现步骤摘要】
联邦学习参与方贡献度量方法、装置、存储介质及设备


[0001]本公开涉及机器学习
,尤其涉及一种联邦学习参与方贡献度量方法、装置、存储介质及设备。

技术介绍

[0002]目前,联邦学习以及安全多方计算已逐渐成为解决数据安全共享的主要手段和技术。在联邦学习系统中,为了科学合理的分配数据提供方在联邦学习系统中的收益,并激励更多的拥有大数据量和高数据质量的数据提供方加入联邦学习系统,提供一种科学合理的数据提供方贡献量度量措施是必要的。
[0003]在相关技术中,可从期望收益分配的角度,考虑期望指标(准确率等)与实际计算值之间的差值,并利用Softmax函数将该差值转换为权重,即为贡献值;但该方式需要第三方参与计算,对收益和损失皆采用期望值进行估计,概率难以界定,无法客观的反映出参与方在联邦学习系统中对联邦学习模型的贡献价值。此外,还可从边际损失的角度衡量数据提供方离开联邦学习系统时所产生的损失,将该损失作为贡献量。该方式同样需要第三方参与计算,且对数据提供方离开联邦学习系统时的损失计算为不放回一次性计算,离开顺序严重影响联邦学习模型性能,测算欠缺公平性,无法客观的反映出参与方在联邦学习系统中对联邦学习模型的贡献价值,此外,该方式计算复杂度高。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0005]本公开提供一种联邦学习参与方贡献度量方法、装置、存储介质及设备,至少在一定程度上克服相关技术中无法客观的反映出联邦学习参与方对联邦学习模型的贡献价值的问题。
[0006]根据本公开的第一个方面,提供了一种联邦学习参与方贡献度量方法,包括:确定联邦学习建模任务的各参与方的各特征对训练得到的联邦学习模型的沙普利值的边际贡献量,其中,所述各特征是所述各参与方提供的用于训练所述联邦学习模型的数据集中的特征;确定所述各参与方的所有特征的沙普利值的边际贡献量的总和,得到所述各参与方对所述联邦学习模型的贡献量。
[0007]可选的,确定所述各参与方的所有特征的沙普利值的边际贡献量的总和,包括:对于所述各参与方的各特征,计算特征对测试集中样本测试值的实际测试值与该特征对所述样本测试值的期望测试值之间的差值,得到该特征对测试结果的边际贡献量,根据该边际贡献量计算该特征对所述联邦学习模型的沙普利值的边际贡献量。
[0008]可选的,确定联邦学习建模任务的各参与方的各特征对训练得到的联邦学习模型的沙普利值的边际贡献量,包括:多次对数据集中的样本实例进行随机数值模拟,确定出每次随机数值模拟得到的所述各参与方的各特征对所述联邦学习模型的沙普利值的边际贡
献量,其中,所述数据集中包括多个样本实例,各样本实例中包括一个参与方的多个特征;对于所述各参与方的各特征,将在多次随机数值模拟得到的多个边际贡献量的均值作为特征对所述联邦学习模型的沙普利值的边际贡献量。
[0009]可选的,每次通过随机数值模拟确定所述各参与方的各特征对所述联邦学习模型的沙普利值的边际贡献量,包括:从所述数据集中随机抽取特征,得到随机样本实例;将目标样本实例以及所述随机样本实例以相同的随机顺序进行排序,排序后得到第一样本实例以及第二样本实例,其中,所述目标样本实例为所述数据集中的任一样本实例;根据所述第一样本实例构造包含目标特征序号的第三样本实例,根据所述第二样本实例构造不包含所述目标特征序号的第四样本实例,其中,所述目标特征序号为所述目标样本实例中的任一特征的序号;获取所述第三样本实例对应的第一测试结果以及所述第四样本实例对应的第二测试结果;根据所述第一测试结果以及所述第二测试结果之间的差异确定所述目标特征对所述联邦学习模型的沙普利值的边际贡献量。
[0010]可选的,所述方法还包括:将所述数据集中的目标样本实例以及所述随机样本实例以相同的随机顺序进行排序之前,根据所述数据集构建特征序号集合,其中,所述特征序号集合中包括各参与方的特征序号,所述特征序号中包括特征所属的参与方的序号以及特征在所述参与方中的序号;对所述特征序号集合中的特征序号进行随机排序,得到所述随机顺序。
[0011]可选的,所述各参与方提供的训练数据具有不同的特征空间以及相同的样本空间。
[0012]可选的,所述参与方不包括可信第三方或协调方中的任意一方。
[0013]根据本公开的第二方面,提供了一种联邦学习参与方贡献度量装置,包括:第一确定模块,用于确定联邦学习建模任务的各参与方的各特征对训练得到的联邦学习模型的沙普利值的边际贡献量,其中,所述各特征是所述各参与方提供的用于训练所述联邦学习模型的数据集中的特征;第二确定模块,用于确定所述各参与方的所有特征的沙普利值的边际贡献量的总和,得到所述各参与方对所述联邦学习模型的贡献量。
[0014]根据本公开的第三个方面,提供了一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行本公开实施例提供的任意一种联邦学习参与方贡献度量方法。
[0015]根据本公开的第四个方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本公开实施例提供的任意一种联邦学习参与方贡献度量方法。
[0016]本公开实施例的联邦学习参与方贡献度量方法、装置、存储介质及设备,以联邦学习建模任务的参与方提供的训练数据中各特征对联邦学习模型的Shapley值的边际贡献量来衡量该特征对联邦学习模型的贡献价值,通过先确定出各参与方的各特征对联邦学习模型的贡献量,再确定出各参与方所有的特征对联邦学习模型的贡献量来得到各参与方对联邦学习模型的贡献量,可更加客观的反映出联邦学习的各参与方对联邦学习模型的贡献价值,提高了评估参与方对联邦学习模型贡献价值的精度。
[0017]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0018]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1是根据本公开一个实施例的联邦学习系统的结构示意图;
[0020]图2是根据本公开一个实施例的联邦学习参与方贡献度量方法的流程图;
[0021]图3是根据本公开一个实施例的矩阵集合的示意图;
[0022]图4是根据本公开一个实施例的一种联邦学习参与方贡献度量方法的流程图;
[0023]图5是根据本公开一个实施例示出的数据特征分布示意图;
[0024]图6是根据本公开一个实施例的确定联邦学习建模任务的各参与方的各特征对联邦学习模型的沙普利值的边际贡献量的流程图;
[0025]图7是根据本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种联邦学习参与方贡献度量方法,其特征在于,包括:确定联邦学习建模任务的各参与方的各特征对训练得到的联邦学习模型的沙普利值的边际贡献量,其中,所述各特征是所述各参与方提供的用于训练所述联邦学习模型的数据集中的特征;确定所述各参与方的所有特征的沙普利值的边际贡献量的总和,得到所述各参与方对所述联邦学习模型的贡献量。2.根据权利要求1所述的联邦学习参与方贡献度量方法,其特征在于,确定所述各参与方的所有特征的沙普利值的边际贡献量的总和,包括:对于所述各参与方的各特征,计算特征对测试集中样本测试值的实际测试值与该特征对所述样本测试值的期望测试值之间的差值,得到该特征对测试结果的边际贡献量,根据该边际贡献量计算该特征对所述联邦学习模型的沙普利值的边际贡献量。3.根据权利要求1所述的联邦学习参与方贡献度量方法,其特征在于,确定联邦学习建模任务的各参与方的各特征对训练得到的联邦学习模型的沙普利值的边际贡献量,包括:多次对数据集中的样本实例进行随机数值模拟,确定出每次随机数值模拟得到的所述各参与方的各特征对所述联邦学习模型的沙普利值的边际贡献量,其中,所述数据集中包括多个样本实例,各样本实例中包括一个参与方的多个特征;对于所述各参与方的各特征,将在多次随机数值模拟得到的多个边际贡献量的均值作为特征对所述联邦学习模型的沙普利值的边际贡献量。4.根据权利要求3所述的联邦学习参与方贡献度量方法,其特征在于,每次通过随机数值模拟确定所述各参与方的各特征对所述联邦学习模型的沙普利值的边际贡献量,包括:从所述数据集中随机抽取特征,得到随机样本实例;将目标样本实例以及所述随机样本实例以相同的随机顺序进行排序,排序后得到第一样本实例以及第二样本实例,其中,所述目标样本实例为所述数据集中的任一样本实例;根据所述第一样本实例构造包含目标特征序号的第三样本实例,根据所述第二样本实例构造不包含所述目标特征序号的第四样本...

【专利技术属性】
技术研发人员:章枝宪李鑫超周旭华杨诗友尹虹舒
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1