一种联邦学习中特征贡献度的确定方法、装置及电子设备制造方法及图纸

技术编号:30830654 阅读:18 留言:0更新日期:2021-11-18 12:43
本发明专利技术实施例提供了一种联邦学习中特征贡献度的确定方法、装置及电子设备,方法包括:获取本地用于训练联邦学习模型的第一训练样本所包括的各个第一特征值以及每个第一特征所对应的权重,基于每个第一特征值及其对应的权重,计算该第一特征对应的夏普利值,作为该第一特征对应的贡献度,再获取第二设备对应的第二训练样本所包括的各个第二特征对应的夏普利值,作为该第二特征对应的贡献度,根据第一特征对应的贡献度以及第二特征对应的贡献度,确定每个特征对应的重要程度,由于夏普利值可以保证分配的公平性,所以将夏普利值应用到联邦学习模型中,可以更加准确地确定训练样本所包含的各个特征对于模型的贡献度,进而使模型的输出结果更加准确。模型的输出结果更加准确。模型的输出结果更加准确。

【技术实现步骤摘要】
一种联邦学习中特征贡献度的确定方法、装置及电子设备


[0001]本专利技术涉及联邦学习
,特别是涉及一种联邦学习中特征贡献度的确定方法、装置及电子设备。

技术介绍

[0002]在广义线性联邦学习模型中,模型发起方在模型训练完成后需要评估训练样本中各个特征对于模型的贡献度,根据各个特征对于模型的贡献度可以判断出在模型使用过程中各输入信息的重要程度,也就是说,各个特征对于模型的贡献度可以指导在模型使用过程中输入信息的重要性的判断,进而增强了模型的可解释性。
[0003]例如,银行与运营商机构合作联邦训练出的风控模型,模型发起方为银行,在风控模型训练完成之后,银行便可以评估用户对应的在网时长、话费套餐金额、近6个月通话时长、近1个月通话人数等特征进行评估,评估出的重要程度分别为:在网时长:高;话费套餐金额:较低;近6个月通话时长:较高;近1个月通话人数:中,说明在网时长对于模型的输出结果影响较大,而话费套餐金额则对模型的输出结果影响较小。那么,在模型使用过程中,可以根据各个信息的重要程度来监测模型效果变化情况。例如,银行用户群在网时长、近1个月通话人数如果发生较大变化,模型效果极有可能变差,需重新更新迭代模型。
[0004]可见,评估各个特征对于模型的贡献度是非常重要的。因此,亟需一种能够准确地确定联邦学习模型中各个特征的贡献度的方法。

技术实现思路

[0005]本专利技术实施例的目的在于提供一种联邦学习中特征贡献度的确定方法、装置及电子设备,以准确确定联邦学习模型中各个特征的贡献度,实现使得模型的输出结果更加准确的目的。具体技术方案如下:
[0006]第一方面,本专利技术实施例提供了一种联邦学习中特征贡献度的确定方法,应用于联邦学习模型训练系统中的第一设备,所述系统还包括第二设备,所述方法包括:
[0007]在所述联邦学习模型训练完成后,获取本地用于训练所述联邦学习模型的第一训练样本所包括的各个第一特征以及每个第一特征所对应的权重;
[0008]基于所述每个第一特征及其对应的权重,计算该第一特征对应的夏普利值,作为该第一特征对应的贡献度;
[0009]获取所述第二设备对应的第二训练样本所包括的各个第二特征对应的夏普利值,作为所述第二特征对应的贡献度;
[0010]根据所述第一特征对应的贡献度以及所述第二特征对应的贡献度,确定每个特征对应的重要程度,其中,所述重要程度用于确定所述联邦学习模型的输入信息的组成。
[0011]可选的,所述获取所述第二设备对应的第二训练样本所包括的各个第二特征对应的夏普利值的步骤,包括:
[0012]获取所述第二设备对应的用于训练所述联邦学习模型的第二训练样本所包括的
各个第二特征以及每个第二特征所对应的权重,并基于所述每个第二特征及其对应的权重,计算该第二特征对应的夏普利值;或,
[0013]接收所述第二设备发送的用于训练所述联邦学习模型的第二训练样本所包括的各个第二特征对应的夏普利值,其中,所述第二特征对应的夏普利值为所述第二设备基于所述每个第二特征及其对应的权重计算得到的。
[0014]可选的,所述根据所述第一特征对应的贡献度以及所述第二特征对应的贡献度,确定每个特征对应的重要程度的步骤,包括:
[0015]将所述第一特征对应的贡献度以及所述第二特征对应的贡献度进行排序,得到排序结果;
[0016]基于所述排序结果确定每个特征对应的重要程度。
[0017]可选的,所述基于所述每个第一特征及其对应的权重,计算该第一特征对应的夏普利值的步骤,包括:
[0018]计算所述每个第一特征的平均值;
[0019]基于所述平均值,按照公式对所述每个第一特征进行去中心化处理,得到处理后的第一特征,其中,Z
i
为处理后的第i个第一特征,X
i
为第i个第一特征,为第i个第一特征对应的平均值;
[0020]基于所述处理后的第一特征及其对应的权重,计算该第一特征对应的夏普利值。
[0021]可选的,所述基于所述处理后的第一特征及其对应的权重,计算该第一特征对应的夏普利值的步骤,包括:
[0022]基于所述处理后的第一特征及其对应的权重,按照以下公式计算该第一特征对应的夏普利值:
[0023][0024]其中,为第i个第一特征的夏普利值,β
i
为第i个第一特征所对应的权重。
[0025]第二方面,本专利技术实施例提供了一种联邦学习中特征贡献度的确定装置,应用于联邦学习模型训练系统中的第一设备,所述系统还包括第二设备,所述装置包括:
[0026]获取模块,用于在所述联邦学习模型训练完成后,获取本地用于训练所述联邦学习模型的第一训练样本所包括的各个第一特征以及每个第一特征所对应的权重;
[0027]第一计算模块,用于基于所述每个第一特征及其对应的权重,计算该第一特征对应的夏普利值,作为该第一特征对应的贡献度;
[0028]第二计算模块,用于获取所述第二设备对应的第二训练样本所包括的各个第二特征对应的夏普利值,作为所述第二特征对应的贡献度;
[0029]确定模块,用于根据所述第一特征对应的贡献度以及所述第二特征对应的贡献度,确定每个特征对应的重要程度,其中,所述重要程度用于确定所述联邦学习模型的输入信息的组成。
[0030]可选的,所述第二计算模块包括:
[0031]第一计算单元,用于获取所述第二设备对应的用于训练所述联邦学习模型的第二训练样本所包括的各个第二特征以及每个第二特征所对应的权重,并基于所述每个第二特征及其对应的权重,计算该第二特征对应的夏普利值;或,
[0032]第二计算单元,用于接收所述第二设备发送的用于训练所述联邦学习模型的第二训练样本所包括的各个第二特征对应的夏普利值,其中,所述第二特征对应的夏普利值为所述第二设备基于所述每个第二特征值及其对应的权重计算得到的。
[0033]可选的,所述第一计算模块包括:
[0034]平均值计算单元,用于计算所述每个第一特征的平均值;
[0035]中心化计算单元,用于基于所述平均值,按照公式对所述每个第一特征进行去中心化处理,得到处理后的第一特征,其中,Z
i
为处理后的第i个第一特征,X
i
为第i个第一特征,为第i个第一特征对应的平均值;
[0036]夏普利值计算单元,用于基于所述处理后的第一特征及其对应的权重,计算该第一特征对应的夏普利值。
[0037]可选的,所述夏普利值计算单元包括:
[0038]夏普利值计算子单元,用于基于所述处理后的第一特征及其对应的权重,按照以下公式计算该第一特征对应的夏普利值:
[0039][0040]其中,为第i个第一特征的夏普利值,β
i
为第i个第一特征所对应的权重。
[0041]第三方面,本专利技术实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种联邦学习中特征贡献度的确定方法,其特征在于,应用于联邦学习模型训练系统中的第一设备,所述系统还包括第二设备,所述方法包括:在所述联邦学习模型训练完成后,获取本地用于训练所述联邦学习模型的第一训练样本所包括的各个第一特征以及每个第一特征所对应的权重;基于所述每个第一特征及其对应的权重,计算该第一特征对应的夏普利值,作为该第一特征对应的贡献度;获取所述第二设备对应的第二训练样本所包括的各个第二特征对应的夏普利值,作为所述第二特征对应的贡献度;根据所述第一特征对应的贡献度以及所述第二特征对应的贡献度,确定每个特征对应的重要程度,其中,所述重要程度用于确定所述联邦学习模型的输入信息的组成。2.根据权利要求1所述的方法,其特征在于,所述获取所述第二设备对应的第二训练样本所包括的各个第二特征对应的夏普利值的步骤,包括:获取所述第二设备对应的用于训练所述联邦学习模型的第二训练样本所包括的各个第二特征以及每个第二特征所对应的权重,并基于所述每个第二特征及其对应的权重,计算该第二特征对应的夏普利值;或,接收所述第二设备发送的用于训练所述联邦学习模型的第二训练样本所包括的各个第二特征对应的夏普利值,其中,所述第二特征对应的夏普利值为所述第二设备基于所述每个第二特征及其对应的权重计算得到的。3.根据权利要求1所述的方法,其特征在于,所述根据所述第一特征对应的贡献度以及所述第二特征对应的贡献度,确定每个特征对应的重要程度的步骤,包括:将所述第一特征对应的贡献度以及所述第二特征对应的贡献度进行排序,得到排序结果;基于所述排序结果确定每个特征对应的重要程度。4.根据权利要求1

3任一项所述的方法,其特征在于,所述基于所述每个第一特征及其对应的权重,计算该第一特征对应的夏普利值的步骤,包括:计算所述每个第一特征的平均值;基于所述平均值,按照公式对所述每个第一特征进行去中心化处理,得到处理后的第一特征,其中,Z
i
为处理后的第i个第一特征,X
i
为第i个第一特征,为第i个第一特征对应的平均值;基于所述处理后的第一特征及其对应的权重,计算该第一特征对应的夏普利值。5.根据权利要求4所述的方法,其特征在于,所述基于所述处理后的第一特征及其对应的权重,计算该第一特征对应的夏普利值的步骤,包括:基于所述处理后的第一特征及其对应的权重,按照以下公式计算该第一特征对应的夏普利值:其中,为第i个第一特征的夏普利值,β
i
为第i个第一特征所对应的权重。6.一种联邦学习...

【专利技术属性】
技术研发人员:赵迪王湾湾何浩姚明
申请(专利权)人:深圳市洞见智慧科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1