【技术实现步骤摘要】
一种基于联邦学习的模型训练方法及联邦学习系统
[0001]本专利技术涉及大数据计算领域,具体涉及一种基于联邦学习的模型训练方法及联邦学习系统。
技术介绍
[0002]联邦学习(Federal Learning,FL)可在数据不共享的状况下完成联合建模。在联邦学习中,机器学习任务是由参与设备(也称之为客户端,或简称为客户)的松散联合体解决的,中央服务器对这些设备进行协调。其最重要的特性就是去除了传统的集中式机器学习的收集和存储数据的过程,降低机器学习带来的许多系统性隐私风险。联邦学习可以实现保证本地训练数据不公开的前提下,多个数据拥有者协同训练一个共享的机器学习的模型。它们只需迭代地将训练的本地模型更新发送到任务发布者,而无需将原始数据上传到外部,从而将机器学习的过程与在中央服务器中获取、存储和训练数据分离。
[0003]尽管联邦学习可以支持协作学习的同时保护数据隐私,但是所有客户不会无条件地贡献其资源,一方面拥有的数据本身具有价值性;另一方面,参与训练需要消耗自己设备的电量。因此,构建一种合适的奖励机制能够鼓励客户参与到学习中来具有重要意义。
[0004]为了使联邦学习可以长期有效地进行,很多应用也采用了不同的方法进行激励。针对客户自身方案,可以自行选择服务器提供的合同,或者主动报告自己的出价。中央服务器根据客户的方案,依据自己的目标制定客户的选择和奖励方案,从而在一定程度上解决联邦学习中的激励问题。
[0005]一般针对联邦学习中的激励方法主要集中在考虑所需的资源量、本地精度、信道冲突和相应
【技术保护点】
【技术特征摘要】
1.一种基于联邦学习的模型训练方法,其特征在于,包括以下步骤:S1、客户i基于中央服务器发布的联邦学习的训练任务,收集自己可供本次联邦学习训练的本地数据量d
i
和单位数据成本c
i
,组成投标b
i
={d
i
,c
i
}并提交给中央服务器;S2、中央服务器设立参数提交的截止时间T,根据收到的投标建立期望社会福利最大化表达式;S3、中央服务器针对每轮训练设置预算B,根据动态规划求出每个预算B下的最优解,包括选中的客户和被选中客户的最优训练数据量,再根据每个预算B下的最优解计算期望社会福利最大化的最优值;S4、中央服务器向选中的客户下发最优训练数据量和最大社会福利;S5、客户根据下发的方案利用本地数据进行训练,训练完成后向中央服务器上报更新参数;S6、每轮训练结束时,中央服务器利用VCG机制对成功上传更新参数的客户进行奖励。2.根据权利要求1所述的基于联邦学习的模型训练方法,其特征在于,所述步骤S1包括:S1
‑
1、客户i评估自己目前空闲的数据状态,统计自己可供本次联邦学习训练的本地数据量d
i
;S1
‑
2、客户i综合自己本地训练数据的收集成本、计算成本、通信成本给出自己可供本次训练的数据集的单位数据成本c
i
;S1
‑
3、客户i将自己可参与训练的最大数据量和单位数据成本组成投标b
i
={d
i
,c
i
},发送给中央服务器。3.根据权利要求1所述的基于联邦学习的模型训练方法,其特征在于,所述步骤S2包括:S2
‑
1、中央服务器根据自己训练的要求设定截止时间T,根据过往经验获取客户开始训练时间和单个数据计算时间,客户使用m个数据完成本地模型训练并且将参数上传给中央服务器,这个过程所需的时间被表示为:T
i
(m)=X
i
+τ
i
m,其中X
i
为服从参数为μ
i
的指数分布,τ
i
为正常数,用来表示客户单个数据的计算时间,为客户集合;S2
‑
2、整个训练的回报是一个关于训练总数据量的递增凹函数,训练总数据量为单个客户被选择的数据量与一个0
‑
1变量I
i
(x
i
)的积再求和,I
i
(x
i
)用来表示客户在该轮训练中是否能在规定的截止时间T内将结果返回给中央服务器,若返回则为1,反之则为0,中央服务器的效用等于服务器得到的回报减去给客户的奖励之和;S2
‑
3、各个客户的效用函数是收到的奖励减去付出的成本,期望的社会福利为中央服务器与各个客户的效用函数之和;S2
‑
4、根据期望的线性将回报函数近似为客户返回结果的概率与训练数据量的积再求和,客户返回结果的概率是关于客户训练时间的指数函数,由此得到期望社会福利最大化表达式,如下:s.t.x
i
≤d
i
式中,g(
·
)表示奖励函数,x
i
表示客户i的数据量。4.根据权利要求1所述的基于联邦学习的模型训练方法,其特征在于,所述步骤S3包括:S3
‑
1、中央服务器引入变量预算B,代表一轮训练中客户的总训练成本,它的范围是从0到所有客户使用全部数据量参加训练时的总成本;S3
‑
2、运用动态规划方法,输入为各客户所报告的投标b
i
={d
i
,c
i
},当被替代为1,2,
…
,i,B被替代为b的条件下,定义f(i,b)为最优解,对每一个i和b求出最优解f(i,b):首先求出f(i
‑
1,b
‑
c
i
x
i
)的值,它代表考虑(i
‑
1)个客户、预算为(b
‑
c
i
x
i
)时所求出的最优解,考虑所有在预算b下的情况:依次考虑第i个客户被选择的数据量为时的函数值,选择能使结果最大的x
i
作为f(i,b)的结果,构建出动态规划矩阵f[n,B];S3
‑
3、计算所有预算b的情况下,将f(n,b)
0≤b≤B
带入期望社会福利最大化表达式的结果,比较得出最大值和该值下b的取值。5.根据权利要求4所述的基于联邦学习的模型训练方法,其特征在于,所述步骤S4包括:S4
‑
1、伴随着f[n,B]的构建记录了从f(i
‑
1,b
‑
c
i
x
i
)到f(i,b)选择的x
i
,构建出路径矩阵path(i,b);S4
‑
2、在求...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。