【技术实现步骤摘要】
异步联邦学习方法、装置、系统及存储介质
[0001]本公开涉及计算机
,尤其涉及大数据和机器学习等人工智能
技术介绍
[0002]联邦学习(Federated Learning,FL)作为一种新兴的机器学习范式,可以在不上传原始数据的情况下,在多个分布式设备上进行训练,服务端负责模型的聚合,在有效地利用了分散的数据与算力的同时,尽可能地保护了用户的数据安全。
[0003]异步FL使服务器无需等待落后设备就可以聚合上传的局部模型,从而提高了效率。但是,这种机制可能会遇到过时的上传模型和非独立同分布(Independent and identically distributed,Non
‑
IID)数据带来的低准确率问题。例如,当设备上传基于旧全局模型更新的模型时,全局模型已经更新了多次。然后,上传模型的简单聚合可能会将全局模型拖到之前的状态,导致服务器聚合得到的全局模型的准确性较差。
技术实现思路
[0004]本公开提供了一种异步联邦学习的方法、装置、系统以及存储介质。
[0005]根据本公开的第一方面,提供了一种异步联邦学习的方法,应用于服务器端,包括:
[0006]响应于接收到第i个设备发送的第j个局部模型,获取第j个局部模型的版本与服务器本地第g个全局模型的版本;该第g个全局模型是接到第j个局部模型时服务器本地最新版本的全局模型,i为不小于1的整数,j为不小于1的整数,g为不小于1的整数;
[0007]基于第j个局部模型的版本与第g个 ...
【技术保护点】
【技术特征摘要】
1.一种异步联邦学习方法,应用于服务器端,包括:响应于接收到第i个设备发送的第j个局部模型,获取所述第j个局部模型的版本与服务器本地第g个全局模型的版本;所述第g个全局模型是接到所述第j个局部模型时服务器本地最新版本的全局模型,i为不小于1的整数,j为不小于1的整数,g为不小于1的整数;基于所述第j个局部模型的版本与所述第g个全局模型的版本,确定所述第j个局部模型与所述第g个全局模型的版本差异值;在所述版本差异值满足预设条件的情况下,确定所述第j个局部模型与所述第g个全局模型各自对应的权重;基于所述第j个局部模型与所述第g个全局模型各自对应的权重,将所述第j个局部模型与所述第g个全局模型进行聚合,得到第g+1个全局模型。2.根据权利要求1所述的方法,其中,所述在所述版本差异值满足预设条件的情况下,确定所述第j个局部模型与所述第g个全局模型各自对应的权重,包括:响应于检测到所述版本差异值未达到预设阈值,确定所述第j个局部模型与所述第g个全局模型各自对应的权重。3.根据权利要求1所述的方法,还包括:获取第g+1轮的聚合控制参数;所述基于所述第j个局部模型与所述第g个全局模型各自对应的权重,将所述第j个局部模型与所述第g个全局模型进行聚合,得到第g+1个全局模型,包括:基于所述第j个局部模型与所述第g个全局模型各自对应的权重,以及所述第g+1轮的聚合控制参数,将所述第j个局部模型与所述第g个全局模型进行聚合,得到第g+1个全局模型。4.根据权利要求1所述的方法,还包括:在所述版本差异值不满足所述预设条件的情况下,舍弃所述第j个局部模型。5.根据权利要求1所述的方法,还包括:接收所述第i个设备发送的更新全局模型请求,所述更新全局模型请求是在生成所述第j个局部模型之前发送的;基于所述更新全局模型请求向所述第i个设备发送第k个全局模型,所述第k个全局模型为接收到所述更新全局模型请求时所述服务器本地最新版本的全局模型,k为不大于g的正整数。6.一种异步联邦学习方法,应用于设备端,包括:向服务器发送第j个局部模型,所述第j个局部模型为第i个设备在第j轮本地训练结束后得到的局部模型,j为不小于1的整数,i为不小于1的整数;接收所述服务器发送的第g+1个全局模型,所述第g+1个全局模型是在所述第j个局部模型与第g个全局模型的版本差异值满足预设条件的情况下,所述服务器基于所述第j个局部模型与所述第g个全局模型进行聚合得到的全局模型,所述第g个全局模型为接到所述第j个局部模型时服务器本地最新版本的全局模型,g为不小于1的整数。7.根据权利要求6所述的方法,还包括:在向所述服务器发送所述第j个局部模型之前,向所述服务器发送更新全局模型请求;接收所述服务器基于所述更新全局模型请求返回的第k个全局模型,所述第k个全局模
型为接收到所述更新全局模型请求时所述服务器本地最新版本的全局模型,k为不大于g的正整数;基于本地数据集对所述第k个全局模型进行训练,得到所述第j个局部模型。8.根据权利要求7所述的方法,其中,所述基于本地数据集对所述第k个全局模型进行训练,得到所述第j个局部模型,包括:将本地的目标局部模型与所述第k个全局模型进行聚合,得到目标全局模型,其中,所述目标局部模型是在第j轮训练过程中得到的局部模型;利用所述本地数据集对所述目标全局模型进行训练,得到所述第j个局部模型。9.根据权利要求8所述的方法,其中,所述基于本地数据集对所述第k个全局模型进行训练,得到所述第j个局部模型,还包括:利用所述本地数据集,对在所述第j轮训练开始前所述第i个设备的本地最新全局模型进行训练,得到所述目标局部模型。10.一种异步联邦学习方法,应用于异步联邦学习系统,包括:第i个设备向服务器发送训练好的第j个局部模型,i为不小于1的整数,j为不小于1的整数;服务器响应于接收到第i个设备发送的第j个局部模型,获取所述第j个局部模型的版本与服务器本地第g个全局模型的版本;所述第g个全局模型为接到所述第j个局部模型时服务器本地最新版本的全局模型,g为不小于1的整数;基于所述第j个局部模型的版本与所述第g个全局模型的版本,确定所述第j个局部模型与所述第g个全局模型的版本差异值;在所述版本差异值满足预设条件的情况下,确定所述第j个局部模型与所述第g个全局模型各自对应的权重;基于所述第j个局部模型与所述第g个全局模型各自对应的权重,将所述第j个局部模型与所述第g个全局模型进行聚合,得到第g+1个全局模型。11.一种异步联邦学习装置,应用于服务器端,包括:第一获取模块,用于响应于接收到第i个设备发送的第j个局部模型,获取所述第j个局部模型的版本与服务器本地第g个全局模型的版本;所述第g个全局模型是接到所述第j个局部模型时服务器本地最新版本的全局模型,i为不小于1的整数,j为不小于1的整数,g为不小于1的整数;第一确定模块...
【专利技术属性】
技术研发人员:刘吉,霍超,窦德景,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。