【技术实现步骤摘要】
联邦学习方法、联邦学习装置、电子设备以及存储介质
[0001]本公开涉及人工智能
,尤其涉及分布式数据处理和深度学习
具体地,涉及一种联邦学习方法、联邦学习装置、电子设备以及存储介质。
技术介绍
[0002]联邦学习(Federated Learning,FL)是一种分布式机器学习技术。联邦学习能够在不公开每个设备的本地数据的情况下,利用多个设备和多个设备各自的本地数据进行模型的协作训练。
技术实现思路
[0003]本公开提供了一种联邦学习方法、联邦学习装置、电子设备以及存储介质。
[0004]根据本公开的一方面,提供了一种联邦学习方法,包括:在当前学习周期中,针对至少一个任务中的每个任务,基于调度策略,根据与上述任务对应的多个备选设备各自的调度信息,确定与上述任务对应的目标设备集合,其中,上述调度策略用于使得完成上述当前学习周期的上述任务的时间成本信息和设备公平性评估信息满足预定条件;向与上述每个任务对应的目标设备集合发送与上述每个任务对应的全局模型,以便利用上述对应的目标设备集合训练与上述每个任务对应的全局模型;以及,响应于接收到来自对应的目标设备集合的训练后模型,基于上述训练后模型更新对应的全局模型,完成上述当前学习周期。
[0005]根据本公开的另一方面,提供了一种联邦学习装置,包括:第一确定模块,用于在当前学习周期中,针对至少一个任务中的每个任务,基于调度策略,根据与上述任务对应的多个备选设备各自的调度信息,确定与上述任务对应的目标设备集合,其中,上述调度策略用 ...
【技术保护点】
【技术特征摘要】
1.一种联邦学习方法,包括:在当前学习周期中,针对至少一个任务中的每个任务,基于调度策略,根据与所述任务对应的多个备选设备各自的调度信息,确定与所述任务对应的目标设备集合,其中,所述调度策略用于使得完成所述当前学习周期的所述任务的时间成本信息和设备公平性评估信息满足预定条件;向与所述每个任务对应的目标设备集合发送与所述每个任务对应的全局模型,以便利用所述对应的目标设备集合训练与所述每个任务对应的全局模型;以及响应于接收到来自对应的目标设备集合的训练后模型,基于所述训练后模型更新对应的全局模型,完成所述当前学习周期。2.根据权利要求1所述的方法,还包括:针对与所述任务对应的多个备选设备中的每个备选设备,根据所述备选设备的资源信息,确定所述备选设备执行所述任务的时长信息;确定所述备选设备在所述当前学习周期之前的学习周期中执行所述任务的次数,作为调度次数;以及根据所述时长信息和所述调度次数,得到所述备选设备的调度信息。3.根据权利要求2所述的方法,其中,所述根据所述备选设备的资源信息,确定所述备选设备执行所述任务的时长信息,包括:根据所述备选设备的资源信息,确定所述备选设备的计算指标,其中,所述计算指标表征所述备选设备的计算能力;以及利用预定位移指数分布函数,根据所述计算指标和所述备选设备中存储的与所述任务对应的训练数据的数据量,确定所述备选设备执行所述任务的时长信息。4.根据权利要求2或3所述的方法,其中,与所述任务对应的时间成本信息是根据与所述任务对应的备选设备集合的时长信息和与全部或部分其他任务对应的目标设备集合的时长信息确定的,所述其他任务表征所述至少一个任务中除所述任务以外的任意一个任务;其中,与所述任务对应的设备公平性评估信息是根据与所述任务对应的备选设备集合的调度平衡方差和与全部或部分所述其他任务对应的目标设备集合的调度平衡方差确定的,所述调度平衡方差是根据设备集合包括的设备的调度次数确定的,所述设备集合包括所述备选设备集合或所述目标设备集合;其中,与所述任务对应的目标设备集合是在所述任务的时间成本信息和设备公平性评估信息满足预定条件的情况下的备选设备集合。5.根据权利要求4所述的方法,其中,所述基于调度策略,根据与所述任务对应的多个备选设备各自的调度信息,确定与所述任务对应的目标设备集合,包括:基于所述调度策略,确定调度约束函数,其中,所述调度约束函数的参数项包括在所述当前学习周期的情况下,与所述每个任务的时间成本信息对应的时间成本项和与所述每个任务的设备公平性评估信息对应的设备公平性评估项;以及利用调度算法,根据与所述任务对应的多个备选设备各自的调度信息,确定与所述任务对应的目标设备集合,其中,所述目标设备集合的调度信息使得所述调度约束函数的第一输出值满足所述预定条件。
6.根据权利要求5所述的方法,其中,所述调度算法包括至少一个第一调度算法、至少一个第二调度算法和第三调度算法;其中,所述利用调度算法,根据与所述任务对应的多个备选设备各自的调度信息,确定与所述任务对应的目标设备集合,包括:利用所述至少一个第一调度算法中的每个第一调度算法处理所述多个备选设备的调度信息,得到与所述任务对应的第一备选设备集合,其中,所述第一备选设备集合的调度信息使得调度约束函数的第二输出值满足所述预定条件且所述第二输出值大于所述第一输出值;利用所述至少一个第二调度算法中的每个第二调度算法处理所述多个备选设备的调度信息,得到与所述至少一个任务中的每个任务对应的第二备选设备集合;以及利用所述第三调度算法处理至少一个所述第一备选设备集合和至少一个所述第二备选设备集合的调度信息,得到与所述任务对应的目标设备集合。7.根据权利要求6所述的方法,其中,所述至少一个第一调度算法包括以下至少一项:贝叶斯优化算法、强化学习算法、遗传算法和贪心算法;其中,所述至少一个第二调度算法包括以下至少一项:联邦平均算法和基于联邦学习的启发式设备选择算法。8.根据权利要求1~4中任一项所述的方法,其中,所述针对至少一个任务中的每个任务,基于调度策略,根据与所述任务对应的多个备选设备各自的调度信息,确定与所述任务对应的目标设备集合,包括:并行执行以下操作,得到与所述每个任务对应的目标设备集合:基于所述调度策略,根据与所述每个任务对应的多个备选设备各自的调度信息,得到与所述每个任务对应的目标设备集合。9.一种联邦学习装置,包括:第一确定模块,用于在当前学习周期中,针对至少一个任务中的每个任务,基于调度策略,根据与所述任务对应的多个备选设备各自的调度信息,确定与所述任务对应的目标设备集合,其中,所述调度策略用于使得完成所述当前学...
【专利技术属性】
技术研发人员:刘吉,周晨娣,马北辰,周吉文,窦德景,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。