多任务调度方法、装置、设备以及存储介质制造方法及图纸

技术编号：32791236 阅读：8 留言：0更新日期：2022-03-23 19:52

本公开提供了一种多任务调度方法、装置、设备以及存储介质，涉及人工智能领域中的分布式计算技术。该方法包括：初始化候选调度方案列表，其中，候选调度方案用于为多个机器学习任务中的每个机器学习任务分配用于训练的终端设备；对于候选调度方案列表中的每个候选调度方案，对候选调度方案进行扰动，生成新的调度方案；基于候选调度方案的适应值以及新的调度方案的适应值，确定是否以新的调度方案替换候选调度方案，生成新的调度方案列表；基于新的调度方案列表中的每个新的调度方案的适应值，确定目标调度方案。本公开提供的多任务调度方法提高了服务调度的效率，也提高了多任务联邦学习的训练效率。联邦学习的训练效率。联邦学习的训练效率。

全部详细技术资料下载

【技术实现步骤摘要】
多任务调度方法、装置、设备以及存储介质

[0001]本公开涉及人工智能
中的分布式计算技术，尤其涉及多任务调度方法、装置、设备以及存储介质。

技术介绍

[0002]联邦学习是一种新的分布式机器学习技术，利用分布式的数据和计算资源在多个分布式边缘设备或服务器之间协作训练，并保护客户端的数据隐私。不同于传统的机器学习算法，联邦学习不需要共享设备的本地原始数据，能够有效地保证用户的隐私与安全。联邦学习只需要将待训练的全局模型分发给边缘设备，不同的设备从服务器下载模型并用本地数据训练模型，之后设备将更新的模型参数上传给服务器，最后服务器将聚合各个设备返回的模型参数并更新得到新的全局模型，如此迭代则可有效避免数据共享而导致的隐私的泄露。
[0003]虽然联邦学习中客户端不需要共享自己的本地数据，但由于不同设备的计算资源和能力有限，整个任务的训练效率会变得低下。

技术实现思路

[0004]本公开提供了一种多任务调度方法、装置、设备以及存储介质。
[0005]根据本公开的第一方面，提供了一种多任务调度方法，包括：初始化候选调度方案列表，其中，候选调度方案用于为多个机器学习任务中的每个机器学习任务分配用于训练的终端设备；对于候选调度方案列表中的每个候选调度方案，对候选调度方案进行扰动，生成新的调度方案；基于候选调度方案的适应值以及新的调度方案的适应值，确定是否以新的调度方案替换候选调度方案，生成新的调度方案列表；基于新的调度方案列表中的每个新的调度方案的适应值，确定目标调度方案。
[00...

【技术保护点】

【技术特征摘要】
1.一种多任务调度方法，包括：初始化候选调度方案列表，其中，所述候选调度方案用于为多个机器学习任务中的每个机器学习任务分配用于训练的终端设备；对于所述候选调度方案列表中的每个候选调度方案，对所述候选调度方案进行扰动，生成新的调度方案；基于所述候选调度方案的适应值以及所述新的调度方案的适应值，确定是否以所述新的调度方案替换所述候选调度方案，生成新的调度方案列表；基于所述新的调度方案列表中的每个新的调度方案的适应值，确定目标调度方案。2.根据权利要求1所述的方法，其中，所述候选调度方案基于以下步骤生成：对于所述多个机器学习任务中的每个机器学习任务，获取用于训练的多个终端设备中的各个终端设备的资源状态；根据所述各个终端设备的资源状态，确定训练各个机器学习任务所需要的时间；根据所述训练各个机器学习任务所需要的时间，从所述多个终端设备中确定至少两个目标终端设备，生成该机器学习任务对应的候选调度方案。3.根据权利要求1所述的方法，其中，所述对所述候选调度方案进行扰动，生成新的调度方案，包括：随机将所述候选调度方案中的任一终端设备替换为不违反设备约束的新终端设备，生成新的调度方案。4.根据权利要求1所述的方法，其中，所述基于所述候选调度方案的适应值以及所述新的调度方案的适应值，确定是否以所述新的调度方案替换所述候选调度方案，生成新的调度方案列表，包括：将所述候选调度方案的适应值与所述新的调度方案的适应值进行比较；基于比较结果确定是否以所述新的调度方案替换所述候选调度方案，并生成新的调度方案列表。5.根据权利要求4所述的方法，其中，所述基于比较结果确定是否以所述新的调度方案替换所述候选调度方案，并生成新的调度方案列表，包括：响应于确定所述新的调度方案的适应值大于所述候选调度方案的适应值，以所述新的调度方案替换所述候选调度方案，生成新的调度方案列表。6.根据权利要求4所述的方法，其中，所述基于比较结果确定是否以所述新的调度方案替换所述候选调度方案，并生成的新的调度方案列表，还包括：响应于确定所述新的调度方案的适应值不大于所述候选调度方案的适应值，基于模拟退火算法计算所述新的调度方案被接受的概率值；响应于确定所述概率值满足预设条件，以所述新的调度方案替换所述候选调度方案，生成新的调度方案列表。7.根据权利要求6所述的方法，其中，所述基于模拟退火算法计算所述新的调度方案被接受的概率值，包括：基于所述候选调度方案的适应值、所述新的调度方案的适应值以及当前温度值，计算所述新的调度方案被接受的概率值。8.根据权利要求1
‑
7中任一项所述的方法，其中，所述适应值是基于调度方案中的每台终端设备的通信时间以及计算时间计算得到的。
9.根据权利要求1
‑
8中任一项所述的方法，其中，所述基于所述新的调度方案列表中的每个新的调度方案的适应值，确定目标调度方案，包括：将所述新的调度方案列表中适应值最大的新的调度方案，确定为目标调度方案。10.一种多任务调度装置，包括：初始化模块，被配置成初始化候选调度方案列表，其中，所述候选调度方案用于为多个机器学习任务中的每个机器学习任务分配用于训练的终端设备；替换模块，被配置成对于所述候选调度方案列表中的每个候选调度方案，对所述候选调度方案进行扰动，生成新的调...

【专利技术属性】
技术研发人员：刘吉，马北辰，周景博，周瑞璞，窦德景，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人