用于深度学习平台的任务调度方法、装置及电子设备制造方法及图纸

技术编号：36681101 阅读：21 留言：0更新日期：2023-02-27 19:38

本发明专利技术公开了一种用于深度学习平台的任务调度方法，从任务队列中获取耗时不低于设定耗时的目标待处理任务；从N个负载门中选取负载低于设定负载的一个负载门作为目标负载门，其中，所述N个负载门与所述深度学习平台包含的N个GPU一一对应，N为大于1的整数；将所述目标待处理任务分配给所述目标负载门对应的目标GPU进行处理。本发明专利技术公开的用于深度学习平台的任务调度方法、装置及电子设备，能够提高负载均衡的精确度，缩短任务完成的总耗时，提高处理效率。高处理效率。高处理效率。

全部详细技术资料下载

【技术实现步骤摘要】
用于深度学习平台的任务调度方法、装置及电子设备

[0001]本专利技术涉及深度学习
，特别涉及一种用于深度学习平台的任务调度方法、装置及电子设备。

技术介绍

[0002]现有的深度学习平台中，一个服务通常需要启用多个图形处理单元(Graphics Processing Unit，简称:GPU)进行计算，而每个计算任务要部署到一个GPU上进行特征计算，且每个GPU上部署多个线程，每个线程每次可以执行一个任务计算，如此，使得每个GPU可能需要同时执行多个任务的计算。
[0003]由于每个GPU可能需要同时执行多个任务计算的情况下，需要有一种任务调度策略来平衡所有GPU上的计算负载，避免出现个别GPU负载高，计算耗时长，而其他GPU负载低，计算耗时短的情况。现有技术一般为通过轮询访问GPU各线程，为空闲线程分配任务，但此时会出现耗时高的任务集中分配到某些GPU上，而耗时低的任务分配到其他GPU上，此时，会导致某些GPU负载高某些GPU负载低，使得现有技术存在负载均衡的精确度较低的问题。

技术实现思路

[0004]本专利技术实施例提供一种用于深度学习平台的任务调度方法、装置及电子设备，能够提高负载均衡的精确度，缩短任务完成的总耗时，提高处理效率。
[0005]本专利技术实施例第一方面提供一种用于深度学习平台的任务调度方法，所述方法包括：
[0006]从任务队列中获取耗时不低于设定耗时的目标待处理任务；
[0007]从N个负载门中选取负载低于设定负载的一个负载门作为目标负载...

【技术保护点】

【技术特征摘要】
1.一种用于深度学习平台的任务调度方法，其特征在于，所述方法包括：从任务队列中获取耗时不低于设定耗时的目标待处理任务；从N个负载门中选取负载低于设定负载的一个负载门作为目标负载门，其中，所述N个负载门与所述深度学习平台包含的N个GPU一一对应，N为大于1的整数；将所述目标待处理任务分配给所述目标负载门对应的目标GPU进行处理。2.如权利要求1所述的方法，其特征在于，在从任务队列中获取耗时不低于设定耗时的目标待处理任务之前，所述方法还包括：获取当前的所有待处理任务；将所述所有待处理任务进行耗时排序后放入所述任务队列中。3.如权利要求2所述的方法，其特征在于，所述获取当前的所有待处理任务，包括：响应当前接收的请求，获取所述请求对应的多个深度学习图的计算任务，将所述多个深度学习图的计算任务作为所述所有待处理任务。4.如权利要求2所述的方法，其特征在于，所述将所述所有待处理任务进行耗时排序后放入所述任务队列中，包括：获取所述所有待处理任务中每个待处理任务的预期耗时；根据每个待处理任务的预期耗时，依照预期耗时从大到小将所述所有待处理任务放入所述任务队列中。5.如权利要求4所述的方法，其特征在于，所述根据每个待处理任务的预期耗时，依照预期耗时从大到小将所述所有待处理任务放入所述任务队列中，包括：根据每个待处理任务的预期耗时，依照预期耗时从大到小对所述所有待处理任务进行排序；将排序后的所述所有待处理任务放入所述任务队列中。6.如权利要求1
‑
5任一项所述的方法，其特征在于，所述从N个负载门中选取负载低于设定负载的一个负载门作为目标负载门，包括：获取所述N个负载门中每个负载门对应的负载值，负载值是根据负载门的当前等待线程数量确定的；根据每个负载门对应的负载值，从所述N个负载门中选择负载低于所述设定负载的一个负载门作为所述目标负载门。7.如权利要求6所述的方法，其特征在于，所述从N个负载门中选取负载低于设定负载的一个负载门作为目标负载门，包括：从所述N个负载门中选取...

【专利技术属性】
技术研发人员：刘鹤，沈大赛，谢远江，
申请(专利权)人：北京搜狗科技发展有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人