【技术实现步骤摘要】
深度学习作业的运行方法及装置
本专利技术涉及计算机
,特别涉及一种深度学习作业的运行方法及装置。
技术介绍
随着计算机技术发展的越来越快,Kubernetes应用的越来越多,Kubernetes是一个用于容器集群的自动化部署、扩容以及运维的开源平台,可以缩写为K8s;Kube-bath是K8s的批处理调度程序,为希望运行的K8s的批处理作业的应用程序提供机制;kubeflow是一个胶水项目,它把诸多对机器学习的支持,比如模型训练,超参数训练,模型部署等进行组合并已容器化的方式进行部署,提供整个流程各个系统的高可用及方便的进行扩展部署了kubeflow的用户就可以利用它进行不同的机器学习深度学习作业。不同类型的深度学习作业被称为operator,例如tensorflow的就叫做tf-operator。目前,在Kube-bath进行调度的时候会有深度学习作业(job)的优先级选项,而在Kubeflow中包含多种operator,且每种job都会有优先级的设定,但一直也没有一个统一的标准,并且也没有完全实现,导致在后 ...
【技术保护点】
1.一种深度学习作业的运行方法,其特征在于,包括:/n获取待处理深度学习作业的信息;其中,所述待处理深度学习作业的信息包括所述待处理深度学习作业的类型;/n根据所述待处理深度学习作业的类型,在所述预设的运行策略中匹配得到所述待处理深度学习作业的类型所对应的调度策略;其中,所述调度策略包括深度学习作业的运行优先级;/n根据所述深度学习作业的运行优先级,运行所述待处理深度学习作业。/n
【技术特征摘要】
1.一种深度学习作业的运行方法,其特征在于,包括:
获取待处理深度学习作业的信息;其中,所述待处理深度学习作业的信息包括所述待处理深度学习作业的类型;
根据所述待处理深度学习作业的类型,在所述预设的运行策略中匹配得到所述待处理深度学习作业的类型所对应的调度策略;其中,所述调度策略包括深度学习作业的运行优先级;
根据所述深度学习作业的运行优先级,运行所述待处理深度学习作业。
2.根据权利要求1所述的方法,其特征在于,所述根据所述深度学习作业的运行优先级,运行所述待处理深度学习作业,包括:
判断所述待处理深度学习作业的运行优先级是否大于正在运行的深度学习作业的运行优先级;
若判断出所述待处理深度学习作业的运行优先级大于或等于所述正在运行的深度学习作业的运行优先级,则暂停所述正在运行的深度学习作业,运行所述待处理深度学习作业;
若判断出所述待处理深度学习作业的运行优先级小于所述正在运行的深度学习作业的运行优先级,则继续运行所述正在运行的深度学习作业,将所述待处理深度学习作业放入运行队列中。
3.根据权利要求2所述的方法,其特征在于,所述将所述待处理深度学习作业放入运行队列中之后,还包括:
将所述运行队列中的每一个深度学习作业和所述待处理深度学习作业按照运行优先级的大小进行排序。
4.根据权利要求1所述的方法,其特征在于,还包括:
每隔预设的时间更新所述运行策略中的深度学习作业的信息以及每一个深度学习作业的类型所对应的调度策略。
5.一种深度...
【专利技术属性】
技术研发人员:李铭琨,
申请(专利权)人:苏州浪潮智能科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。