主机调度方法、装置以及及存储介质制造方法及图纸

技术编号:35847486 阅读:15 留言:0更新日期:2022-12-07 10:28
本发明专利技术公开了一种主机调度方法、装置以及存储介质,主机调度方法包括:在接收到调度任务时,根据所述调度任务获取待运行的目标服务;根据所述目标服务的类型、各个主机的空闲资源信息以及当前时间段的预测资源占用信息确定目标主机,所述预测资源占用信息根据历史资源占用信息得到,所述主机包括GPU主机和CPU主机;调度所述目标主机运行所述目标服务。本发明专利技术选择的目标主机考虑目标服务器以及主机的资源的可能占用情况,使得主机的资源能够合理的使用,避免资源的浪费或者资源不够的情况出现。出现。出现。

【技术实现步骤摘要】
主机调度方法、装置以及及存储介质


[0001]本专利技术涉及通信领域,尤其涉及一种主机调度方法、装置以及存储介质。

技术介绍

[0002]当前随着人工智能技术的不断进步,越来越多AI能力应用于现实生活中,特别是图像、视频、语音、自然语言相关能力。AI能力的产生和使用都离不开CPU(Central Processing Unit,中央处理器)和GPU(Graphics Processing Unit,视觉处理器),特别是GPU,GPU可以通过增加并行处理单元和存储器控制单元的方式提高处理能力和存储器带宽,所以在AI中应用非常广泛。由多核CPU和拥有大量核数的GPU组成的系统架构已经成为云计算中处理混合负载的强有力的平台,当前的AI模型训练和AI应用基本运行在CPU和GPU混合的容器云平台;而云平台上的服务可能需要CPU主机或者GPU主机实现,但现有在调用CPU主机和GPU主机时,一般按照服务类型实现,CPU服务调用CPU主机而GPU服务调用GPU主机,并不考虑各个主机的资源占用情况,可能存在资源浪费或者资源不够的情况出现,即主机调度的时候资源分配不合理。

技术实现思路

[0003]本专利技术的主要目的在于提供一种主机调度方法、装置以及存储介质,旨在解决CPU主机和GPU机调度的时候资源分配不合理的技术问题。
[0004]为实现上述目的,本专利技术提供一种主机调度方法,所述主机调度方法包括:
[0005]在接收到调度任务时,根据所述调度任务获取待运行的目标服务;
[0006]根据所述目标服务的类型、各个主机的空闲资源信息以及当前时间段的预测资源占用信息确定目标主机,所述预测资源占用信息根据历史资源占用信息得到,所述主机包括GPU主机和CPU主机;
[0007]调度所述目标主机运行所述目标服务。
[0008]可选地,所述根据所述目标服务的类型、各个主机的空闲资源信息以及当前时间段的预测资源占用信息确定目标主机的步骤包括:
[0009]确定所述目标服务是否为执行过的服务;
[0010]在所述目标服务为执行过的服务,根据所述各个主机的空闲资源信息、当前时间段各个主机的预测资源占用信息、当前时间段所述目标服务的预测资源占用信息以及所述目标服务的类型确定目标主机,其中,所述当前时间段的预测资源占用信息包括当前时间段各个主机的预测资源占用信息以及当前时间段所述目标服务的预测资源占用信息。
[0011]可选地,所述根据所述各个主机的空闲资源信息、当前时间段各个主机的预测资源占用信息、当前时间段所述目标服务的预测资源占用信息以及所述目标服务的类型确定目标主机的步骤包括:
[0012]在所述目标服务的类型为GPU服务时,获取各个GPU主机的CPU空闲资源信息以及GPU的空闲资源信息;
[0013]在所述GPU主机中选取所述空闲资源信息满足第一预设条件的空闲GPU主机;
[0014]根据当前时间段各个空闲GPU主机的预测资源占用信息以及当前时间段所述目标服务的预测资源占用信息,确定各个所述空闲GPU主机运行所述目标服务后的所述GPU以及所述CPU的总资源占用信息;
[0015]根据各个所述空闲GPU主机的所述总资源占用信息确定所述目标主机。
[0016]可选地,所述根据所述各个主机的空闲资源信息、当前时间段各个主机的预测资源占用信息、当前时间段所述目标服务的预测资源占用信息以及所述目标服务的类型确定目标主机的步骤包括:
[0017]在所述目标服务的类型为CPU服务时,获取CPU主机的空闲资源信息;
[0018]在有CPU主机的所述空闲资源信息均满足第二预设条件时,根据满足第二预设条件CPU主机预测资源占用信息以及当前时间段所述目标服务的预测资源占用信息确定所述目标主机;
[0019]在CPU主机的所述空闲资源信息均不满足第二预设条件时,获取GPU主机的空闲资源信息;
[0020]在所述GPU主机中选取所述空闲资源信息满足第一预设条件的空闲GPU主机;
[0021]根据当前时间段各个空闲GPU主机的预测资源占用信息以及当前时间段所述目标服务的预测资源占用信息,确定各个所述空闲GPU主机运行所述目标服务后的所述GPU以及所述CPU的总资源占用信息;
[0022]根据各个所述空闲GPU主机的所述总资源占用信息确定所述目标主机。
[0023]可选地,所述确定所述目标服务是否为执行过的服务的步骤之后,还包括:
[0024]在所述目标服务为未执行过的服务,根据所述各个主机的空闲资源信息、当前时间段各个主机的预测资源占用信息以及所述目标服务的类型确定目标主机,所述当前时间段的预测资源占用信息包括当前时间段各个主机的预测资源占用信息。
[0025]可选地,所述根据所述各个主机的空闲资源信息、当前时间段各个主机的预测资源占用信息以及所述目标服务的类型确定目标主机的步骤包括:
[0026]在所述目标服务的类型为GPU服务时,获取各个GPU主机的空闲资源信息;
[0027]获取空闲资源信息满足第一预设条件的空闲GPU主机;
[0028]将预测资源占用信息最少的所述空闲GPU主机作为所述目标主机。
[0029]可选地,所述根据所述各个主机的空闲资源信息、当前时间段各个主机的预测资源占用信息以及所述目标服务的类型确定目标主机的步骤包括:
[0030]在所述目标服务的类型为CPU服务时,获取CPU主机的空闲资源信息;
[0031]在有CPU主机的空闲资源信息均不满足所述第二预设条件时,将满足第二预设条件的CPU主机中预测资源占用信息最少的CPU主机作为所述目标主机;
[0032]在所述CPU主机的空闲资源信息均不满足所述第二预设条件时,获取GPU主机的空闲资源信息;
[0033]获取空闲资源信息满足第一预设条件的空闲GPU主机,并将预测资源占用信息最少的所述空闲GPU主机作为所述目标主机。
[0034]此外,为实现上述目的,本专利技术还提出一种主机调度装置,所述主机调度装置包括:
[0035]获取模块,在接收到调度任务时,根据所述调度任务获取待运行的目标服务;
[0036]确定模块,根据所述目标服务的类型、各个主机的空闲资源信息以及当前时间段的预测资源占用信息确定目标主机,所述预测资源占用信息根据历史资源占用信息得到;
[0037]调度模块,调度所述目标主机运行所述目标服务。
[0038]此外,为实现上述目的,本专利技术还提出一种主机调度装置,所述主机调度装置包括存储器以及处理器,所述存储器用于存储主机调度程序,所述存储器中的主机调度程序被所述处理器执行时实现如以上任一项所述的主机调度方法。
[0039]此外,为实现上述目的,本专利技术还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有主机调度程序,所述主机调度程序被处理器执行时实现如以上任一项所述的主机调度方法的步骤。
[0040]本专利技术提出的主机调度方法本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种主机调度方法,其特征在于,所述主机调度方法包括:在接收到调度任务时,根据所述调度任务获取待运行的目标服务;根据所述目标服务的类型、各个主机的空闲资源信息以及当前时间段的预测资源占用信息确定目标主机,所述预测资源占用信息根据历史资源占用信息得到,所述主机包括GPU主机和CPU主机;调度所述目标主机运行所述目标服务。2.如权利要求1所述的主机调度方法,其特征在于,所述根据所述目标服务的类型、各个主机的空闲资源信息以及当前时间段的预测资源占用信息确定目标主机的步骤包括:确定所述目标服务是否为执行过的服务;在所述目标服务为执行过的服务,根据所述各个主机的空闲资源信息、当前时间段各个主机的预测资源占用信息、当前时间段所述目标服务的预测资源占用信息以及所述目标服务的类型确定目标主机,其中,所述当前时间段的预测资源占用信息包括当前时间段各个主机的预测资源占用信息以及当前时间段所述目标服务的预测资源占用信息。3.如权利要求2所述的主机调度方法,其特征在于,所述根据所述各个主机的空闲资源信息、当前时间段各个主机的预测资源占用信息、当前时间段所述目标服务的预测资源占用信息以及所述目标服务的类型确定目标主机的步骤包括:在所述目标服务的类型为GPU服务时,获取各个GPU主机的CPU空闲资源信息以及GPU的空闲资源信息;在所述GPU主机中选取所述空闲资源信息满足第一预设条件的空闲GPU主机;根据当前时间段各个空闲GPU主机的预测资源占用信息以及当前时间段所述目标服务的预测资源占用信息,确定各个所述空闲GPU主机运行所述目标服务后的所述GPU以及所述CPU的总资源占用信息;根据各个所述空闲GPU主机的所述总资源占用信息确定所述目标主机。4.如权利要求2所述的主机调度方法,其特征在于,所述根据所述各个主机的空闲资源信息、当前时间段各个主机的预测资源占用信息、当前时间段所述目标服务的预测资源占用信息以及所述目标服务的类型确定目标主机的步骤包括:在所述目标服务的类型为CPU服务时,获取CPU主机的空闲资源信息;在有CPU主机的所述空闲资源信息均满足第二预设条件时,根据满足第二预设条件CPU主机预测资源占用信息以及当前时间段所述目标服务的预测资源占用信息确定所述目标主机;在CPU主机的所述空闲资源信息均不满足第二预设条件时,获取GPU主机的空闲资源信息;在所述GPU主机中选取所述空闲资源信息满足第一预设条件的空闲GPU主机;根据当前时间段各个空闲GPU主机的预测资源占用信息以及当前时间段所述目标服务的预测资源占用信...

【专利技术属性】
技术研发人员:应剑捷李海传郑海朋陈远峥范胡磊
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1