一种云计算环境中GPU资源调度的方法、系统及存储介质技术方案

技术编号：24755640 阅读：114 留言：0更新日期：2020-07-04 09:03

本发明专利技术涉及一种云计算环境中GPU资源调度的方法、系统及存储介质，包括以下步骤：S1：对可用资源进行打分的步骤，以显存利用率，GPU利用率，GPU功耗三项作为变量对可用资源进行打分；S2：单个GPU设备任务的调度步骤，对资源进行计算打分，当存在空闲GPU设备时最高被优先分配，否则的话找到满足显存要求的可用性最高的GPU设备进行分配，如果能够使用则进行资源分配，如果资源不足则挂起等待调度；S3：多个GPU设备任务的调度步骤，结合设备分数排序，选择分数高且分数差值最小的相应数量GPU进行分配，同时确认多块显卡的显存资源充足，如果能够使用则进行资源分配，如果资源不足则挂起等待调度。

A method, system and storage medium for GPU resource scheduling in cloud computing environment

全部详细技术资料下载

【技术实现步骤摘要】
一种云计算环境中GPU资源调度的方法、系统及存储介质
本专利技术云计算
，具体涉及一种云计算环境中GPU资源调度的方法、系统及存储介质。
技术介绍
云计算Iass层通过网络连接，对不同类别异构的物理资源进行统一管理。虚拟化技术实现了高效利用物理资源的利用率，从云计算提供的服务商来说调度策略需要平衡整个集群的资源利用率，负载均衡，成本等。但是现有技术中关于GPU资源的调度在平衡集群资源利用率以及负载、成本方面表现欠缺。此为现有技术中存在的缺陷和不足。有鉴于此，本专利技术提供一种云计算环境中GPU资源调度的方法、系统及存储介质；以解决现有技术中存在的上述缺陷，是非常有必要的。
技术实现思路
针对现有技术的上述不足，本专利技术提供一种云计算环境中GPU资源调度的方法、系统及存储介质，以解决上述技术问题。为实现上述目的，本专利技术给出以下技术方案：第一方面，本专利技术提供一种云计算环境中GPU资源调度的方法，包括以下步骤：S1：对可用资源进行打分的步骤，具体包括：r>以显存利用率，G本文档来自技高网...

【技术保护点】
1.一种云计算环境中GPU资源调度的方法，其特征在于，包括以下步骤：/nS1：对可用资源进行打分的步骤，具体包括：/n以显存利用率，GPU利用率，GPU功耗三项作为变量对可用资源进行打分；给出如下定义：/n显存利用率计分算法：S

【技术特征摘要】
1.一种云计算环境中GPU资源调度的方法，其特征在于，包括以下步骤：
S1：对可用资源进行打分的步骤，具体包括：
以显存利用率，GPU利用率，GPU功耗三项作为变量对可用资源进行打分；给出如下定义：
显存利用率计分算法：Sm＝(TM-UM)*VM/TM
GPU利用率计分算法：Su＝(1-Ugpu)*10
设备功耗状况计分算法：Sp＝(TP-UP)*VP/TP
其中，TM表示显存总量，UM已用显存量；Ugpu表示显卡利用率；TP、UP分别表示最大功率、已用功率；VM、VP分别表示相关影响因子的阈值；
得出GPU使用状况的调度打分算法为：SG_i＝xSm+ySU+zSP；
S2：单个GPU设备任务的调度步骤，具体包括：
采用算法公式SG_i＝xSm+ySU+zSP调度，对资源进行计算打分，当存在空闲GPU设备时最高被优先分配，否则的话找到满足显存要求的可用性最高的GPU设备进行分配，如果能够使用则进行资源分配，如果资源不足则挂起等待调度；
S3：多个GPU设备任务的调度步骤，具体包括：
结合设备分数排序，选择分数高且分数差值最小的相应数量GPU进行分配，同时确认多块显卡的显存资源充足，如果能够使用则进行资源分配，如果资源不足则挂起等待调度。

2.根据权利要求1所述的一种云计算环境中GPU资源调度的方法，其特征在于，所述的调度的方法还包括以下步骤：
S4：当出现多个任务的资源需求无法满足的时候，根据对任务执行所需时间的估测；选择步骤S1或者S2或者S3执行具体操作。

3.根据权利要求1或2所述的一种云计算环境中GPU资源调度的方法，其特征在于，所述步骤S1中，设备达到最大功耗时，不再参与分配。

4.一种云计算环境中GPU资源调度系统，其特征在于...

【专利技术属性】
技术研发人员：张新玲，
申请(专利权)人：苏州浪潮智能科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人