图形处理器资源管理方法及装置、电子设备和存储介质制造方法及图纸

技术编号:37250154 阅读:9 留言:0更新日期:2023-04-20 23:28
本公开涉及一种图形处理器资源管理方法及装置、电子设备和存储介质,所述方法包括:根据预设的初始状态的配置文件,对工作节点上的图形处理器资源进行初始化配置;所述初始化配置用于使工作节点对应至少一种类型的图形处理器资源,每种类型的图形处理器资源包括至少一个图形处理器;获取工作节点对应的至少一种类型的图形处理器资源的状态信息;然后,在所述状态信息满足更新条件的情况下,根据状态信息对当前状态的配置文件进行更新处理,得到更新状态的配置文件;并根据更新状态的配置文件,对工作节点上的图形处理器资源进行重配置,调整工作节点对应的图形处理器资源的类型。本公开实施例可实现提高对图形处理器资源的利用率。的利用率。的利用率。

【技术实现步骤摘要】
图形处理器资源管理方法及装置、电子设备和存储介质


[0001]本公开涉及计算机
,尤其涉及一种图形处理器资源管理方法及装置、电子设备和存储介质。

技术介绍

[0002]Kubernetes(简称K8s)是一个开源的、用于管理云平台中多个主机上的容器化的应用,能够方便地管理跨机器进行容器化的应用。随着越来越多的容器化应用程序参与生产,基于Kubernetes以及各种需求的衍生项目和技术架构方案也层出不穷。基于Kubernetes的多集群的统一管理能力,可以实现容器集群的快速部署交付。
[0003]其中,Kubernetes集群对中央处理器(Central Processing Unit,CPU)、存储器(Memory)等资源是预配置的,通过配置Kubelet(节点代理,Kubernetes工作节点上的一个代理组件)的参数,工作节点可以预留一部分资源给别的业务,剩余资源留给Kubernetes。对于图形处理器(Graphics Processing Unit,GPU)等一些扩展资源,通常是通过读取工作节点上已经有的设备数量,比如预先配置了各类型的GPU资源的设备,来给Kubernetes集群提供资源。
[0004]预配置产生的问题就是工作节点上的资源是有限的,例如对于CPU、存储器等资源,如果资源不够,就无法去创建一个新的工作负载(也称业务负载)。而GPU预配置带来的问题就是可能工作节点上还有足够的GPU资源,但是通过预配置这种机制,由于已预先为工作节点配置了各类型的GPU资源,工作节点上剩余的GPU资源的类型可能会与工作负载需要的GPU类型不同,无法让工作节点上的GPU资源得到充分的利用。

技术实现思路

[0005]本公开提出了一种图形处理器资源管理技术方案。
[0006]根据本公开的一方面,提供了一种图形处理器资源管理方法,包括:根据预设的初始状态的配置文件,对工作节点上的图形处理器资源进行初始化配置;所述初始化配置用于为所述工作节点初始化至少一种类型的图形处理器资源,每种类型的图形处理器资源包括至少一个图形处理器;获取所述工作节点对应的至少一种类型的图形处理器资源的状态信息;在所述状态信息满足更新条件的情况下,根据所述状态信息,对当前状态的所述配置文件进行更新处理,得到更新状态的配置文件;根据所述更新状态的配置文件,对工作节点上的图形处理器资源进行重配置。
[0007]在一种可能的实现方式中,所述状态信息用于指示所述工作节点对应的每个图形处理器资源的类型和工作状态,所述工作状态包括空闲状态、占用状态,所述在所述状态信息满足更新条件的情况下,根据所述状态信息,对当前状态的所述配置文件进行更新处理,得到更新状态的配置文件,包括:在所述状态信息指示出所述工作节点上存在至少一种第一类型的图形处理器资源处于空闲状态、存在工作负载请求至少一种第二类型的图像处理器资源且所述第二类型的图像处理资源处于占用状态或不存在的情况下,对当前状态的所
述配置文件进行更新处理,得到更新状态的配置文件;所述第一类型和所述第二类型不同;根据所述更新状态的配置文件,对工作节点上的图形处理器资源进行重配置,包括:根据所述更新状态的配置文件,对工作节点上的图形处理器资源进行重配置,将所述第一类型的图形处理器资源转换为所述第二类型的图形处理器资源。
[0008]在一种可能的实现方式中,所述方法还包括:在所述工作节点对应的任一图形处理器资源的类型发生变化的情况下,控制所述工作节点通过变化后的图形处理器资源对应的设备插件将变化后的类型上报至节点代理;所述节点代理用于根据所述类型发生变化的图形处理器资源,为工作负载分配对应类型的图形处理器资源。
[0009]在一种可能的实现方式中,所述在所述工作节点对应的任一图形处理器资源的类型发生变化的情况下,控制所述工作节点通过变化后的图形处理器资源对应的设备插件将变化后的类型上报至节点代理,包括:在所述工作节点对应的任一类型图形处理器资源增加的情况下,控制所述工作节点开启所述类型的图形处理器资源的设备插件,向所述节点代理上报增加的图形处理器资源的类型。
[0010]在一种可能的实现方式中,所述方法还包括:在所述工作节点对应的第三类型图形处理器资源不存在的情况下,利用所述工作节点关闭所述第三类型的图形处理器资源的设备插件。
[0011]在一种可能的实现方式中,根据预设的初始状态的配置文件,对工作节点上的图形处理器资源进行初始化配置,包括:根据预设的初始状态的配置文件,确定工作节点的每个图形处理器资源分别对应的驱动程序类型;根据每个图形处理器资源分别对应的驱动程序类型,分别为每个图形处理器资源安装对应的驱动程序,得到所述工作节点对应的不同类型的图形处理器资源。
[0012]在一种可能的实现方式中,根据所述更新状态的配置文件,对工作节点上的图形处理器资源进行重配置,将所述第一类型的图形处理器资源转换为所述第二类型的图形处理器资源,包括:根据所述更新状态的配置文件,确定处于空闲状态的所述第一类型的目标图形处理器资源;为所述目标图形处理器资源安装所述第二类型的驱动程序,得到类型转换后的图形处理器资源。
[0013]根据本公开的一方面,提供了一种图形处理器资源管理装置,包括:初始化配置模块,用于根据预设的初始状态的配置文件,对工作节点上的图形处理器资源进行初始化配置;所述初始化配置用于为所述工作节点初始化至少一种类型的图形处理器资源,每种类型的图形处理器资源包括至少一个图形处理器;获取模块,用于获取所述工作节点对应的至少一种类型的图形处理器资源的状态信息;更新模块,在所述状态信息满足更新条件的情况下,根据所述状态信息,对当前状态的所述配置文件进行更新处理,得到更新状态的配置文件;重配置模块,用于根据所述更新状态的配置文件,对工作节点上的图形处理器资源进行重配置。
[0014]在一种可能的实现方式中,所述状态信息用于指示所述工作节点对应的每个图形处理器资源的类型和工作状态,所述工作状态包括空闲状态、占用状态,所述更新模块用于:在所述状态信息指示出所述工作节点上存在至少一种第一类型的图形处理器资源处于空闲状态、存在工作负载请求至少一种第二类型的图像处理器资源且所述第二类型的图像处理资源处于占用状态或不存在的情况下,对当前状态的所述配置文件进行更新处理,得
到更新状态的配置文件;所述第一类型和所述第二类型不同;所述重配置模块用于:根据所述更新状态的配置文件,对工作节点上的图形处理器资源进行重配置,将处于空闲状态的图形处理器资源的类型转换为所述第二类型。
[0015]在一种可能的实现方式中,所述装置还用于:在所述工作节点对应的任一图形处理器资源的类型发生变化的情况下,控制所述工作节点通过变化后的图形处理器资源对应的设备插件将变化后的类型上报至节点代理;所述节点代理用于根据所述类型发生变化的图形处理器资源,为工作负载分配对应类型的图形处理器资源。
[0016]在一种可能的实现方式中,所述在所述工作节点对应的任一图形处理器资源的类型发生本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图形处理器资源管理方法,其特征在于,包括:根据预设的初始状态的配置文件,对工作节点上的图形处理器资源进行初始化配置;所述初始化配置用于为所述工作节点初始化至少一种类型的图形处理器资源,每种类型的图形处理器资源包括至少一个图形处理器;获取所述工作节点对应的至少一种类型的图形处理器资源的状态信息;在所述状态信息满足更新条件的情况下,根据所述状态信息,对当前状态的所述配置文件进行更新处理,得到更新状态的配置文件;根据所述更新状态的配置文件,对工作节点上的图形处理器资源进行重配置。2.根据权利要求1所述的方法,其特征在于,所述状态信息用于指示所述工作节点对应的每个图形处理器资源的类型和工作状态,所述工作状态包括空闲状态、占用状态;所述在所述状态信息满足更新条件的情况下,根据所述状态信息,对当前状态的所述配置文件进行更新处理,得到更新状态的配置文件,包括:在所述状态信息指示出所述工作节点上存在至少一种第一类型的图形处理器资源处于空闲状态、存在工作负载请求至少一种第二类型的图像处理器资源且所述第二类型的图像处理资源处于占用状态或不存在的情况下,对当前状态的所述配置文件进行更新处理,得到更新状态的配置文件;所述第一类型和所述第二类型不同;根据所述更新状态的配置文件,对工作节点上的图形处理器资源进行重配置,包括:根据所述更新状态的配置文件,对工作节点上的图形处理器资源进行重配置,将所述第一类型的图形处理器资源转换为所述第二类型的图形处理器资源。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:在所述工作节点对应的任一图形处理器资源的类型发生变化的情况下,控制所述工作节点通过变化后的图形处理器资源对应的设备插件将变化后的类型上报至节点代理;所述节点代理用于根据所述类型发生变化的图形处理器资源,为工作负载分配对应类型的图形处理器资源。4.根据权利要求3所述的方法,其特征在于,所述在所述工作节点对应的任一图形处理器资源的类型发生变化的情况下,控制所述工作节点通过变化后的图形处理器资源对应的设备插件将变化后的类型上报至节点代理,包括:在所述工作节点对应的任一类型图形处理器资源增加的情况下,控制所述工作节点开...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:摩尔线程智能科技北京有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1