GPU驱动软件的更新方法、装置、主机及存储介质制造方法及图纸

技术编号:37121636 阅读:20 留言:0更新日期:2023-04-01 05:17
本发明专利技术提供一种GPU驱动软件的更新方法、装置、主机及存储介质,涉及计算机技术领域。包括:检测目标虚拟机的多个容器中运行的GPU应用程序的GPU调用信息,和目标虚拟机部署的目标访客系统镜像中的GPU驱动软件版本是否兼容;目标虚拟机为多个虚拟机中的任意虚拟机;若不兼容,则对目标访客系统镜像中部署的GPU驱动软件版本进行更新;其它虚拟机的多个容器中保持运行GPU应用程序。对目标访客系统镜像中部署的GPU驱动软件版本进行更新即可,避免额外资源的消耗,而其它虚拟机的多个容器中运行的GPU应用程序,仍然可以基于其它虚拟机的访客系统镜像中的GPU驱动软件版本保持运行,无需暂停所有的服务,提升了服务稳定性。提升了服务稳定性。提升了服务稳定性。

【技术实现步骤摘要】
GPU驱动软件的更新方法、装置、主机及存储介质


[0001]本专利技术涉及计算机
,具体而言,涉及一种GPU驱动软件的更新方法、装置、主机及存储介质。

技术介绍

[0002]随着机器学习的大规模发展,对于GPU(Graphic Processing Unit,图形处理器)的算力需求也日渐旺盛。容器技术是当前热门且最前沿的技术,容器的出现,也使得应用软件的部署更加方便。
[0003]相关技术中,将GPU应用通过容器部署到节点,容器中的架构通过宿主机上的GPU驱动软件进行计算,不同的GPU应用对应的架构版本不同,即不同版本的架构和宿主机上的GPU驱动软件会存在兼容性问题,对节点上的GPU驱动软件进行升级时,需要暂停并迁移节点上的所有服务才可以进行升级。
[0004]但是,相关技术中,需要暂停并迁移节点上的所有服务才可以对宿主机上的GPU驱动软件进行升级,消耗了额外的机器资源,还容易导致服务不稳定的问题。

技术实现思路

[0005]本专利技术的目的在于,针对上述现有技术中的不足,提供一种GPU驱动软件的更新方法、装置、主机及存储介质,以便解决相关技术中所存在的上述技术问题。
[0006]为实现上述目的,本专利技术实施例采用的技术方案如下:
[0007]第一方面,本专利技术实施例提供了一种GPU驱动软件的更新方法,应用于主机,所述主机上部署有多个虚拟机,每个虚拟机中部署有多个容器以及访客系统镜像,所述多个容器中运行有GPU应用程序,包括:
[0008]检测目标虚拟机的多个容器中运行的GPU应用程序的GPU调用信息,和所述目标虚拟机部署的目标访客系统镜像中的GPU驱动软件版本是否兼容;所述目标虚拟机为所述多个虚拟机中的任意虚拟机;
[0009]若不兼容,则对所述目标访客系统镜像中部署的GPU驱动软件版本进行更新;
[0010]其中,所述多个虚拟机中,除所述目标虚拟机之外的其它虚拟机的多个容器中保持运行GPU应用程序;所述其它虚拟机的多个容器中运行的GPU应用程序的GPU调用信息,和所述其它虚拟机部署的访客系统镜像中的GPU驱动软件版本兼容。
[0011]第二方面,本专利技术实施例还提供了一种GPU驱动软件的更新装置,应用于主机,所述主机上部署有多个虚拟机,每个虚拟机中部署有多个容器以及访客系统镜像,所述多个容器中运行有GPU应用程序,包括:
[0012]检测模块,用于检测目标虚拟机的多个容器中运行的GPU应用程序的GPU调用信息,和所述目标虚拟机部署的目标访客系统镜像中的GPU驱动软件版本是否兼容;所述目标虚拟机为所述多个虚拟机中的任意虚拟机;
[0013]更新模块,用于若不兼容,则对所述目标访客系统镜像中部署的GPU驱动软件版本
进行更新;
[0014]其中,所述多个虚拟机中,除所述目标虚拟机之外的其它虚拟机的多个容器中保持运行GPU应用程序;所述其它虚拟机的多个容器中运行的GPU应用程序的GPU调用信息,和所述其它虚拟机部署的访客系统镜像中的GPU驱动软件版本兼容。
[0015]第三方面,本专利技术实施例还提供了一种主机,包括:存储器和处理器,所述存储器存储有所述处理器可执行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面任一项所述的GPU驱动软件的更新方法。
[0016]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被读取并执行时,实现上述第一方面任一项所述的GPU驱动软件的更新方法。
[0017]本专利技术的有益效果是:本专利技术实施例提供一种GPU驱动软件的更新方法,应用于主机,主机上部署有多个虚拟机,每个虚拟机中部署有多个容器以及访客系统镜像,多个容器中运行有GPU应用程序,包括:检测目标虚拟机的多个容器中运行的GPU应用程序的GPU调用信息,和目标虚拟机部署的目标访客系统镜像中的GPU驱动软件版本是否兼容;目标虚拟机为多个虚拟机中的任意虚拟机;若不兼容,则对目标访客系统镜像中部署的GPU驱动软件版本进行更新;其中,多个虚拟机中,除目标虚拟机之外的其它虚拟机的多个容器中保持运行GPU应用程序;其它虚拟机的多个容器中运行的GPU应用程序的GPU调用信息,和其它虚拟机部署的访客系统镜像中的GPU驱动软件版本兼容。目标虚拟机中运行的GPU应用程序的GPU调用信息,和目标访客系统镜像中的GPU驱动软件版本不兼容,仅对目标访客系统镜像中部署的GPU驱动软件版本进行更新即可,避免额外资源的消耗,而其它虚拟机的多个容器中运行的GPU应用程序,仍然可以基于其它虚拟机的访客系统镜像中的GPU驱动软件版本保持运行,无需暂停所有的服务,提升了服务稳定性。
附图说明
[0018]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0019]图1为本专利技术实施例提供的一种GPU驱动软件的更新方法的流程示意图;
[0020]图2为本专利技术实施例提供的一种主机部署的虚拟机的示意图;
[0021]图3为本专利技术实施例提供的一种GPU驱动软件的更新方法的流程示意图;
[0022]图4为本专利技术实施例提供的一种GPU驱动软件的更新方法的流程示意图;
[0023]图5为本专利技术实施例提供的一种GPU驱动软件的更新方法的流程示意图;
[0024]图6为本专利技术实施例提供的一种GPU驱动软件的更新方法的流程示意图;
[0025]图7为本专利技术实施例提供的一种GPU驱动软件的更新方法的流程示意图;
[0026]图8为本专利技术实施例提供的一种GPU驱动软件的更新方法的流程示意图;
[0027]图9为本专利技术实施例提供的一种GPU驱动软件的更新装置的结构示意图;
[0028]图10为本专利技术实施例提供的一种主机的结构示意图。
具体实施方式
[0029]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。
[0030]因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0031]在本申请的描述中,需要说明的是,若出现术语“上”、“下”、等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该申请产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
[0032]此本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种GPU驱动软件的更新方法,其特征在于,应用于主机,所述主机上部署有多个虚拟机,每个虚拟机中部署有多个容器以及访客系统镜像,所述多个容器中运行有GPU应用程序,包括:检测目标虚拟机的多个容器中运行的GPU应用程序的GPU调用信息,和所述目标虚拟机部署的目标访客系统镜像中的GPU驱动软件版本是否兼容;所述目标虚拟机为所述多个虚拟机中的任意虚拟机;若不兼容,则对所述目标访客系统镜像中部署的GPU驱动软件版本进行更新;其中,所述多个虚拟机中,除所述目标虚拟机之外的其它虚拟机的多个容器中保持运行GPU应用程序;所述其它虚拟机的多个容器中运行的GPU应用程序的GPU调用信息,和所述其它虚拟机部署的访客系统镜像中的GPU驱动软件版本兼容。2.根据权利要求1所述的方法,其特征在于,在检测目标虚拟机的多个容器中运行的GPU应用程序的GPU调用信息,和所述目标虚拟机部署的目标访客系统镜像中的GPU驱动软件版本是否兼容之前,所述方法还包括:根据预设的内核配置参数,编译目标内核;根据所述目标内核以及所述GPU驱动软件,为所述目标虚拟机构建所述目标访客系统镜像;在启动所述目标虚拟机的过程中,加载所述目标访客系统镜像。3.根据权利要求2所述的方法,其特征在于,所述根据所述目标内核以及所述GPU驱动软件,为所述目标虚拟机构建所述目标访客系统镜像,包括:根据所述目标内核以及根文件系统,在所述目标访客系统镜像中安装所述GPU驱动软件;根据所述GPU驱动软件、所述根文件系统以及预设工具集,为所述目标虚拟机构建所述目标访客系统镜像。4.根据权利要求1

3任一所述的方法,其特征在于,在检测目标虚拟机的多个容器中运行的GPU应用程序的GPU调用信息,和所述目标虚拟机部署的目标访客系统镜像中的GPU驱动软件版本是否兼容之前,所述方法还包括:根据GPU设备的总线地址,将所述GPU设备从所述主机的GPU驱动软件上进行解绑;将所述GPU设备挂载到所述目标虚拟机中的多个容器上。5.根据权利要求4所述的方法,其特征在于,所述将所述GPU设备挂载到所述目标虚拟机中的多个容器上,包括:采用预设插件,根据预设配置文件,将所述GPU设备的各个设备功能绑定到所述目标虚拟机;将所述GPU设备的各个设备功能挂载到所述目标虚拟机的多个容器中。6.根据...

【专利技术属性】
技术研发人员:朱晓扬王军伟李想成赵增刘柏
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1