基于kubernetes的GPU共享方法、装置、设备及介质制造方法及图纸

技术编号:33968344 阅读:34 留言:0更新日期:2022-06-30 01:54
本发明专利技术涉及互联网领域,提供一种基于kubernetes的GPU共享方法、装置、设备及介质,在内核层,通过配置的第一插件监听每个GPU设备的资源占用信息并记录至预设文件,当根据预设文件检测到有GPU设备处于空闲状态,且有目标docker请求GPU资源时,将GPU设备确定为目标GPU设备,并利用kubernetes的device

【技术实现步骤摘要】
基于kubernetes的GPU共享方法、装置、设备及介质


[0001]本专利技术涉及互联网
,尤其涉及一种基于kubernetes的GPU共享方法、装置、设备及介质。

技术介绍

[0002]Kubernetes 是一个可移植、可扩展的平台,用于管理容器化的工作负载和服务,可促进声明式配置和自动化。现有的Kubernetes中,上报给Kubernetes的GPU(Graphics Processing Unit,图形处理器)资源,一旦分配给某个docker,就会被docker独占,即便该docker并未使用GPU资源,也无法再分配给其他docker使用,造成了资源的浪费。
[0003]并且,在利用GPU设备执行任务时,通常是由多个任务同时共享使用同一个GPU设备,存在任务相互干扰的情况,并导致任务的执行效率低。
[0004]另外,当有GPU设备被长期闲置时,也会造成GPU资源的浪费,导致GPU资源的利用率低。

技术实现思路

[0005]鉴于以上内容,有必要提供一种基于kubernetes的GPU共享方法、装本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于kubernetes的GPU共享方法,其特征在于,所述基于kubernetes的GPU共享方法包括:在内核层,通过配置的第一插件监听每个GPU设备的资源占用信息,并将每个GPU设备的资源占用信息记录至预设文件;根据所述预设文件检测是否有GPU设备处于空闲状态;当检测到有GPU设备处于空闲状态,且有目标docker请求GPU资源时,将所述GPU设备确定为目标GPU设备,并利用所述kubernetes的device

plugin插件将所述目标GPU设备作为扩展资源上报至kubelet;通过所述kubelet上报所述目标GPU设备至所述kubernetes,并将所述目标GPU设备映射至所述目标docker进行使用。2.如权利要求1所述的基于kubernetes的GPU共享方法,其特征在于,所述GPU设备的资源占用信息包括该GPU设备的打开事件及关闭事件;所述通过配置的第一插件监听每个GPU设备的资源占用信息,并将每个GPU设备的资源占用信息记录至预设文件包括:通过所述第一插件的预设开关控制是否监听每个GPU设备的资源占用信息;当通过所述预设开关控制监听每个GPU设备的资源占用信息时,通过所述第一插件监听每个GPU设备的打开事件及关闭事件;获取所述打开事件的进程ID,及获取所述关闭事件的进程ID,并通过所述第一插件将所述打开事件的进程ID及所述关闭事件的进程ID发送至配置的第二插件;通过所述第二插件将每个GPU设备的资源占用信息记录至所述预设文件,其中,每个GPU设备的资源占用信息包括所述打开事件的进程ID及所述关闭事件的进程ID。3.如权利要求2所述的基于kubernetes的GPU共享方法,其特征在于,在通过所述第一插件将所述打开事件的进程ID及所述关闭事件的进程ID发送至配置的第二插件前,所述方法还包括:向所述第一插件注册所述第二插件。4.如权利要求1所述的基于kubernetes的GPU共享方法,其特征在于,所述根据所述预设文件检测是否有GPU设备处于空闲状态包括:当根据所述预设文件中的记录检测到有GPU设备被任意docker占用,且在预设时长内未被使用时,确定检测到的GPU设备处于所述空闲状态。5.如权利要求1所述的基于kubernetes的GPU共享方法,其特征在于,所述将所述目标GPU设备映射至所述目标docker进行使用包括:当所述目标docker的数量为多个...

【专利技术属性】
技术研发人员:胡俊彬
申请(专利权)人:深圳前海环融联易信息科技服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1