【技术实现步骤摘要】
基于kubernetes的GPU共享方法、装置、设备及介质
[0001]本专利技术涉及互联网
,尤其涉及一种基于kubernetes的GPU共享方法、装置、设备及介质。
技术介绍
[0002]Kubernetes 是一个可移植、可扩展的平台,用于管理容器化的工作负载和服务,可促进声明式配置和自动化。现有的Kubernetes中,上报给Kubernetes的GPU(Graphics Processing Unit,图形处理器)资源,一旦分配给某个docker,就会被docker独占,即便该docker并未使用GPU资源,也无法再分配给其他docker使用,造成了资源的浪费。
[0003]并且,在利用GPU设备执行任务时,通常是由多个任务同时共享使用同一个GPU设备,存在任务相互干扰的情况,并导致任务的执行效率低。
[0004]另外,当有GPU设备被长期闲置时,也会造成GPU资源的浪费,导致GPU资源的利用率低。
技术实现思路
[0005]鉴于以上内容,有必要提供一种基于kubernetes ...
【技术保护点】
【技术特征摘要】
1.一种基于kubernetes的GPU共享方法,其特征在于,所述基于kubernetes的GPU共享方法包括:在内核层,通过配置的第一插件监听每个GPU设备的资源占用信息,并将每个GPU设备的资源占用信息记录至预设文件;根据所述预设文件检测是否有GPU设备处于空闲状态;当检测到有GPU设备处于空闲状态,且有目标docker请求GPU资源时,将所述GPU设备确定为目标GPU设备,并利用所述kubernetes的device
‑
plugin插件将所述目标GPU设备作为扩展资源上报至kubelet;通过所述kubelet上报所述目标GPU设备至所述kubernetes,并将所述目标GPU设备映射至所述目标docker进行使用。2.如权利要求1所述的基于kubernetes的GPU共享方法,其特征在于,所述GPU设备的资源占用信息包括该GPU设备的打开事件及关闭事件;所述通过配置的第一插件监听每个GPU设备的资源占用信息,并将每个GPU设备的资源占用信息记录至预设文件包括:通过所述第一插件的预设开关控制是否监听每个GPU设备的资源占用信息;当通过所述预设开关控制监听每个GPU设备的资源占用信息时,通过所述第一插件监听每个GPU设备的打开事件及关闭事件;获取所述打开事件的进程ID,及获取所述关闭事件的进程ID,并通过所述第一插件将所述打开事件的进程ID及所述关闭事件的进程ID发送至配置的第二插件;通过所述第二插件将每个GPU设备的资源占用信息记录至所述预设文件,其中,每个GPU设备的资源占用信息包括所述打开事件的进程ID及所述关闭事件的进程ID。3.如权利要求2所述的基于kubernetes的GPU共享方法,其特征在于,在通过所述第一插件将所述打开事件的进程ID及所述关闭事件的进程ID发送至配置的第二插件前,所述方法还包括:向所述第一插件注册所述第二插件。4.如权利要求1所述的基于kubernetes的GPU共享方法,其特征在于,所述根据所述预设文件检测是否有GPU设备处于空闲状态包括:当根据所述预设文件中的记录检测到有GPU设备被任意docker占用,且在预设时长内未被使用时,确定检测到的GPU设备处于所述空闲状态。5.如权利要求1所述的基于kubernetes的GPU共享方法,其特征在于,所述将所述目标GPU设备映射至所述目标docker进行使用包括:当所述目标docker的数量为多个...
【专利技术属性】
技术研发人员:胡俊彬,
申请(专利权)人:深圳前海环融联易信息科技服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。