【技术实现步骤摘要】
本专利技术涉及gpu设备管理,尤其涉及一种云原生虚拟机gpu设备热插拔管理方法和系统。
技术介绍
1、随着ai应用、大模型、人工智能、自动驾驶等新兴技术的快速发展,企业面临着越来越多的计算密集型任务和数据处理需求,以cpu为代表的传统计算架构已无法满足企业日益增长的计算需求。此时,以gpu为代表的异构计算因在处理大规模数据、进行复杂计算和实时图形渲染方面具有独特的优势被广泛应用。与此同时,由于缺乏异构资源调度管理等方面的经验和专业的解决方案,导致了gpu设备的资源利用率极低,给企业带来了高昂的ai生产成本。如何降本增效,提高gpu等异构资源的利用效率成为了当前众多企业亟需跨越的一道难题。
2、kubernetes是一个开源的、先进的容器编排平台,被誉为云原生时代的操作系统。kubernetes自身架构设计具有松耦合和高扩展的特点,通过cni、csi、cri标准的制定能够实现网络、存储和容器运行时的扩展。同时,kubernetes对外暴露设备插件接口,能够支持gpu等异构设备资源的调度和管理。kubernetes通过devic
...【技术保护点】
1.一种云原生虚拟机GPU设备热插拔管理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的云原生虚拟机GPU设备热插拔管理方法,其特征在于,创建虚拟机pod,调度适配的节点运行创建的虚拟机pod,将空闲的GPU设备分配给虚拟机pod,更新对应的节点GPU设备自定义资源,调用libvirt接口创建虚拟机,包括:
3.根据权利要求2所述的云原生虚拟机GPU设备热插拔管理方法,其特征在于,节点GPU设备自定义资源控制器组件更新对应的节点GPU设备自定义资源,虚拟机管理组件根据更新的节点GPU设备自定义资源调用libvirt接口创建虚拟机,包括
4....
【技术特征摘要】
1.一种云原生虚拟机gpu设备热插拔管理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的云原生虚拟机gpu设备热插拔管理方法,其特征在于,创建虚拟机pod,调度适配的节点运行创建的虚拟机pod,将空闲的gpu设备分配给虚拟机pod,更新对应的节点gpu设备自定义资源,调用libvirt接口创建虚拟机,包括:
3.根据权利要求2所述的云原生虚拟机gpu设备热插拔管理方法,其特征在于,节点gpu设备自定义资源控制器组件更新对应的节点gpu设备自定义资源,虚拟机管理组件根据更新的节点gpu设备自定义资源调用libvirt接口创建虚拟机,包括:
4.根据权利要求1所述的云原生虚拟机gpu设备热插拔管理方法,其特征在于,通过查询节点gpu设备自定义资源中的gpu设备分配信息,为创建的虚拟机分配一个空闲的gpu设备,并为创建的虚拟机热添加gpu设备,包括:
5.根据权利要求1所述的云原生虚拟机gpu设备热插拔管理方法,其特征在于,通过调用libvirt pci设备热卸载接口卸载添加至虚拟机的gpu设备,更新卸载gpu设备的虚拟机所在节点对应的节点gpu设备自定义资源,包括:
6.一种云原生虚...
【专利技术属性】
技术研发人员:黄帅康,
申请(专利权)人:中电云计算技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。