一种多类型GPU的管理调度的方法和设备技术

技术编号:24572981 阅读:19 留言:0更新日期:2020-06-20 23:59
本发明专利技术提供了一种多类型GPU的管理调度的方法和设备,该方法包括以下步骤:在Openstack的计算模块数据库中添加集群GPU信息表;每间隔阈值周期收集节点的GPU信息,并将GPU信息发送到GPU信息表中;响应于接收到用户输入的请求,查询GPU信息表并判断GPU信息表中是否存在满足请求的计算节点;响应于存在满足请求的计算节点,分配虚拟机到计算节点;响应于计算节点的虚拟机被删除,在GPU信息表中将该计算节点修改为未分配状态。通过使用本发明专利技术的方法,能够使云平台可以根据GPU类型调度计算节点,使虚拟机可以绑定指定类型的GPU卡,实现GPU精准调度,能够使集群扩缩容时,无需改动便可更新集群中的GPU资源。

A method and equipment of management and scheduling for multi type GPU

【技术实现步骤摘要】
一种多类型GPU的管理调度的方法和设备
本领域涉及计算机领域,并且更具体地涉及一种多类型GPU的管理调度的方法和设备。
技术介绍
随着云计算和人工智能的发展,市场对计算力的要求越来越高,图像处理单元GPU(GraphicsProcessingUnit,又称显示核心、视觉处理器)是目前计算力的主要选择。目前市场上GPU类型众多,因不同类型的GPU计算力不同、价格差距非常大,实际使用中不同业务场景会选择不同类型的GPU卡。如NVIDIATESLAV100系列,多用于人工智能模型训练等计算力要求较高的场景,价格在40000以上;NVIDIATESLAT4系列,多用于推理业务,价格在10000以上。因此,支持不同GPU类型的调度,成为各家云厂商的必备功能。Openstack是一个开源的云计算管理平台项目,国内绝大部分云厂商均采用Openstack作为云平台基础,已成为一种事实上的云平台标准,但是Openstack社区版并不支持GPU类型的调度。
技术实现思路
有鉴于此,本专利技术实施例的目的在于提出一种多类型GPU的管理调度的方法和设备,通过使用本专利技术的方法,能够使云平台可以根据GPU类型调度计算节点,使虚拟机可以绑定指定类型的GPU卡,实现GPU精准调度,能够使集群扩缩容时,无需改动便可更新集群中的GPU资源。基于上述目的,本专利技术的实施例的一个方面提供了一种多类型GPU的管理调度的方法,包括以下步骤:在Openstack的计算模块数据库中添加集群GPU信息表;每间隔阈值周期收集节点的GPU信息,并将GPU信息发送到GPU信息表中;响应于接收到用户输入的请求,查询GPU信息表并判断GPU信息表中是否存在满足请求的计算节点;响应于存在满足请求的计算节点,分配虚拟机到计算节点;响应于计算节点的虚拟机被删除,在GPU信息表中将该计算节点修改为未分配状态。根据本专利技术的一个实施例,GPU信息表包括GPU唯一标识、GPU类型、所在服务器节点、分配情况、绑定虚拟机id的信息。根据本专利技术的一个实施例,用户输入的请求包括所需内存、GPU个数、GPU类型的信息。根据本专利技术的一个实施例,还包括:响应于不存在满足请求的计算节点,返回没有可用的计算节点的警告。根据本专利技术的一个实施例,响应于存在满足请求的计算节点,分配虚拟机到计算节点包括:在GPU信息表中将该计算节点修改为已分配状态。本专利技术的实施例的另一个方面,还提供了一种多类型GPU的管理调度的设备,设备包括:管理模块,管理模块配置为在Openstack的计算模块数据库中添加集群GPU信息表;收集模块,收集模块配置为每间隔阈值周期收集节点的GPU信息,并将GPU信息发送到GPU信息表中;查询模块,查询模块配置为响应于接收到用户输入的请求,查询GPU信息表并判断GPU信息表中是否存在满足请求的计算节点;配置模块,配置模块配置为响应于存在满足请求的计算节点,将虚拟机分配到计算节点;回收模块,回收模块配置为响应于计算节点的虚拟机被删除,在GPU信息表中将该计算节点修改为未分配状态。根据本专利技术的一个实施例,GPU信息表包括GPU唯一标识、GPU类型、所在服务器节点、分配情况、绑定虚拟机id的信息根据本专利技术的一个实施例,用户输入的请求包括所需内存、GPU个数、GPU类型的信息。根据本专利技术的一个实施例,还包括警告模块,警告模块配置为响应于不存在满足请求的计算节点,返回没有可用的计算节点的警告。根据本专利技术的一个实施例,配置模块还配置为在GPU信息表中将该计算节点修改为已分配状态。本专利技术具有以下有益技术效果:本专利技术实施例提供的多类型GPU的管理调度的方法,通过在Openstack的计算模块数据库中添加集群GPU信息表;每间隔阈值周期收集节点的GPU信息,并将GPU信息发送到GPU信息表中;响应于接收到用户输入的请求,查询GPU信息表并判断GPU信息表中是否存在满足请求的计算节点;响应于存在满足请求的计算节点,分配虚拟机到计算节点;响应于计算节点的虚拟机被删除,在GPU信息表中将该计算节点修改为未分配状态的技术方案,能够使云平台可以根据GPU类型调度计算节点,使虚拟机可以绑定指定类型的GPU卡,实现GPU精准调度,能够使集群扩缩容时,无需改动便可更新集群中的GPU资源。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。图1为根据本专利技术一个实施例的多类型GPU的管理调度的方法的示意性流程图;图2为根据本专利技术一个实施例的多类型GPU的管理调度的设备的示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术实施例进一步详细说明。基于上述目的,本专利技术的实施例的第一个方面,提出了一种多类型GPU的管理调度的方法的一个实施例。图1示出的是该方法的示意性流程图。如图1中所示,该方法可以包括以下步骤:S1在Openstack的计算模块数据库中添加集群GPU信息表,该信息表中可以包括集群GPU的基本信息、所在服务器节点和分配情况等,并可以对该表进行管理;S2每间隔阈值周期收集节点的GPU信息,并将GPU信息发送到GPU信息表中,可以在集群的每个计算节点新增守护进程,定期收集上报每个节点的GPU类型、个数等信息到GPU信息表中;S3响应于接收到用户输入的请求,查询GPU信息表并判断GPU信息表中是否存在满足请求的计算节点,在用户输入需求配置的信息后,在GPU信息表中查找满足条件的计算节点;S4响应于存在满足请求的计算节点,分配虚拟机到计算节点;S5响应于计算节点的虚拟机被删除,将GPU信息表中修改为未分配状态,当用户使用完该虚拟机并删除时,在GPU信息表中在该计算节点将分配状态修改为未分配,以便其他用户进行使用。本专利技术主要应用于云平台的GPU资源管理、调度,通过本方法和设备可以实现GPU类型调度,根据GPU类型将虚拟机调度到相应计算节点、绑定不同的GPU卡,满足实际业务需求,可以自动收集、更新节点GPU信息,在集群扩缩容时,自动更新集群中的GPU信息。通过本专利技术的技术方案,能够使云平台可以根据GPU类型调度计算节点,使虚拟机可以绑定指定类型的GPU卡,实现GPU精准调度,能够使集群扩缩容时,无需改动便可更新集群中的GPU资源。在本专利技术的一个优选实施例中,GPU信息表包括GPU唯一标识、GPU类型、所在服务器节点、分配情况、绑定虚拟机id的信息。可以在集群中设置GPU资源管理装置,该资源管理装置在Openstack的计算模块数据库中添加集群GPU信息表,该表中包含本文档来自技高网...

【技术保护点】
1.一种多类型GPU的管理调度的方法,其特征在于,包括以下步骤:/n在Openstack的计算模块数据库中添加集群GPU信息表;/n每间隔阈值周期收集节点的GPU信息,并将所述GPU信息发送到所述GPU信息表中;/n响应于接收到用户输入的请求,查询所述GPU信息表并判断所述GPU信息表中是否存在满足所述请求的计算节点;/n响应于存在满足所述请求的计算节点,分配虚拟机到所述计算节点;/n响应于所述计算节点的所述虚拟机被删除,在所述GPU信息表中将所述计算节点修改为未分配状态。/n

【技术特征摘要】
1.一种多类型GPU的管理调度的方法,其特征在于,包括以下步骤:
在Openstack的计算模块数据库中添加集群GPU信息表;
每间隔阈值周期收集节点的GPU信息,并将所述GPU信息发送到所述GPU信息表中;
响应于接收到用户输入的请求,查询所述GPU信息表并判断所述GPU信息表中是否存在满足所述请求的计算节点;
响应于存在满足所述请求的计算节点,分配虚拟机到所述计算节点;
响应于所述计算节点的所述虚拟机被删除,在所述GPU信息表中将所述计算节点修改为未分配状态。


2.根据权利要求1所述的方法,其特征在于,所述GPU信息表包括GPU唯一标识、GPU类型、所在服务器节点、分配情况、绑定虚拟机id的信息。


3.根据权利要求1所述的方法,其特征在于,所述用户输入的请求包括所需内存、GPU个数、GPU类型的信息。


4.根据权利要求1所述的方法,其特征在于,还包括:
响应于不存在满足所述请求的计算节点,返回没有可用的计算节点的警告。


5.根据权利要求1所述的方法,其特征在于,响应于存在满足所述请求的计算节点,分配虚拟机到所述计算节点包括:
在所述GPU信息表中将所述计算节点修改为已分配状态。


6.一种多类型GPU的管理调度的设备,其...

【专利技术属性】
技术研发人员:李栋梁亓开元苏志远
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1