共享GPU的管理调度架构、管理调度方法及使用方法技术

技术编号:32240925 阅读:10 留言:0更新日期:2022-02-09 17:44
本发明专利技术公开了一种共享GPU的管理调度架构、管理调度方法及使用方法,使用容器管理平台对GPU服务器资源进行统一管理。其中,管理调度架构包括:资源添加层,用于添加GPU服务器;资源部署层,包括资源集群,用于将GPU服务器资源分配给资源集群;资源配置层,用于为用户提供创建GPU应用和设置GPU服务器配额的端口;资源划分层,用于将K8s集群中的GPU服务器划分给GPU应用;资源管理层,用于观察GPU应用对GPU服务器的使用情况,并进行动态调整。本发明专利技术可大幅提升GPU服务器的利用率;并且,以共享GPU调度的形式把GPU资源按需分配到获得授权的GPU应用,实现资源限额。实现资源限额。实现资源限额。

【技术实现步骤摘要】
共享GPU的管理调度架构、管理调度方法及使用方法


[0001]本专利技术涉及GPU管理调度
,具体而言,涉及一种共享GPU的管理调度架构、管理调度方法及使用方法。

技术介绍

[0002]随着边缘网络用户对于3D可视化、视频稳像、过滤、转码,结构化分析和高性能计算等业务需求的增长,边缘网络普通的计算实体的计算能力已明显不足。针对此情况,通常采取购买GPU服务器和相关服务的方式来进行维护。但是,维护过程中存在部署操作复杂,不便于资源管理和资源限制的问题。
[0003]有鉴于此,特提出本申请。

技术实现思路

[0004]本专利技术所要解决的技术问题是:通过购买GPU服务器来弥补边缘网络普通计算实体计算能力不足的方式,存在部署操作复杂,不便于资源管理和资源限制的问题。目的在于提供一种共享GPU的管理调度架构、管理调度方法及使用方法,使用容器管理平台对GPU服务器资源进行统一管理,可大幅提升GPU服务器资源的利用率;并且,以共享GPU调度的形式把GPU资源按需分配到获得授权的GPU应用,实现资源限额。
[0005]本专利技术通过下述技术方案实现:
[0006]一方面,提供一种共享GPU的管理调度架构,基于容器管理平台,包括:
[0007]资源添加层,用于添加GPU服务器资源;
[0008]资源部署层,包括K8s集群,用于将主机资源池中的GPU服务器资源分配给K8s集群;
[0009]资源配置层,用于为用户提供创建GPU应用和设置GPU服务器资源配额的端口;<br/>[0010]资源划分层,用于根据GPU服务器资源配额,将K8s集群中的GPU服务器资源划分给GPU应用;
[0011]资源管理层,用于观察GPU应用对GPU服务器资源的使用情况,并根据使用情况对GPU服务器资源进行动态调整。
[0012]与现有技术相比,本专利技术利用容器管理平台对GPU服务器资源进行统一管理。在容器管理平台的基础上建立资源添加层,将所有需要的GPU服务器资源与容器管理平台相关联;建立资源部署层,基于镜像实现GPU服务器资源的快捷部署,并且在资源部署中对GPU服务器资源实施项目管理,对每一个项目实施资源配置限额;建立资源配置层,基于角色的访问控制,用户登录容器管理平台以创建GPU应用和设置资源配额的方式请求分配GPU服务器资源;建立资源划分层,根据资源配额请求,将GPU服务器资源按需给GPU应用,可大幅提升GPU服务器资源的利用率;建立资源管理层,对GPU服务器资源的使用情况进行所述观察确保各应用业务稳定运行,并且对GPU应用日志分析,挖掘用户价值,对GPU服务器资源进行动态调整,实现资源最大化利用。
[0013]作为对本专利技术的进一步描述,所述管理调度架构还包括:图像用户界面交互层,所述图形用户界面交互层分别与资源添加层、资源部署层、资源配置层、资源划分层和资源管理层关联。
[0014]作为对本专利技术的进一步描述,所述资源添加层包括:
[0015]SSH方式添加单元,用于为用户提供以GPU服务器IP地址作为添加方式的端口;
[0016]终端命令方式添加单元,用于为用户提供以输入终端命令作为添加方式的端口。
[0017]作为对本专利技术的进一步描述,所述资源部署层包括:
[0018]项目管理单元,用于生成多个项目,通过项目实现对GPU服务器资源进行隔离;
[0019]域管理单元,用于设置GPU服务器资源配置限额,并根据资源配置限额将GPU服务器资源部署给项目管理单元中项目;
[0020]标签添加单元,用于给K8s集群中的GPU服务器资源添加标签,实现根据标签为GPU应用分配GPU服务器资源。
[0021]作为对本专利技术的进一步描述,所述资源管理层包括:
[0022]监控告警单元,用于实时监控GPU服务器资源的使用情况;
[0023]和日志审计单元,用于收集GPU应用的日志,并对日志进行分析,根据分析结果进行用户价值挖掘。
[0024]另一方面,提供一种共享GPU的管理调度方法,在容器管理平台上执行以下步骤:
[0025]资源添加层添加所有需要的GPU服务器资源;
[0026]资源部署层将资源添加层中的GPU服务器资源分配给K8s集群;
[0027]资源划分层根据用户在资源配置层中设置的GPU服务器资源配额,将K8s集群中的GPU服务器资源划分给用户在资源配置层中创建的GPU应用;
[0028]资源管理层观察GPU应用对GPU服务器资源的使用情况,并根据使用情况对GPU服务器资源进行动态调整。
[0029]作为对本专利技术的进一步描述,在将GPU服务器资源分配给K8s集群之前,包括以下步骤:
[0030]资源部署层的项目管理单元生成多个项目;
[0031]资源部署层的域管理单元设置GPU服务器资源配置限额,并根据资源配置限额将GPU服务器资源部署给项目管理单元中的所述多个项目;
[0032]资源部署层的标签添加单元对所有GPU服务器资源添加标签。
[0033]作为对本专利技术的进一步描述,资源划分层根据标签为GPU应用分配相应的GPU服务器资源。
[0034]作为对本专利技术的进一步描述,资源管理层中,监控告警单元实时观察对GPU服务器资源的使用情况,日志审计单元收集GPU应用的日志,并对日志进行分析得到分析结果,资源划分层根据GPU服务器资源的使用情和日志分析结果,对GPU服务器资源进行动态调整。
[0035]再一方面,提供一种共享GPU的管理调度架构的使用方法,在图像用户界面交互层中执行以下步骤:
[0036]在用户登录界面,填写用户名及密码,登录容器管理平台;
[0037]在资源添加界面,选择GPU服务器资源的添加方式,将需要的所有GPU服务器资源按所选添加方式添加到资源添加层;
不一定都指同一实施例或示例。此外,可以以任何适当的组合和、或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外,本领域普通技术人员应当理解,在此提供的示图都是为了说明的目的,并且示图不一定是按比例绘制的。这里使用的术语“和/或”包括一个或多个相关列出的项目的任何和所有组合。
[0054]在本专利技术的描述中,术语“前”、“后”、“左”、“右”、“上”、“下”、“竖直”、“水平”、“高”、“低”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术保护范围的限制。
[0055]实施例1
[0056]由于边缘网络普通计算实体的计算能力不足,不能满足边缘网络用户对于3D可视化、视频稳像、过滤、转码,结构化分析和高性能计算等业务需求的增长。对此,现有技术通过购买GPU服务器的方式来弥补边缘网络普通计算实体计算能力不足,但该方式存在部署操作复杂,不便于资源管理和资源限制。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种共享GPU的管理调度架构,其特征在于,基于容器管理平台,包括:资源添加层,用于添加GPU服务器资源;资源部署层,包括K8s集群,用于将主机资源池中的GPU服务器资源分配给K8s集群;资源配置层,用于为用户提供创建GPU应用和设置GPU服务器资源配额的端口;资源划分层,用于根据GPU服务器资源配额,将K8s集群中的GPU服务器资源划分给GPU应用;资源管理层,用于观察GPU应用对GPU服务器资源的使用情况,并根据使用情况对GPU服务器资源进行动态调整。2.根据权利要求1所述的一种共享GPU的管理调度架构,其特征在于,包括:图像用户界面交互层,所述图形用户界面交互层分别与资源添加层、资源部署层、资源配置层、资源划分层和资源管理层关联。3.根据权利要求2所述的一种共享GPU的管理调度架构,其特征在于,所述资源添加层包括:SSH方式添加单元,用于为用户提供以GPU服务器IP地址作为添加方式的端口;终端命令方式添加单元,用于为用户提供以输入终端命令作为添加方式的端口。4.根据权利要求2所述的一种共享GPU的管理调度架构,其特征在于,所述资源部署层包括:项目管理单元,用于生成多个项目,通过项目实现对GPU服务器资源进行隔离;域管理单元,用于设置GPU服务器资源配置限额,并根据资源配置限额将GPU服务器资源部署给项目管理单元中项目(实现用户访问控制);标签添加单元,用于给K8s集群中的GPU服务器资源添加标签,实现根据标签为GPU应用分配GPU服务器资源。5.根据权利要求2所述的一种共享GPU的管理调度架构,其特征在于,所述资源管理层包括:监控告警单元,用于实时监控GPU服务器资源的使用情况;和日志审计单元,用于收集GPU应用的日志,并对日志进行分析,根据分析结果进行用户价值挖掘。6.一种如权利要求1

5中任意一项所述架构的管理调度方法,其特征在于,在容器管理平台上执行以下步骤:资源添加层添加所有需要的GPU...

【专利技术属性】
技术研发人员:王鑫常健陈龙杨懿张秋铭黄林陈语
申请(专利权)人:国网四川省电力公司信息通信公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1