一种资源配置方法、装置、设备及可读存储介质制造方法及图纸

技术编号:35069471 阅读:10 留言:0更新日期:2022-09-28 11:30
本申请公开了一种资源配置方法、装置、设备及可读存储介质,该方法包括:Kubernetes获取目标服务的资源状态参数;利用bandit算法,对资源状态参数进行计算,得到资源分配信息;利用资源分配信息,对目标服务进行资源分配。在本申请中,获取目标访问的资源状态参数,然后直接利用bandit算法,计算出目标服务对应的资源分配信息,然后利用该资源分配信息对目标服务进行资源分配即可。由于bandit算法可以实现在线优化,也可以快速响应,因而基于bandit算法计算出的资源分配信息进行资源配置,可以积极应当在线推理服务的冷启动的情况,在线业务特征维度升高、降低导致的计算复杂度变化的情况。情况。情况。

【技术实现步骤摘要】
一种资源配置方法、装置、设备及可读存储介质


[0001]本申请涉及计算机应用
,特别是涉及一种资源配置方法、装置、设备及可读存储介质。

技术介绍

[0002]Kubernetes简称“k8s”或者“kube”,是一个可移植的、可扩展的开源平台,用于管理容器化的工作负载和服务,可促进声明式配置和自动化,可以在物理或虚拟机的Kubernetes集群上运行容器化应用,Kubernetes能提供一个以容器为中心的基础架构,满足在生产环境中运行应用的一些常见需求。
[0003]Kubernetes对容器/服务提供了弹性扩容能力,能根据一定的弹性策略动态增加和减少服务的容器节点数,从而动态地调整服务处理能力。在一定程度上解决了突发流量和计算资源分配的问题。
[0004]但是,对于在线推理服务的冷启动的情况,或者在线业务特征维度升高、降低导致的计算复杂度变化,现有Kubernetes弹性扩容能力无法快速、准确地为新上线业务提供最佳的计算资源初始化配置,并且对于需要GPU的计算加速场景,Kubernetes也很难有效地根据线上个服务、资源指标进行服务副本的弹性扩缩容。
[0005]综上所述,如何有效地解决服务资源配置等问题,是目前本领域技术人员急需解决的技术问题。

技术实现思路

[0006]本申请的目的是提供一种资源配置方法、装置、设备及可读存储介质,以面对资源需求变化的情况下,快速完成与资源需求对应的资源配置。
[0007]为解决上述技术问题,本申请提供如下技术方案:
[0008]一种服务资源配置方法,包括:
[0009]Kubernetes获取目标服务的资源状态参数;
[0010]利用bandit算法,对所述资源状态参数进行计算,得到资源分配信息;
[0011]利用所述资源分配信息,对所述目标服务进行资源分配。
[0012]优选地,所述得到资源分配信息之后,还包括:
[0013]利用所述资源分配信息,对与所述目标服务的相似服务进行初始化资源配置。
[0014]优选地,所述获取目标服务的资源状态参数,包括:
[0015]获取所述目标服务的实时流量、处理器使用率、存储设备占用率、计算设备温度、加速卡计算能力值。
[0016]优选地,利用所述资源分配信息,对所述目标服务进行资源分配,包括:
[0017]参照所述资源分配信息,对所述目标服务的CPU核心数量、加速卡数量、QPS、资源阈值进行设置或调整。
[0018]优选地,利用bandit算法,对所述资源状态参数进行计算,得到资源分配信息,包
括:
[0019]利用LinUCB算法,对所述资源状态参数进行计算,得到所述资源分配信息。
[0020]优选地,在对所述目标服务进行资源分配之后,还包括:
[0021]重新获取所述目标服务的资源状态参数;
[0022]利用新获取的所述资源状态参数,对所述LinUCB算法的进行训练。
[0023]优选地,利用新获取的所述资源状态参数,对所述LinUCB算法的进行训练,包括:
[0024]将新获取的所述资源状态参数输入所述LinUCB算法;
[0025]利用FTRL算法替换逆运算过程后,计算并更新所述LinUCB算法每个臂的参数。
[0026]一种资源配置装置,应用于Kubernetes,包括:
[0027]参数获取模块,用于获取目标服务的资源状态参数;
[0028]资源分配信息获取模块,用于利用bandit算法,对所述资源状态参数进行计算,得到资源分配信息;
[0029]资源分配模块,用于利用所述资源分配信息,对所述目标服务进行资源分配。
[0030]一种电子设备,包括:
[0031]存储器,用于存储计算机程序;
[0032]处理器,用于执行所述计算机程序时实现上述资源配置方法的步骤。
[0033]一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述资源配置方法的步骤。
[0034]应用本申请实施例所提供的方法,Kubernetes获取目标服务的资源状态参数;利用bandit算法,对资源状态参数进行计算,得到资源分配信息;利用资源分配信息,对目标服务进行资源分配。
[0035]由于资源分配,可以通过采集响应的数据来进行配置评估。因而,为了更快更好的进行资源分配,在本申请中采用bandit算法来进行资源分配计算。也就是说,可在需要进行资源分配的情况下,直接获取目标访问的资源状态参数,然后直接利用bandit算法,计算出目标服务对应的资源分配信息,然后利用该资源分配信息对目标服务进行资源分配即可。由于bandit算法可以实现在线优化,也可以快速响应,因而基于bandit算法计算出的资源分配信息进行资源配置,可以积极应当在线推理服务的冷启动的情况,在线业务特征维度升高、降低导致的计算复杂度变化的情况。
[0036]相应地,本申请实施例还提供了与上述资源配置方法相对应的资源配置装置、设备和可读存储介质,具有上述技术效果,在此不再赘述。
附图说明
[0037]为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038]图1为本申请实施例中一种资源配置方法的实施流程图;
[0039]图2为本申请实施例中一种资源配置方法的实施示意图;
[0040]图3为本申请实施例中一种资源配置装置的结构示意图;
[0041]图4为本申请实施例中一种电子设备的结构示意图;
[0042]图5为本申请实施例中一种电子设备的具体结构示意图。
具体实施方式
[0043]为了使本
的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0044]请参考图1图1为本申请实施例中一种资源配置方法的流程图;该方法可应用于如图2所示的Kubernetes中,图2中的envoy即高性能数据和服务代理软件;SVC(Switching Virtual Circuit),即交换虚拟电路,信息包交换虚拟线路(节点之间只在需要传送数据时才建立逻辑连结)面向连接的网络中;Pod,多个容器打包起来一起运行,这个整体即Pod。
[0045]该方法包括以下步骤:
[0046]S101、获取目标服务的资源状态参数。
[0047]Linux容器:是一种内核轻量级的操作系统层虚拟化技术,里面包含了所有让应用程本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种资源配置方法,其特征在于,包括:Kubernetes获取目标服务的资源状态参数;利用bandit算法,对所述资源状态参数进行计算,得到资源分配信息;利用所述资源分配信息,对所述目标服务进行资源分配。2.根据权利要求1所述的资源配置方法,其特征在于,所述得到资源分配信息之后,还包括:利用所述资源分配信息,对与所述目标服务的相似服务进行初始化资源配置。3.根据权利要求1所述的资源配置方法,其特征在于,所述获取目标服务的资源状态参数,包括:获取所述目标服务的实时流量、处理器使用率、存储设备占用率、计算设备温度、加速卡计算能力值。4.根据权利要求1所述的资源配置方法,其特征在于,利用所述资源分配信息,对所述目标服务进行资源分配,包括:参照所述资源分配信息,对所述目标服务的CPU核心数量、加速卡数量、QPS、资源阈值进行设置或调整。5.根据权利要求1至4任一项所述的资源配置方法,其特征在于,利用bandit算法,对所述资源状态参数进行计算,得到资源分配信息,包括:利用LinUCB算法,对所述资源状态参数进行计算,得到所述资源分配信息。6.根据权利要求5所述的资源配置方法,其...

【专利技术属性】
技术研发人员:王超
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1