当前位置: 首页 > 专利查询>浙江大学专利>正文

基于动态分配延迟目标和优先级调度的共享微服务资源管理方法和装置制造方法及图纸

技术编号:40034986 阅读:14 留言:0更新日期:2024-01-16 18:49
基于动态分配延迟目标和优先级调度的共享微服务资源管理方法和装置,其方法包括:以机器学习模型拟合微服务延时与服务工作负载的线性函数;根据监控收集的数据计算服务的延时和微服务的延时,以两者的相关程度为根据动态计算每个服务调用的所有微服务的延时目标;根据初始化的延时目标为共享微服务分配优先级,并确定共享微服务在每个服务中新的工作负载,使用Linux流量控制工具tc控制请求在共享微服务中的执行顺序;最后根据构建的线性函数、动态分配的延时目标、实时的工作负载计算每个微服务的实例数,由新实例数决定是否扩展微服务。其中共享微服务由于有多个服务调用会产生不同的实例数,取其中最小的实例数。

【技术实现步骤摘要】

本专利技术属于软件开发,尤其涉及一种基于动态分配延迟目标和优先级调度的共享微服务资源管理方法和装置


技术介绍

1、随着云计算技术的飞速发展,如今的微服务架构应用越来越多地以容器的方式部署在云上。得益于云的弹性特性和微服务体量小、可独立部署等特性,微服务架构应用的部署难度被极大的降低,节省了企业应用上线的成本。但为了保障用户应用的运行环境,满足服务水平协议(sla),许多云厂商往往会过度分配峰值资源,导致集群资源的利用率低,并且增加了服务上云的成本。在不过度分配资源的前提下,如何合理地分配每个微服务的资源,保障用户应用不违反服务水平指标(slo)成为了亟待解决的问题。

2、提高资源利用率的常用方法是根据实际的服务工作负载动态的调配资源。而对于微服务架构的应用资源管理而言有两个挑战:服务的不同组件对端到端性能的影响可能存在显著的差异;单个微服务可由多个在线服务共享,而这些服务的工作负载模式和sla要求是不同的;

3、目前,该问题的研究方案主要为:以启发式的方法或机器学习模型的方式建立在一定工作负载下某个服务的端到端时延与其服务链中的微本文档来自技高网...

【技术保护点】

1.基于动态分配延迟目标和优先级调度的共享微服务资源管理方法,其特征在于,包括:

2.根据权利要求1所述的基于动态分配延迟目标和优先级调度的共享微服务资源管理方法,其特征在于,步骤S101所述的监控数据包括微服务应用链路跟踪Trace数据和应用性能指标;所述应用链路跟踪数据用于建立服务的微服务依赖图,以及确定每个微服务的延时和服务端到端延时;所述应用性能指标包括集群的节点CPU、Memory利用率和微服务实例的平均CPU利用率、Memory利用率、工作负载;上述两种数据用于构成拟合微服务延时和工作负载的线性函数的样本数据。

3.根据权利要求1所述的基于动态分配延迟...

【技术特征摘要】

1.基于动态分配延迟目标和优先级调度的共享微服务资源管理方法,其特征在于,包括:

2.根据权利要求1所述的基于动态分配延迟目标和优先级调度的共享微服务资源管理方法,其特征在于,步骤s101所述的监控数据包括微服务应用链路跟踪trace数据和应用性能指标;所述应用链路跟踪数据用于建立服务的微服务依赖图,以及确定每个微服务的延时和服务端到端延时;所述应用性能指标包括集群的节点cpu、memory利用率和微服务实例的平均cpu利用率、memory利用率、工作负载;上述两种数据用于构成拟合微服务延时和工作负载的线性函数的样本数据。

3.根据权利要求1所述的基于动态分配延迟目标和优先级调度的共享微服务资源管理方法,其特征在于,步骤s101所述的离线分析包括:分析trace数据得到服务的端到端延时和每个微服务的延时;将所述监控数据输入离线线性回归模型进行分析,所述线性回归模型为机器学习模型,用于拟合微服务延时和工作负载的线性函数,所述线性函数为

4.根据权利要求1所述的基于动态分配延迟目标和优先级调度的共享微服务资源管理方法,其特征在于,步骤s102所述的动态分配微服务延时目标的方法为:计算服务的端到端延时和每个微服务的延时的相关系数并乘以每个服务的sla延时指标,所述相关系数具体计算为:

5.根据权利要求1所述的基于动态分配延迟目标和优先级调度的共享微服务资源管理方法,其特征在于,步骤s103所述的对微服...

【专利技术属性】
技术研发人员:孙心怡杨国鑫
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1