基于深度强化学习的容器云任务调度方法和装置制造方法及图纸

技术编号:44747335 阅读:19 留言:0更新日期:2025-03-26 12:36
本发明专利技术提供了一种基于深度强化学习的容器云任务调度方法,包括:定义容器云任务调度事项;建模为马尔可夫决策模型,包括:以每个任务的任务需求和每个可用节点的当前资源状态作为状态集,将可用节点的集合作为动作集;智能体根据任务的任务需求、可用节点的当前资源状态和任务调度策略,将任务分别调度给某个可用节点;定义奖励函数,用于在智能体将任务调度到可用节点后计算奖励;通过深度强化学习模型对马尔可夫决策模型进行优化,得到优化后的任务调度策略。本发明专利技术还提供一种基于深度强化学习的容器云任务调度装置、存储介质及电子设备。借此,本发明专利技术能够从系统的运行信息中自动学习到预期的调度策略,自动适应变化的环境,而无需依赖专家知识。

【技术实现步骤摘要】

本专利技术涉及人工智能技术和容器资源调度结合的,尤其涉及一种基于深度强化学习的容器云任务调度方法、装置、存储介质及电子设备。


技术介绍

1、随着云计算和容器生态的发展,云原生已成为一种新的计算范式。开发者遵循微服务架构构建定制化应用,将其封装为容器,并提交到云服务器运行。在这种范式下,开发者可以专注于开发和交付微服务,而无需关注底层基础设施。由于微服务架构大大增加了微服务的数量,如何高效管理这些微服务成为一个重要的研究问题。通常,这些微服务由容器编排框架管理和调度。

2、资源调度是管理大型集群中的关键问题。一个好的调度算法可以帮助企业合理地为每个微服务调度资源,提高集群的资源利用率,从而降低企业成本。在工业界和学术界,资源调度问题被认为是np(nondeterministic polynomial,非确定性多项式)难问题。在不同场景中,由于集群的工作负载不同,应用特性也有所不同,加之调度目标的不同,很难设计出通用的调度算法。对于资源调度问题,传统的解决方案是设计启发式算法。然而,启发式算法通常使用固定参数和调度策略,无法适应变化的环境,因而无法本文档来自技高网...

【技术保护点】

1.一种基于深度强化学习的容器云任务调度方法,其特征在于,包括:

2.根据权利要求1所述的基于深度强化学习的容器云任务调度方法,其特征在于,所述任务属性包括所述任务的任务类型、任务需求和/或优先级;所述节点属性包括计算集群中每个所述可用节点的计算能力、资源状态、存储容量和/或网络带宽;所述任务调度策略包括决定如何根据任务需求和节点资源来分配任务以及调度目标;

3.根据权利要求2所述的基于深度强化学习的容器云任务调度方法,其特征在于,所述马尔可夫决策模型表示为(S,A,P,R,γ),其中S表示所述状态集,A表示所述动作集,P表示转移概率,R表示所述奖励函数,γ∈[0...

【技术特征摘要】

1.一种基于深度强化学习的容器云任务调度方法,其特征在于,包括:

2.根据权利要求1所述的基于深度强化学习的容器云任务调度方法,其特征在于,所述任务属性包括所述任务的任务类型、任务需求和/或优先级;所述节点属性包括计算集群中每个所述可用节点的计算能力、资源状态、存储容量和/或网络带宽;所述任务调度策略包括决定如何根据任务需求和节点资源来分配任务以及调度目标;

3.根据权利要求2所述的基于深度强化学习的容器云任务调度方法,其特征在于,所述马尔可夫决策模型表示为(s,a,p,r,γ),其中s表示所述状态集,a表示所述动作集,p表示转移概率,r表示所述奖励函数,γ∈[0,1]是折扣因子,表示对未来奖励的偏好;

4.根据权利要求3所述的基于深度强化学习的容器云任务调度方法,其特征在于,所述mdp建模步骤中将所述可用节点的集合作为动作集包括:

5.根据权利要求4所述的基于深度强化学习的容器...

【专利技术属性】
技术研发人员:叶剑王博荣程爽
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1