一种基于深度强化学习的容器化微服务编排系统及方法技术方案

技术编号：38500591 阅读：12 留言：0更新日期：2023-08-15 17:08

本发明专利技术提供了一种基于深度强化学习的容器化微服务编排系统及方法，基于本发明专利技术提出的“延迟奖励策略”和“延迟奖励匹配深度Q学习算法”构建的，一共包含五个模块，系统信息获取模块，奖励生成模块，延迟奖励匹配模块，强化学习训练模块，决策模块和两个缓存，临时经验缓存和全局经验缓存。系统信息获取模块用于获取边缘节点环境的状态信息，奖励生成模块用于计算延迟奖励，延迟奖励匹配模块用于解决经验的配对问题，强化学习训练模块用于训练Deep Q

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度强化学习的容器化微服务编排系统及方法

[0001]本专利技术涉及云原生领域，尤其涉及一种基于深度强化学习的容器化微服务编排系统及方法。

技术介绍

[0002]随着万物互联时代的快速到来和无线网络的飞速发展，智能化设施已经得到了广泛普及，新互联网时代下的数据量呈现爆炸式增长，并且达到了ZB级别。现有中心化系统架构已无法支撑快速产生的海量数据的传输、存储和计算，而敏感数据因安全问题也不便传输到中心节点。由此，边缘计算应运而生。边缘计算是指在网络边缘计算来自云服务下行数据以及各边缘设备上行数据的计算模型，其基本思想是将计算任务在接近数据源的计算资源上处理。边缘计算凭借其独特的地理优势，即可以提供高带宽，低时延的服务并且可以保护用户的数据安全和隐私，使其被视为人工智能，5G等领域的关键支撑技术之一。
[0003]边缘计算是将部分云计算的算力下沉到网络的边缘，是对云计算的拓展。云原生通过容器化、微服务化、松耦合化服务，实现基于服务的快速按需应用编排构建，满足快速迭代的需求驱动应用开发模式，使其逐渐成为云计算发展的主流，而微服务技术又是云原生技术的重中之重。在边缘计算中，容器凭借其低开销，部署方便快捷，隔离度高等优点成为边缘计算的必要组件之一，同时它也是云原生下微服务的最佳拍档，微服务往往以容器的形式存在于边缘节点中，即容器化微服务。容器化微服务的部署是云原生的根基，高效的部署微服务对于边缘计算同样重要。和传统的单体集中式架构相比，微服务通过将一个大型单体应用分解为多个小型模块进行部署，这种方法的优势是可以构...

【技术保护点】

【技术特征摘要】
1.一种基于深度强化学习的容器化微服务编排系统，其特征在于：包括：系统信息获取模块，奖励生成模块，延迟奖励匹配模块，强化学习训练模块和决策模块，以及全局经验缓存和临时经验缓存两个缓存；系统信息获取模块，用于获取决策模块做出相应动作后边缘节点环境前后的状态信息；奖励生成模块，用于计算智能体做出动作后得到的延迟奖励R，并将延迟奖励R传输至延迟奖励匹配模块；延迟奖励匹配模块，用于解决延迟奖励R和已存在于临时经验缓存中的<S,A,S'>的匹配问题，其中，S表示当前的状态，A表示当前智能体做出的动作，S'表示智能体做出动作后将要更新到的下一个状态；强化学习训练模块，用于通过全局经验缓存中的完全经验来训练Deep Q
‑
Network；决策模块，用于控制智能体做出相应的动作；临时经验缓存，用于存储智能体做出动作后立即得到的三元组<S,A,S'>；全局经验缓存，用于存储延迟奖励匹配模块匹配成功的四元组<S,A,R,S'>。2.如权利要求1所述的一种基于深度强化学习的容器化微服务编排系统，其特征在于：系统信息获取模块中，将边缘节点环境状态描述为一个向量S＝{q1,q2,...,q
n
,...,q
|N|
}，其中，q
n
表示第n个节点上已经运行的微服务的数量，N表示节点的总数，并将获取到的信息描述为一个三元组<S,A,S'>，S表示当前的状态，A表示当前智能体做出的动作，S'表示智能体做出动作后将要更新到的下一个状态。3.如权利要求1所述的一种基于深度强化学习的容器化微服务编排系统，其特征在于：延迟奖励R＝
‑
T
f
(
·
)，其中，T
f
(
·
)表示为微服务的完成时间。4.如权利要求1所述的一种基于深度强化学习的容器化微服务编排系统，其特征在于：在延迟奖励匹配模块中，通过给三元组<S,A,S'>和延迟奖...

【专利技术属性】
技术研发人员：曾德泽，李跃鹏，朱方帅，高丰，
申请(专利权)人：中国地质大学武汉，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人