当前位置: 首页 > 专利查询>复旦大学专利>正文

一种云雾混构环境下基于深度强化学习的服务组合优化部署方法技术

技术编号:31499777 阅读:22 留言:0更新日期:2021-12-22 23:07
本发明专利技术属于计算机领域中的云计算、边缘计算和服务计算技术领域,涉及云雾混构环境下基于深度强化学习的服务组合优化部署方案,具体涉及一种主要在边缘计算场景下基于深度强化学习的应用服务动态优化部署方法,本发明专利技术在用户与运行在各边缘节点之上的服务之间增加智能决策体Agent,让Agent综合当前各个边缘节点之上运行的应用服务,在各时间段内的资源情况和用户请求量,对下一时间段内各服务的访问使用量进行预测,随后调整各服务在边缘节点上的资源使用情况,以此对服务集合在各边缘节点上进行动态服务部署,帮助服务提供商作出各时间段内的优化部署策略,在提升服务质量的同时,节约能耗,节约成本,同时高效利用边缘服务器的系统资源。的系统资源。

【技术实现步骤摘要】
一种云雾混构环境下基于深度强化学习的服务组合优化部署方法


[0001]本专利技术属于计算机领域中的云计算、边缘计算和服务计算
,涉及云雾混构环境下基于深度强化学习的服务组合优化部署方案,具体涉及一种主要在边缘计算场景下基于深度强化学习的应用服务动态优化部署方法。

技术介绍

[0002]据报道,服务部署已成为云计算环境研究的关注热点,目前,在云场景下关于服务部署的若干相关研究显示,在公有云市场云服务提供商中,在云平台接口、定价、云平台功能方面都较分散,其中,特别是对于数据密集型应用中,支撑其计算的服务部件都是相互有数据依赖和逻辑依赖的组件,如何为多个逻辑上是一个整体的服务部件,选择合适的云端资源,选择一个最佳的部署策略,将其部署,使服务之间的计算效率和通信效率在全局部署方案的搜索空间中是较优的,这就是服务部署问题。
[0003]业内知悉,服务部署问题是典型的优化问题,传统的服务部署方案大多基于启发式算法(heuristic algorithm)。启发式算法的提出通常是借鉴了生物界中发现的规律或从生活中总结出来的经验,其目的是在用户可接受的开销下尽可能快的找到组合优化问题中的优质解;常见的启发式算法有遗传算法、蚁群算法、模拟退火法等。
[0004]随着5G技术的发展,接入网络边缘端的移动设备和物联网设备增多,这些接入的移动设备需要使用边缘端服务器上部署的服务提供的功能,但是像如手机等移动设备的接入数量,会随着时间的改变和用户的移动而呈现规律性的变化;基于启发式算法的服务部署方案会将边缘服务上给服务分配额定的资源或者将服务固定,造成难以充分发挥边缘服务器的性能,且资源利用率也不高的缺陷。
[0005]基于现有技术的现状,本申请的专利技术人拟提出一种由多个服务组件逻辑依赖构成的服务组合中寻找一个全局较优的服务部署策略,以有效降低用户服务的平均响应时间和边缘服务器能耗,具体提供一种云雾混构环境下基于深度强化学习的服务组合优化部署方案。

技术实现思路

[0006]本专利技术的目的在于基于现有技术的现状,在云雾混合架构的背景下,提出一种由多个服务组件逻辑依赖构成的服务组合中寻找一个全局较优的服务部署策略,具体提供一种云雾混构环境下基于深度强化学习的服务组合优化部署方案,尤其是一种主要在边缘计算场景下基于深度强化学习的应用服务动态优化部署方法。本专利技术基于深度强化学习DDPG(Deep Deterministic Policy Gradient)算法的思路解决所述优化问题,能够有效降低用户服务的平均响应时间和边缘服务器能耗。
[0007]本专利技术提供了一种主要在边缘计算场景下基于深度强化学习的应用服务动态优化部署方法,本专利技术在用户与运行在各边缘节点之上的服务之间增加智能决策体Agent,让
Agent综合当前各个边缘节点之上运行的应用服务,在各时间段内的资源情况和用户请求量,对下一时间段内各服务的访问使用量进行预测,随后调整各服务在边缘节点上的资源使用情况,以此对服务集合在各边缘节点上进行动态服务部署,帮助服务提供商作出各时间段内的优化部署策略,在提升服务质量的同时,节约能耗,节约成本,同时高效利用边缘服务器的系统资源。
[0008]具体的,本专利技术中,主要针对一个整体设计框架,并针对该设计框架进行展开,对各部分分别进行详细的描述与设计;本专利技术的框架包括:针对云服务实体和雾计算中网络边缘节点实体,设计相应实体模型表述双方对应用规格的配置设置,提出一种云雾混构的服务场景。
[0009]本专利技术中,针对云计算和雾计算混合架构下的应用服务动态优化部署问题,基于深度强化学习算法进行问题建模,提出边缘节点中的服务优化部署的约束条件以及目标函数,同时针对有依赖的服务组合在此场景下应用动态优化策略。本专利技术通过设计有效的服务组合优化部署方案,提高了云雾混构场景下的服务质量,为服务提供商在服务质量和系统能耗之间寻找到了较优的平衡点,提升服务质量的同时,节约了成本。
[0010]更具体的,
[0011]本专利技术的框架包括:针对现实中复杂多变的云雾混构场景,提出了一种易于描述的、接近真实环境的数学模型,提供了云雾混构场景下动态服务部署策略的系统。本专利技术的技术方案包括:
[0012]第一方面:云雾混构场景下动态服务部署的数学建模包括移动边缘计算动态服务部署的问题假设、服务部署策略系统优化目标计算公式;
[0013]移动边缘计算动态服务部署的问题假设是为了让服务部署策略系统更加贴近现实,由服务请求独立假设、服务请求种类假设、服务请求报文长度假设、数据传输实验假设组成;
[0014]服务部署策略系统优化目标计算公式是为了形式化的表示服务部署策略系统的优化目标,由用户请求平均响应时间和服务器能耗计算公式构成。
[0015]第二方面:云雾混构场景下动态服务部署策略的系统包括参数配置模块、服务请求模块、智能体模块、经验采样模块、演员actor神经网络模块、评论家critic神经网络模块;
[0016]参数配置模块,由用户服务请求参数子模块、边缘服务器参数子模块、传输网络带宽参数子模块、DDPG算法超参数子模块构成,分别用于设置用户服务请求相关参数、边缘服务器相关参数、传输网络带宽参数、DDPG算法超参数;
[0017]服务请求模块,用于预处理移动用户在每个时间内对边缘服务器发送的任务请求,并且得到用户服务请求在每个时间段内的种类和数量分布情况以及将用户服务请求拆分为子服务,存储子服务间逻辑依赖关系。
[0018]智能体模块,用于深度强化学习进行迭代计算得到边缘服务部署最优解的智能体。智能体是深度强化学习算法的处理模块,用来协调和调度其他模块;
[0019]经验采样模块,用于根据采样策略,采集深度强化学习算法迭代过程中产生的(状态、动作、回报、下一步状态)四元组;采集的四元组数据用于训练演员Actor神经网络和评论家critic神经网络;
[0020]演员actor神经网络模块,用于学习估值神经网络,找出合适的服务部署方案,优化服务请求的平均时延和边缘服务器的能耗;
[0021]评论家critic神经网络模块,用于学习策略神经网络,评价当前服务请求分布情况下对应的服务部署方案的优劣。
[0022]本专利技术实施方案中,在一种云计算和雾计算同时存在的架构场景下,应用在多个边缘计节点同时存在的情况下,对边缘节点上的特定服务应用进行部署方案的预测选择,同时对服务应用需要的资源进行调整和分配;其中,预测的初始服务部署方案和服务的资源分配调整策略由系统中的资源决策体Agent,完成,智能决策体Agent中的核心预测算法是基于深度强化学习DDPG(Deep Deterministic Policy Gradient)实现;所述的云计算和雾计算混合架构场景下的基于深度强化学习的应用优化部署系统主要集中于如何实现在雾计算场景的边缘节点所在的边缘服务器中,自动,优化部署服务应用;所述方案的实现针对的服务用户主要是云服务提供商,本专利技术在满足用户服务部署需求和服务质量本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种云雾混构环境下基于深度强化学习的服务组合优化部署方法,其特征在于,该方法为一种云计算和雾计算同时存在的架构场景下,在多个边缘计节点同时存在的情况下,对边缘节点上的特定服务应用进行部署方案的预测选择,同时对服务应用需要的资源进行调整和分配的方法,其中,采用系统中的资源决策体Agent完成预测的初始服务部署方案和服务的资源分配调整策略,智能决策体Agent中的核心预测算法基于深度强化学习DDPG(Deep Deterministic Policy Gradient)实现。2.按权利要求1所述的方法,其特征在于,所述的方法中,由基于深度强化学习的应用优化部署系统主要集中于实现在雾计算场景的边缘节点所在的边缘服务器中,自动,优化部署服务应用,服务组合优化部署方案的实现针对的服务用户主要是云服务提供商,在满足用户服务部署需求和服务质量要求的同时,高效利用仅有的边缘服务器资源,减少个边缘节点中的服务器能耗,从宏观上减少服务提供商的资金投入,同时保证达到可以接受的应用性能表现,具体的实现过程如下:(1)提出基于深度强化学习DDPG(Deep Deterministic Policy Gradient)的边缘节点服务部署预测系统设计,包括,设计一套在各边缘服务器之上通用的、功能全面的中间代理架构,其将定时接受各个边缘服务器上的采集器Cavisor,定时发送的边缘服务器在上一时间段内CPU,内存,硬盘存储资源的平均使用率和状态,所述的中间代理架构将各边缘服务器上收集到的输入数据进行整合、清洗和处理,形成输入数据集合,随后将数据集合作为智能决策体Agent的输入数据,智能决策体计算出下一时间段各服务应用的部署策略和资源分配量,随后各边缘服务器上的服务按照策略和资源分配量对服务部署进行调整和资源分配;(2)提出针对所述系统的动态服务部署的数学模型,建立动态服务部署的数学模型,使深度强化学习应用于云雾混构场景下的动态服务部署,其中算法的输入数据采集来源于云服务提供商所运维边缘服务器上的时事采集数据,确保系统能够较好的应用到到真实环境中;建立的动态服务部署的数学模型将实体场景中的各种影响因素进行量化,定义并处理数据的格式,解决场景中算法参数的度量和定义问题;(3)提出边缘计算环境下的服务组合部署模型,基于海量用户的需求使服务应用组合爆发式增多,将部分服务组合部署到离用户近的边缘节点上,建立边缘计算环境下的服务组合部求模型,支持服务组合在边缘节点的部署请求。3.按权利要求1所述的方法,其特征在于,所述方法的整个系统运行流程中,包括,进行动态服务部署:各边缘节点由少量服务器组成,所述少量服务器组成了一个边缘节点;在服务组合生命周期的初始节点,根据用户请求对各服务组合在各边缘节点上进行初始部署,随着用户位置变动,时间和环境因素情况变化,根据上一时间段的服务运行状态和请求情况,对下一时间段的整个服务组合部署策略进行调整,服务分配的资源用量进行调整,解决资源利用率低的问题,提高服务质量,在各边缘节点层之上设计中间代理系统,即是基于深度强化学习DDPG开发的边缘节点服务部署预测系统,也即智能决策体Agent:各边缘节点之上运行着数据采集功能模块,模块定时发送上一时间段边缘节点上各个服务组件的请求情况和资源使用情况给智能决策
体Agent,服务提供商根据时间段为智能决策体设定不同的参数,Agent综合设定的参数和收集到的数据,对数据进行处理,产生输入数据,随后将输入数据输入算法模块进行计算,得到下一时间段推荐的服务部署策略,随后将服务部署策略应用到各边缘节点的服务部署中;解决服务提供商关心的,众多服务组件合理的部署到各边缘节点,在服务器的能耗和服务质量之间寻求动态平衡问题。4.按权利要求2或3所述的方法,其特征在于,所述方法中,适用于智能决策体Agent的输入数据的数据量化和采集工作,由基于深度强化学习DDPG(Deep Deterministic Policy Gradient)的边缘节点服务部署预测系统的采集程序完成;所述的动态服务部署问题,需要将现实中复杂多变的云雾混构场景抽象转换为易于描述的、接近真实环境的数学模型,其中基于以下四个假设,获得问题预定义条件:假设一:不同用户在不同时间段内的请求是相互独立的,即一个用户请求在当前时间段内与另外一个用户的请求没有联系;假设二:用户的服务请求种类为m种,这m种不同的用户请求由n个子服务排列组合构成,即用户的请求种类一共有m种,用户请求由来源于这n个子服务的若干个子服务构成,并且这若干个子服务之间存在逻辑依赖及执行顺序先后关系;例如用户请求A可以拆分为n1->n2->n3子服务,用户请求A先经过n1服务的计算,n1服务计算后的结果再作为n2服务的输入,经过n2服务计算得到的结果作为n3服务计算的输入,最后n3服务计算得到结果并将结果返回给用户;假设三:用户请求的每个阶段过程中的报文的长度是大致相等的,即无论是用户在边缘端发起的请求、用户请求在子服务之间的转发计算、用户请求最终返回边缘端的计算结果,其报文的长度均认为是大致相等的;假设四:数据传输过程中单位长度数据报文的传输时延是固定相等的,假设用户移动设备与边缘服务器之间数据报文的单位传输速度是相等的、边缘服务器与云端中心之间数据报文的单位传输速度也是相等的,边缘服务器与边缘服务器之间传输时延等于零。5.按权利要求2或3所述的方法,其特征在于,所述方法中,所述的在边缘动态服务部署问题中,优化目标主要由两个方面组成,其中,一个是用户请求的平均响应时间,另一个是服务器端能耗的大小;针对不同时间段内不同的用户服务请求数量分布情况和种类分布情况动态地调整边缘服务器端服务资源的配比,达到在当前时间内用户请求的条件下最小的用户平均响应时间和最小的服务器能耗;设定评价移动边缘计算动态服务部署方案的评价标准:包括,用户请求平均响应时间和服务器能耗的大小评价指标,所述评价指标的形式化的定义和说明如下:对于某一个时间段内用户服务请求平均响应时间的计算,采用如下计算公式计算,Ti表示该时间段内单个用户服务请求的响应时间,n表示该时间段内用户请求的总数,单个用户服务请求的响应时间是指在整个服务请求从用户发起请求到用户得到计算结果所消耗的时间,按照服务请求的处理过程将响应时间划分为三个部分:服务请求发起
传输时间、服务请求计算时间、服务请求回传时间,对于单个用户服务请求的响应时间计算,采用如下公式计算:T=T
in
+T
process
+T
out
T
in
为服务请求发起传输时间,表示移动边缘端的用户请求由边缘端设备发送到指定边缘服务器端的传输时间,服务请求发起的过程为移动用户使用边缘端设备发送服务请求数据量大小为D
in
的请求R并通过网络传输到边缘服务器,传输网络的带宽为V
in
,服务请求发起传输时间的计算表达式如下公式所示,T
process
为服务请求计算时间,表示移动边缘计算的用户请求在边缘服务器网络中根据用户请求种类拆分为有逻辑依赖关系的子服务并在边缘服务器之间转发运算的时间,服务请求计算的过程为边缘服务集群接收到数据量大小为D
in
的请求R,然后根据请求的种类将请求R拆分为有逻辑依赖关系的n个子服务,接着各个子服务根据当前各个边缘计算服务器上的服务配比情况在边缘服务器之间进行转发计算并得到最终结果,用户服务请求计算的时间由若干个子服务运算请求时间所构成,t
process_i
为第i个子服务在边缘服务器上运行所需要的时间...

【专利技术属性】
技术研发人员:周峰吕智慧吴杰陈晓伟
申请(专利权)人:复旦大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1