一种协同计算卸载和资源分配方法及应用组成比例

技术编号：24104411 阅读：45 留言：0更新日期：2020-05-09 15:22

本发明专利技术属于无线通信技术领域，公开了一种协同计算卸载和资源分配方法及应用，通过联合优化协同卸载决策、功率分配、区块链系统的出块大小和出块时间来最大化移动边缘计算的计算速率和区块链系统的吞吐量的加权和，实现两个子系统性能的最优折衷。具体地，首先移动设备的计算任务通过协同通信卸载到MEC服务器上执行，其次采用区块链技术处理自MEC系统的计算卸载交易，同时为了保证集成系统中数据的安全，信任计算模型在协同卸载和块生成过中被考虑。本发明专利技术将这个联合优化问题转化为马尔可夫决策过程问题，并提出了一种高效的基于深度强化学习的卸载决策和资源分配算法。

A method and application of collaborative computing offload and resource allocation

全部详细技术资料下载

【技术实现步骤摘要】
一种协同计算卸载和资源分配方法及应用
本专利技术属于无线通信
，尤其涉及一种协同计算卸载和资源分配方法及应用。
技术介绍
目前，最接近的现有技术：移动边缘计算(MEC)通过将移动设备上的计算任务卸载到MEC服务执行，从而提高移动设备的计算能力，因此是一种非常有前景的技术，其被应用到车联网(VehicleNetworks)，物联网(InternetofThings)和智能城市(SmartCity)等各种领域中。与集中式云计算系统(CloudComputingSystem)相比，MEC系统的分布式结构具有很多优势，包括降低能耗和减少时延。大量的文献已经对MEC的计算卸载和资源分配做了深入的研究，但是，出于以下挑战，这些现有的方法并不适合应用于实际的环境中。一、安全与隐私问题，MEC系统中的安全和隐私是一个具有挑战的问题，如异构边缘节点之间的交互以及跨边缘阶段服务迁移等可能存在安全和隐私泄露隐患。为了解决这个问题，区块链技术被提出。与传统的依赖于可信中央机构的数字分类账方法不同，区块链采用的是社区验证同步跨多个节点复制的分类式账本。区块链可以促进建立可信、安全、分布式的MEC系统。在使能的区块链MEC系统中，MEC服务器不仅要处理自己的任务，还要处理自区块链系统的任务(例如生成块和执行共识过程)，而MEC服务器计算资源有限，很容易引起MEC系统和区块链系统计算资源分配不均衡，这使得系统的设计变的更加复杂。比如，当MEC系统分配较多的计算资源时，区块链系统的计算资源势必会较少，从此将导致次优的系统性能。因此，需...

【技术保护点】
1.一种协同计算卸载和资源分配方法，其特征在于，所述协同计算卸载和资源分配方法包括以下步骤：/n第一步，训练的网络包括一个全局网络和多个本地网络，设置本地网络的个数为W；/n第二步，全局网络用于存储更新的网络模型，本地网络与各自的环境进行交互，得到各自的网络模型；/n第三步，训练过程中全局网络首先将自己的参数同步发送给每个本地网络，本地网络根据所获得的参数与环境交互训练自己的网络，将训练好的网络模型异步传输回全局网络，更新全局网络的参数；/n第四步，分别获得全局网络中actor网络和critic网络的模型，并初始化dθ＝0，dθ

【技术特征摘要】
1.一种协同计算卸载和资源分配方法，其特征在于，所述协同计算卸载和资源分配方法包括以下步骤：
第一步，训练的网络包括一个全局网络和多个本地网络，设置本地网络的个数为W；
第二步，全局网络用于存储更新的网络模型，本地网络与各自的环境进行交互，得到各自的网络模型；
第三步，训练过程中全局网络首先将自己的参数同步发送给每个本地网络，本地网络根据所获得的参数与环境交互训练自己的网络，将训练好的网络模型异步传输回全局网络，更新全局网络的参数；
第四步，分别获得全局网络中actor网络和critic网络的模型，并初始化dθ＝0，dθv＝0；
第五步，每个本地网络同时获得全局网络中actor网络和critic网络参数，即θ′＝0，θ′v＝θv；
第六步，设置时间t0＝t，并且获得当前时刻t的系统状态集S(t)；
第七步，根据策略π(A(t)|S(t)；θ′)获得动作集A(t)；执行动作集A(t)，得到立即奖励Ri(t)和下一时刻的状态集S(t+1)；使得t＝t+1，如果满足条件t-t0＝tmax，则执行第八步，否则跳回执行根据策略π(A(t)|S(t)；θ′)获得动作集A(t)；
第八步，如果S(t)不是终止的状态，那么价值函数通过本地网络的critic网络更新为R＝V(S(t)，θ′v)，否则，critic网络的价值函数表示为R＝0；
第九步，从i＝t-1开始遍历所有的状态空间，并且更新critic网络的价值函数R，表示如下：R＝Ri(t)+γR，其中，γ表示的是折扣因子；
第十步，计算每个本地网络中actor网络的策略梯度；
第十一步，计算每个本地网络中actor网络的累计策略梯度；
第十二步，计算每个本地网络中critic网络的价值梯度；
第十三步，计算每个本地网络中critic网络的累计价值梯度；
第十四步，判断i是否等于t0，如果是，则执行第十五步，如果否，则执行第九步；
第十五步，每个本地网络将训练的网络参数上传给全局网络并更新全局网络的参数；
第十六步，将全局网络更新网络参数再同步发送给每个本地网络，进行下一轮网络训练，从第五步再开始执行，直到收敛，最终得到最优的策略。

...

【专利技术属性】
技术研发人员：裴庆祺，冯杰，于非，
申请(专利权)人：西安电子科技大学，西安西电链融科技有限公司，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人