移动边缘网络中基于FDQL的多维资源协同优化方法技术

技术编号：32544801 阅读：17 留言：0更新日期：2022-03-05 11:42

现有技术中，移动边缘网络呈现出智能化、多元化、综合化的趋势，使得多维资源最优分配面临诸多挑战。为了提升多维资源优化的精确性，本发明专利技术提出一种移动边缘网络中基于FDQL的多维资源协同优化方法。本方法以最小化MOS为优化目标来构建多维资源分配模型，并设计一种双层的决策方案。首先，底层的基站利用双深度Q学习DDQL进行局部模型训练以获得短周期内最优决策；然后，上层的边缘节点利用联邦深度学习FDQL进行全局模型训练以降低长周期内分布式决策的偏差。实验结果表明，所提算法在降低内容服务时延和提高用户体验质量方面都优于其它方法。其它方法。其它方法。

全部详细技术资料下载

【技术实现步骤摘要】
移动边缘网络中基于FDQL的多维资源协同优化方法

[0001]本专利技术属于通信
，具体是一种移动边缘网络中基于联邦深度强化学习FDQL的多维资源协同优化方法。

技术介绍

[0002]由爱立信发布的移动市场预测报告可知，到2024年5G用户将达到19亿
[1]，急剧增长的数据流量使得有限的频谱资源、计算资源和缓存资源与日益增长的资源需求之间的矛盾日渐加剧。同时，物联网(IoT，Intemet of Things)
[2]、车载网(IoV，Intemet of Vehicles)
[3]的广泛应用增加了网络环境的复杂性。目前，网络通信面临着多元化、综合化、智能化等诸多挑战，加剧了资源管理的难度。为此运营商将部分业务处理和资源调度功能部署到云平台以实现服务性能提升
[4]。
[0003]但是，面对未来100％的全球覆盖率、超大规模的终端设备接入、低于毫秒时延的海量数据传输，依托云计算的传统处理平台面临着巨大的挑战。特别是智能驾驶、虚拟现实(Virtual Reality，VR)、增强现实(Augmented Reality，AR)、超高视频流等新兴业务愈加依赖于高可靠、低时延的实时数据处理能力，而远离用户和终端设备的云中心无法及时处理巨大的应用程序，并且网络阻塞和传输延迟也严重影响了用户体验。将网络资源边缘化和本地化的移动边缘计算(Mobile Edge Computing，MEC)技术
[5
‑
9]是解决上述问题的关键技术之一。
[0004...

【技术保护点】

【技术特征摘要】
1.一种移动边缘网络中基于FDQL的多维资源协同优化方法，在移动边缘计算MEC系统中包括多个基站和一个边缘节点，基站与边缘节点以及邻居基站通信，这些基站和边缘节点具有提供计算和缓存服务的能力；其特征是移动边缘网络中基于FDQL的多维资源协同优化方法的步骤包括：1)构建多维资源分配模型表示频谱和计算源的分配以及缓存更新；2)优化多维资源分配模型；所述步骤1)中，以最小化平均意见得分MOS为优化目标来构建多维资源分配模型；MOS模型为：其中线性模型的参数C
n，1
，C
n，2
使得MOS
n
∈[1，5]，权重因子w
n，1
，w
n，2
分别表示内容获取时延和缓存更新对MOS的影响程度；CA
n
是第n小区内U
n
个用户的内容获取时延，它包括传输时延和计算时延；ps
n
是第n小区内U
n
个用户的内容请求集合中内容流行度之和，基站是根据内容请求集来更新缓存；第n小区为基站n覆盖的范围；第n个小区的MOS
n
分数越高，用户体验质量QoE越高，多维资源优化模型为maxMOS
n
；所述步骤2)中，2.1)对底层的基站利用双深度Q学习DDQL进行局部模型训练以获得短周期内最优决策：2.1.1)以基站n为智能体，将局部资源分配问题建模为一个马尔科夫决策过程MDP；2.1.2并采用DDQL以不断试错方式与环境交互，通过最大化累计奖赏寻找一个最优策略；2.2)对上层的边缘节点利用联邦深度强化学习FDQL进行全局模型训练以降低长周期内分布式决策的偏差：按照时间周期{1，
…
，t，
…
，T，T+1，
…
，t+T，
…
，2T，
…
}进行多维资源协同优化；在t≠kT的短周期内，各基站实施DDQL模型训练来获得本地最优的多维资源分配策略；在第t＝kT个长周期内由边缘节点实施FDQL模型训练来获得全局最优的多维资源分配策略，并反馈给各基站以增强局部DDQL的泛化能力，从而用更优的资源分配策略提升用户内容获取体验。2.根据权利要求1所述的移动边缘网络中基于FDQL的多维资源协同优化方法，其特征是所述步骤2.1.1)中，马尔科夫决策过程MDP表示为一个四元组＜S
n
，A
n
，PR
n
，R
n...

【专利技术属性】
技术研发人员：高志宇，王天荆，沈航，白光伟，田一博，
申请(专利权)人：南京工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人