一种基于异构智能体强化学习的认知缓存优化方法技术

技术编号：35000969 阅读：20 留言：0更新日期：2022-09-21 14:50

本发明专利技术公开了一种基于异构智能体强化学习的认知缓存优化方法，包括以下步骤：步骤S101：将用户和SBS作为异构智能体，两类异构智能体同时参与学习；获取N个SBS和K个用户中每一个SBS n和用户k在当前时间帧开始时的环境参数；步骤S102：将每个SBSn和每个用户在当前时间帧开始时的环境参数输入异构MADDPG模型；步骤S103：获取异构MADDPG模型输出的对应每个用户在当前时间帧的内容获取策略和每个SBS的缓存存储策略；步骤S104：按照步骤S101至步骤S103运行得到将放到用户

全部详细技术资料下载

【技术实现步骤摘要】
一种基于异构智能体强化学习的认知缓存优化方法

[0001]本专利技术属于物联网通信
，尤其涉及一种基于异构智能体强化学习的认知缓存优化方法。

技术介绍

[0002]近年来，随着智能移动设备的急剧增长，导致移动数据流量呈现爆炸性增长，海量设备的接入和千倍级流量的增长使无线网络面临着从频谱资源到网络架构的多重挑战。与此同时用户对无线服务的需求也经历了根本的转变，从传统的以连接为中心的通信到现在以内容为中心的通信。无线网络在吞吐量、网络负载、传输时延和服务质量(QoS)等方面都面临着巨大的挑战。
[0003]为了提高频谱利用率，通过认知无线电(CR)实现对授权频带的复用，是一种提升网络容量，降低网络负载的有效手段之一。CR技术具有三种基本功能，分别是频谱感知与分析，频谱分配与管理和频谱切换与移动。在CRNs中有两种类型的网络，一种是拥有授权带宽的PU组成的主网络，另一种是机会性接入SU所在的次级网络，其中SU优先级较低，其频谱复用不会对PU造成干扰，CRNs提供了一个通信范式，即允许未授权的次级网络可以机会性地访问主网络的授权频谱，从而提高了频谱效率。
[0004]随着当前移动通信业务流量的爆炸式增长，而内容站点分布时空不均衡，导致网络传输不堪重负，服务质量难以保证。边缘缓存(Edge
‑
caching)技术作为一种可以显著改善用户体验(QoE)的技术，已经成为学术界和工业界的研究热点，同时也是促使网络模型从“以连接为中心”到“以内容为中心”转变的关键技术之一。
[0005]...

【技术保护点】

【技术特征摘要】
1.一种基于异构智能体强化学习的认知缓存优化方法，其特征在于，基于一种多用户多缓存的CRNs系统，该系统中包括1个主基站，N个具有缓存能力的服务器SBS，K个用户，以及F个文件，每个用户和基站都配备一个全向天线；包括以下步骤：步骤S101：将用户和SBS作为异构智能体，两类异构智能体同时参与学习；获取N个SBS和K个用户中每一个SBSn和用户k在当前时间帧开始时的环境参数，其中n代表中一个的索引，k代表中的一个索引，SBSn是SBS中的每个元素；所述环境参数包括所述每个用户的观测和每个SBSn的观测步骤S102：将所述每个SBSn和每个用户在当前时间帧开始时的所述环境参数输入异构MADDPG模型；步骤S103：获取所述异构MADDPG模型输出的对应每个用户在当前时间帧的内容获取策略和每个SBS的缓存存储策略；其中所述内容获取策略描述为每个用户请求内容所对应的索引，所述缓存存储策略描述为每个SBS为获取最大收益所选择存储内容的比例；步骤S104：按照步骤S101至步骤S103运行得到将放到用户
‑
智能体的经验重放缓冲区，将放到SBS
‑
智能体的经验重放缓冲区；其中，是用户
‑
智能体和SBS
‑
智能体所对应的观测状态融合成的全局状态，是全局动作；表示每个智能体的状态、动作、奖励和下一个状态。2.如权利要求1所述的一种基于异构智能体强化学习的认知缓存优化方法，其特征在于，在步骤104完成之后，根据每个用户
‑
智能体和每个SBS
‑
智能体在当前时间帧所对应的用户访问策略和SBS缓存存储策略及其所对应的奖励来确定每个用户
‑
智能体和每个SBS
‑
智能体在下一时间帧开始时的环境参数；以及根据其下一时间帧开始时的环境参数，重复执行步骤S101至步骤S104，直到所述每个用户
‑
智能体和SBS
‑
智能体的奖励值均达到最大且收敛。3.如权利要...

【专利技术属性】
技术研发人员：高昂，刘恒同，季岑楠，段渭军，
申请(专利权)人：西北工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人