【技术实现步骤摘要】
蜂窝网络上行传输资源协同分配方法及装置
[0001]本专利技术涉及无线通信
,尤其涉及一种蜂窝网络上行传输资源协同分配方法及装置。
技术介绍
[0002]随着计算智能技术的发展,深度强化学习算法已逐渐被应用在移动通信领域,这类算法能够解决动态时变环境下的蜂窝网络上行传输资源优化策略问题。
[0003]柔性动作
‑
评价(Soft Actor
‑
Critic,SAC)算法是一种基于深度强化学习框架的计算智能优化算法,该算法能在最大化系统回报的同时最大化策略的熵,算法因鼓励探索具有很好的稳定性,可为连续区间的策略优化提供有效的解决方案。
[0004]SAC算法是一种典型的离线深度强化学习算法,算法通过从过往的经验中学习而更新神经网络参数,即在训练过程中通过智能体与环境交互产生新的经验元组并存入经验回放池,经验回放池需要收集到足够多的经验元组才能从中抽取小批量进行网络参数的更新。
[0005]然而,算法与环境交互产生经验元组的代价很高。因此,如何减少智能体与环境交互的 ...
【技术保护点】
【技术特征摘要】
1.一种蜂窝网络上行传输资源协同分配方法,其特征在于,包括:基于蜂窝网络中的上行系统数据速率、所述蜂窝网络的公平性指数以及所述蜂窝网络中子信道切换次数,构建所述蜂窝网络中上行传输资源协同分配的初始优化问题模型;确定所述初始优化问题模型对应的收益函数、状态空间以及动作空间,并基于所述收益函数、所述状态空间以及所述动作空间,确定所述初始优化问题模型对应的初始经验元组;基于优化问题的等价性,将所述初始优化问题模型等价转换为目标优化问题模型,并基于所述等价性,对所述初始经验元组进行增广,得到目标经验元组;基于所述目标经验元组,采用柔性动作
‑
评价算法,对所述目标优化问题模型进行求解,得到所述蜂窝网络中的上行传输资源协同分配方案。2.根据权利要求1所述的蜂窝网络上行传输资源协同分配方法,其特征在于,所述等价性基于对称群确定,所述对称群中元素位置的置换基于双行表示。3.根据权利要求2所述的蜂窝网络上行传输资源协同分配方法,其特征在于,所述基于所述等价性,对所述初始经验元组进行增广,得到目标经验元组,包括:将所述初始经验元组中的所述收益函数、所述状态空间以及所述动作空间均作为所述对称群中的元素进行位置置换,生成多个新的经验元组;基于所述多个新的经验元组,对所述初始经验元组实现数据增广,得到所述目标经验元组。4.根据权利要求3所述的蜂窝网络上行传输资源协同分配方法,其特征在于,所述将所述初始经验元组中的所述收益函数、所述状态空间以及所述动作空间均作为所述对称群中的元素进行位置置换的过程为多轮迭代过程,每轮迭代产生的新的经验元组的个数逐渐减少。5.根据权利要求1
‑
4中任一项所述的蜂窝网络上行传输资源协同分配方法,其特征在于,所述状态空间以及所述动作空间的确定过程,包括:获取所述蜂窝网络在不同时隙各子信道对应的占用状态信息、增益信息以及终端剩余能量信息,并基于所述占用状态信息、所述增益信息以及所述终端剩余能量信息,确定所述蜂窝网络在所述不同时隙的状态空间;获取所述蜂窝网络在所述不同时隙各基站的子蜂窝网络对应的发射功率信息、功率转换效率信息以及有效通信时长信息,并基于所述发射功率信息、所述功率转换效率信息以及所述有效通信时长信息,确定所述蜂窝网络在所述不同时隙的动作空间。6.根据权利要求1
‑
4中任一项所述的蜂窝网络上行传输资源协同分配方法,其特征在于,所述基于蜂窝网络中的上行系统数据速率、所述蜂窝网络的公平性指数以...
【专利技术属性】
技术研发人员:秦运慧,张中山,朱超,杜昌澔,高一凡,
申请(专利权)人:北京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。