【技术实现步骤摘要】
本专利技术涉及一种无线信道优化方法,具体的说,涉及了一种基于深度强化学习的多用户无线信道资源分配优化方法。
技术介绍
1、在无线网络中,由于频谱资源有限,多个用户需要通过有限的频谱资源进行通信。这时就需要对有限的频率资源进行合理分配,避免发生资源浪费和信道冲突等问题。因此,信道分配问题成为无线网络中最基本的问题之一。
2、传统上,通信网络中的信道分配问题主要有两个方向,即固定频率信道分配问题和动态频率信道分配问题。这两个问题的基本假设是:每个用户或应用程序需要分配一个独立的无线信道,以便进行通信。
3、深度强化学习(drl,deep reinforcement learning)技术是近年来兴起的一种新型的机器学习技术,是深度学习(dl,deep learning)与强化学习(rl,reinforcementlearning)的结合。以deepmind团队推出的alpha go围棋ai战胜人类顶尖棋手为标志,深度强化学习越来越受到人们的重视。其与传统的深度学习方法——有监督与无监督的学习方法不同,深度强化学习是在
...【技术保护点】
1.一种基于深度强化学习的多用户无线信道资源分配优化方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于深度强化学习的多用户无线信道资源分配优化方法,其特征在于:所述非代表性交互用户在t+1时隙的容忍度Kn-,t+1为:
3.根据权利要求2所述的一种基于深度强化学习的多用户无线信道资源分配优化方法,其特征在于:时隙t开始时,中心云感知所有代表性交互用户在该时隙下的交互数据量、场景更新信息以及容忍度值Kn,t以及所有非代表性交互用户的容忍度值Kn-,t;
4.一种计算机设备,其特征在于,所述计算机设备包括存储器,处理器,
...【技术特征摘要】
1.一种基于深度强化学习的多用户无线信道资源分配优化方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于深度强化学习的多用户无线信道资源分配优化方法,其特征在于:所述非代表性交互用户在t+1时隙的容忍度kn-,t+1为:
3.根据权利要求2所述的一种基于深度强化学习的多用户无线信道资源分配优化方法,其特征在于:时隙t开始时,中心云感知所有代表性交互用户在该时隙下的交互数据量、场景更新信息以及容忍度值kn...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。