【技术实现步骤摘要】
本专利技术涉及无线通信领域,尤其涉及一种基于深度强化学习的联合波束成形和功率分配方法。
技术介绍
1、沉浸式通信业务下行链路传输中的智能波束调控问题近年来受到了广泛的关注。为确保用户能够体验到极高可靠与极低延时的实时交互服务,在沉浸式通信中,快速精准的波束调控技术显得尤为重要。然而,在无法获取完美信道状态信息的条件下,依赖波束扫描在每次传输前对所有用户的服务波束进行搜索时,会带来极高的复杂度。在用户需求时变的情况下,实时决策每个时隙内的波束成形方案也成为了困难。此外,由于波束码本中的波束成形矢量均经过归一化处理,选择波束码字仅决定了波束的指向。为了实现更为精细的资源管理,波束调控往往需要与功率分配技术相结合,以满足用户多样化且时变的传输需求。可以利用基于深度强化学习的方法,将具体优化问题转化为马尔可夫决策过程,通过其强大的探索能力实现波束成形和功率分配方案的优化与设计。然而,面对码本空间庞大且多任务动作网络架构下的学习网络收敛困难的问题,需要设计一些策略来提高动作空间探索效率,降低搜索空间,使得强化学习网络可以收敛。因此,如何设计一种基
...【技术保护点】
1.一种基于深度强化学习的联合波束成形和功率分配方法,其特征在于,该方法包括:
2.根据权利要求1所述的一种基于深度强化学习的联合波束成形和功率分配方法,其特征在于,所述S1具体包括:初始化用户和用户信道,执行波束扫描,每个用户根据其接收到的信号强度,选择信号强度最高的B个波束的索引,作为候选波束集合。
3.根据权利要求1所述的一种基于深度强化学习的联合波束成形和功率分配方法,其特征在于,所述混合近端策略优化网络中,生成策略具体包括:
4.根据权利要求1所述的一种基于深度强化学习的联合波束成形和功率分配方法,其特征在于,所述混合近端
...【技术特征摘要】
1.一种基于深度强化学习的联合波束成形和功率分配方法,其特征在于,该方法包括:
2.根据权利要求1所述的一种基于深度强化学习的联合波束成形和功率分配方法,其特征在于,所述s1具体包括:初始化用户和用户信道,执行波束扫描,每个用户根据其接收到的信号强度,选择信号强度最高的b个波束的索引,作为候选波束集合。
3.根据权利要求1所述的一种基于深度强化学习的联合波束成形和功率分配方法,其特征在于,所述混合近端策略优化网络中,生成策略具体包括:
4.根据权利要求1所述的一种基于深度强化学习的联合波束成形和功率分配方法,其特征在于,所述混合近端策略优化网络中,具体结构为:
5.根据权利要求1所述的一种基于深度强化学习的联合波束成形和功率分配方法,其特征在于,所述传输速率和传输效用计算方法为:
6.根据权利要求5所述的一种基于深度强化学习的联合波束成形和功率分配方法,其特征在于,所述根据状态和网络输出结果得到每个时隙的经验...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。