【技术实现步骤摘要】
本专利技术属于通信,尤其涉及一种基于深度强化学习的资源智能联合优化方法。
技术介绍
1、在当今复杂多变的通信环境中,通信网络不仅需要高效地管理和分配通信资源,还必须考虑计算资源的联合分配。通信环境中的动态态势往往是不可预测的,这对决策者提出了更高的要求。他们需要在瞬息万变的情况下做出快速而精准的判断,并制定相应的策略。然而,单靠决策者的智慧与经验,很难确保决策的准确性。因此,引入计算机辅助决策系统成为亟待解决的问题。
2、近年来,随着人工智能技术的迅猛发展,研究者们开始探索如何通过智能算法来辅助决策者进行决策。这不仅能提高决策的科学性和准确性,也能有效减少人力资源的消耗。在此背景下,通信和计算资源的联合分配显得尤为重要,现阶段主要有以下三种常用方式:博弈论方法、启发式算法和人工智能方法。
3、博弈论作为一种研究决策者之间相互作用和竞争关系的数学工具,在通信领域的资源分配问题中得到了广泛应用。近年来随着信息技术的发展,博弈论被逐渐引入到资源的分配中,特别是在信息化通信背景下,博弈论被用于分析双方的资源配置与策略选择
...【技术保护点】
1.一种基于深度强化学习的资源智能联合优化方法,其特征在于,该方法包括如下步骤:
2.根据权利要求1所述的一种基于深度强化学习的资源智能联合优化方法,其特征在于,步骤1中剩余带宽free_bw的计算公式如下所示:
3.根据权利要求1所述的一种基于深度强化学习的资源智能联合优化方法,其特征在于,步骤3采用广度优先算法找到n条简单路径。
4.根据权利要求1所述的一种基于深度强化学习的资源智能联合优化方法,其特征在于,步骤4中的约束条件为:
5.根据权利要求1所述的一种基于深度强化学习的资源智能联合优化方法,其特征在于,步骤5
...【技术特征摘要】
1.一种基于深度强化学习的资源智能联合优化方法,其特征在于,该方法包括如下步骤:
2.根据权利要求1所述的一种基于深度强化学习的资源智能联合优化方法,其特征在于,步骤1中剩余带宽free_bw的计算公式如下所示:
3.根据权利要求1所述的一种基于深度强化学习的资源智能联合优化方法,其特征在于,步骤3采用广度优先算法找到n条简单路径。
4.根据权利要求1所述的一种基于深度强化学习的资源智能联合优化方法,其特征在于,步骤4中的约束条件为:
5.根据权利要求1所述的一种基于深度强化学习的资源智能联合优化方法,其特征在于,步骤5采用d3qn算法在候选路径中...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。