【技术实现步骤摘要】
本专利技术涉及通信网络安全,特别涉及一种基于强化学习的低空智联网可信接入与资源分配方法。
技术介绍
1、无人机在飞行过程中可能会产生一些计算任务,由于自身计算资源的局限性,无人机可以寻求持有更多计算资源的地面基站的帮助,但是一些恶意无人机可能会对地面基站的资源进行滥用。
2、由于强化学习可以实时观察环境的变化,动态地制定策略以获得最佳结果,对无人机进行接入控制和资源分配,可以很好地避免地面基站的计算资源被滥用的问题而导致的风险,从而提升低空智联网的计算效率和安全性,如何利用强化学习安全和高效的进行接入控制和资源分配,是亟待解决的问题。
技术实现思路
1、本专利技术提供一种基于强化学习的低空智联网可信接入与资源分配方法,利用区块链和强化学习的方法来进行无人机的接入控制和资源分配,降低时延,并提高低空智联网系统安全性的一种基于强化学习的低空智联网可信接入与资源分配方法。
2、本专利技术实施例提供一种基于强化学习的低空智联网可信接入与资源分配方法,包括以下步骤:
< ...【技术保护点】
1.一种基于强化学习的低空智联网可信接入与资源分配方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,在步骤3)中,基站j构建k时隙的状态向量s(k)包括:
3.根据权利要求1所述的方法,其特征在于,在步骤4)中,策略集定义为a(k)={a1(k),a2(k),a3(k)}∈A,其中,a1(k)代表是否允许无人接入的布尔值集合,a2(k)代表计算资源的分配策略,a3(k)代表生成区块大小的策略,地面基站j将状态向量s(k)分别输入到Q网络和E网络中,Q网络输出当前状态下所有参与节点选择策略的长期折扣期望效益Q(s(k),
...【技术特征摘要】
1.一种基于强化学习的低空智联网可信接入与资源分配方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,在步骤3)中,基站j构建k时隙的状态向量s(k)包括:
3.根据权利要求1所述的方法,其特征在于,在步骤4)中,策略集定义为a(k)={a1(k),a2(k),a3(k)}∈a,其中,a1(k)代表是否允许无人接入的布尔值集合,a2(k)代表计算资源的分配策略,a3(k)代表生成区块大小的策略,地面基站j将状态向量s(k)分别输入到q网络和e网络中,q网络输出当前状态下所有参与节点选择策略的长期折扣期望效益q(s(k),a(k);θ(k)),根据迭代贝尔曼方程进行更新:
4.根据权利要求1所述的方法,其特征在于,在步骤5)中,地面基站j计算效益值的具体步骤为:
5.根据权利要求1所述的方法,其特征在于,在步骤6)中,所述地面基站j评估风险值的具体步骤为:
6.根据权...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。