基于强化学习的低空智联网可信接入与资源分配方法组成比例

技术编号:42978865 阅读:22 留言:0更新日期:2024-10-15 13:15
本发明专利技术公开了一种基于强化学习的低空智联网可信接入与资源分配方法,属于通信网络安全领域,本发明专利技术基于ADS‑B回传信息、负交互次数及计算性能构建各无人机的信誉值,利用区块链存储并更新信誉值。通过观察发明专利技术接入基站的无人机数目、任务所需的计算资源量、基站当前持有的计算资源、无人机信誉值以及历史无人机与基站的负交互次数,基站构建系统状态,并作为强化学习模型的输入。基站根据强化学习模型的输出,选择允许接入的无人机个数及ID、相应的计算资源分配策略及区块大小,提高吞吐量的同时降低任务计算时延、传输时延及负交互次数,从而综合提升低空智联网的可信接入能力和任务计算效率。

【技术实现步骤摘要】

本专利技术涉及通信网络安全,特别涉及一种基于强化学习的低空智联网可信接入与资源分配方法


技术介绍

1、无人机在飞行过程中可能会产生一些计算任务,由于自身计算资源的局限性,无人机可以寻求持有更多计算资源的地面基站的帮助,但是一些恶意无人机可能会对地面基站的资源进行滥用。

2、由于强化学习可以实时观察环境的变化,动态地制定策略以获得最佳结果,对无人机进行接入控制和资源分配,可以很好地避免地面基站的计算资源被滥用的问题而导致的风险,从而提升低空智联网的计算效率和安全性,如何利用强化学习安全和高效的进行接入控制和资源分配,是亟待解决的问题。


技术实现思路

1、本专利技术提供一种基于强化学习的低空智联网可信接入与资源分配方法,利用区块链和强化学习的方法来进行无人机的接入控制和资源分配,降低时延,并提高低空智联网系统安全性的一种基于强化学习的低空智联网可信接入与资源分配方法。

2、本专利技术实施例提供一种基于强化学习的低空智联网可信接入与资源分配方法,包括以下步骤:

<p>3、步骤1)获取本文档来自技高网...

【技术保护点】

1.一种基于强化学习的低空智联网可信接入与资源分配方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,在步骤3)中,基站j构建k时隙的状态向量s(k)包括:

3.根据权利要求1所述的方法,其特征在于,在步骤4)中,策略集定义为a(k)={a1(k),a2(k),a3(k)}∈A,其中,a1(k)代表是否允许无人接入的布尔值集合,a2(k)代表计算资源的分配策略,a3(k)代表生成区块大小的策略,地面基站j将状态向量s(k)分别输入到Q网络和E网络中,Q网络输出当前状态下所有参与节点选择策略的长期折扣期望效益Q(s(k),a(k);θ(k))...

【技术特征摘要】

1.一种基于强化学习的低空智联网可信接入与资源分配方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,在步骤3)中,基站j构建k时隙的状态向量s(k)包括:

3.根据权利要求1所述的方法,其特征在于,在步骤4)中,策略集定义为a(k)={a1(k),a2(k),a3(k)}∈a,其中,a1(k)代表是否允许无人接入的布尔值集合,a2(k)代表计算资源的分配策略,a3(k)代表生成区块大小的策略,地面基站j将状态向量s(k)分别输入到q网络和e网络中,q网络输出当前状态下所有参与节点选择策略的长期折扣期望效益q(s(k),a(k);θ(k)),根据迭代贝尔曼方程进行更新:

4.根据权利要求1所述的方法,其特征在于,在步骤5)中,地面基站j计算效益值的具体步骤为:

5.根据权利要求1所述的方法,其特征在于,在步骤6)中,所述地面基站j评估风险值的具体步骤为:

6.根据权...

【专利技术属性】
技术研发人员:卢晓珍刘俐欣吴启晖
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1