当前位置: 首页 > 专利查询>华侨大学专利>正文

基于强化学习的无人机辅助物联网抗敌意干扰方法和系统技术方案

技术编号:27512827 阅读:63 留言:0更新日期:2021-03-02 18:44
本发明专利技术公开了一种基于强化学习的无人机辅助物联网抗敌意干扰方法,包括:建立抗敌意干扰攻防Stackelberg博弈模型,其中地面传感器节点、无人机和智能干扰机为博弈的三个参与者;推导所述抗敌意干扰攻防Stackelberg博弈模型中的博弈均衡点及其存在条件,所述博弈均衡点包括智能干扰机的最优干扰功率、无人机的最优发射功率、无人机的最优移动距离以及地面传感器节点的最优发射功率;在未知干扰模型的条件下,引入WoLF

【技术实现步骤摘要】
基于强化学习的无人机辅助物联网抗敌意干扰方法和系统


[0001]本专利技术涉及物联网
,特别涉及一种基于强化学习的无人机辅助物联网抗敌意干扰方法和系统。

技术介绍

[0002]利用无人机(unmanned aerial vehicles,UAV)可控的机动性,可以解决物联网(Internet of Things,IoTs)覆盖范围受限的问题,IoTs与UAV的组合可实现更多样化的物联网应用。在一些地理环境复杂的地方,如灾区、高速公路和闹市等,物联网设备中的地面传感器节点(ground sensor nodes,GSN)到基站(base station,BS)的直达链路受损,UAV可以作为中继,辅助地面网络顺利通信。然而,无线电传播的广播性质使得UAV通信易遭受敌意干扰攻击,一旦无线链路被干扰,影响正常通信。
[0003]现有的无人机(unmanned aerial vehicles,UAV)抗敌意干扰方案通常采用单一的飞行轨迹或者跳频等策略,可抵御固定干扰功率的攻击,却对干扰信号强度可变的智能干扰机(Jammer)束手无策。其次,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于强化学习的无人机辅助物联网抗敌意干扰方法,其特征在于:包括:步骤10、建立抗敌意干扰攻防Stackelberg博弈模型,在所述抗敌意干扰攻防Stackelberg博弈模型中地面传感器节点、无人机和智能干扰机为博弈的三个参与者;步骤20、推导所述抗敌意干扰攻防Stackelberg博弈模型中的博弈均衡点及所述博弈均衡点的存在条件,所述博弈均衡点包括智能干扰机的最优干扰功率、无人机的最优发射功率、无人机的最优移动距离以及地面传感器节点的最优发射功率;步骤30、在未知干扰模型的条件下,引入WoLF-PHC算法动态优化地面传感器节点的发射功率、无人机的发射功率和无人机的移动轨迹。2.根据权利要求1所述的方法,其特征在于:所述步骤10具体包括:步骤11、在时隙k内,无人机在初始位置收到地面传感器节点发送的信息,然后以速度直线飞行到目标位置L
(k)
,将信息转发给位于L
B
的基站,智能干扰机对基站实施干扰;步骤12、定义A
i
为功率集,i∈(s,u,j),其中s表示地面传感器节点,u表示无人机,j表示智能干扰机,D为无人机飞行距离动作集,|A
i
|表示功率集中元素的个数,|D|表示动作集中元素的个数;步骤13、地面传感器节点首先以发射功率将信息传给无人机,无人机通过信号功率与飞行轨迹控制策略提高转发质量,无人机设置当前信号发射功率之后控制目标飞行距离飞到和L
B
之间的最优位置转发信息,其中D
u
是无人机的最大可达飞行距离,智能干扰机在地面固定的位置,以功率向基站持续发送干扰信号,降低无人机与基站之间的通信质量;步骤14、将地面传感器节点定为领导者,无人机为副领导者,智能干扰机为追随者,三个参与者的目的均为最大化自己的效用函数,地面传感器节点、无人机和智能干扰机之间的先后行为建模为抗敌意干扰攻防Stackelberg博弈模型。3.根据权利要求2所述的方法,其特征在于:所述步骤20中,推导出的博弈均衡点及所述博弈均衡点的存在条件,具体包括:智能干扰机的最优干扰功率,公式如下:其中,h
s
为地面传感器节点的信道增益,h
u
为无人机的信道增益,h
j
为智能干扰机的信道增益,p
s
为地面传感器节点的发射功率,p
u
为无人机的发射功率,p
j
为智能干扰机的发射功率,C
j
为单位干扰信号功率损耗系数,σ为噪声功率;无人机的最优发射功率,公式如下:
其中,C
u
表示无人机的单位信号功率损耗系数,表示无人机的单位信号功率损耗系数,其他:无人机的最优移动距离,公式如下:其中,D
u
是无人机的最大可达飞行距离,D
B
是无人机起始位置和基站位置之间的欧氏距离,离,离,其他:地面传感器节点的最优发射功率,公式如下:
其中,C
s
表示地面传感器节点的单位信号功率损耗系数,C
r
表示无人机的单位飞行距离损耗系数,D
r
表示系统的参考距离,h
r
表示无人机或者智能干扰机与基站的距离为参考距离D
r
时的参考信道增益。4.根据权利要求3所述的方法,其特征在于:所述步骤30具体包括:步骤31、输入(k-1)时隙无人机的发射功率和移动距离以及智能干扰机的干扰功率,其中,k为当前时隙序号;步骤32、通过WoLF-PHC算法确定地面传感器节点k时隙的发射功率;步骤33、根据所述地面传感器节点k时隙的发射功率,通过WoLF-PHC算法确定无人机k时隙的发射功率和移动距离;步骤33、根据所述地面传感器节点k时隙的发射功率和无人机k时隙的发射功率和移动距离,通过WoLF-PHC算法确定智能干扰机k时隙的最优干扰功率;步骤34、判断是否达到博弈均衡点;若否,令k=k+1,然后返回步骤31;若是,结束步骤。5.一种基于强化学习的无人机辅助物联网抗敌意干扰系统,其特征在于,包括:博弈模型建...

【专利技术属性】
技术研发人员:赵睿张孟杰周洁王培臣
申请(专利权)人:华侨大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1