【技术实现步骤摘要】
一种基于深度强化学习的无人机中继抗干扰方法
[0001]本专利技术涉及无人机
,尤其涉及一种基于深度强化学习的无人机中继抗干扰方法。
技术介绍
[0002]由于无线通信的广播性质,单架无人机与地面站之间的通信很容易受到地面敌意干扰机的干扰。除此之外,通常单架无人机执行任务时距离地面站较远,路径损耗会很大。在这两个主要因素的影响下,单架无人机与地面站之间的直通链路会受到更加严重的干扰,造成接收信号质量下降、信息误差或者丢失。
[0003]传统的无人机抗干扰方案大多是通过优化发射功率来提高抗干扰性能,但是,当源无人机距离地面站较远时,路径损耗非常大,仅仅通过优化源无人机的发射功率无法实现理想的抗干扰性能。同时,传统的无人机抗干扰方案需要知道具体的信道模型和干扰模型来优化发射功率,这极大的限制了方案在实际场景中的应用效果。
技术实现思路
[0004]本专利技术要解决的技术问题,在于提供一种基于深度强化学习的无人机中继抗干扰方法,可在不知道具体干扰模型和信道模型的情况下,显著提高通信系统的抗干扰性能。
[0005]本专利技术是这样实现的,一种基于深度强化学习的无人机中继抗干扰方法,包括:
[0006]步骤1、搭建无人机协作通信网络,包括地面节点、源无人机、中继无人机、智能干扰机和固定干扰机,地面节点与源无人机之间通过中继无人机转发消息,干扰机对地面节点和中继无人机节点同时发射干扰信号,所述通信网络中的无人机节点集定义为U={U
n
},0≤n≤N,U0为源无人机节 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度强化学习的无人机中继抗干扰方法,其特征在于:包括:步骤1、搭建无人机协作通信网络,包括地面节点、源无人机、中继无人机、智能干扰机和固定干扰机,地面节点与源无人机之间通过中继无人机转发消息,干扰机对地面节点和中继无人机节点同时发射干扰信号,所述通信网络中的无人机节点集定义为U={U
n
},0≤n≤N,U0为源无人机节点,U
r
为中继无人机节点,1≤r≤N;步骤2、将观察到的当前时隙的状态作为目标Q神经网络的输入,经目标Q神经网络分析后得到所有动作的Q值,根据ε
‑
greedy策略来选择当前时隙的动作,计算当前时隙下的误比特率、信号干扰噪声比、中断率和效益,观察下一个时隙的状态,将经验e存放到经验池中,从经验池中随机抽取若干个历史经验并采用随机梯度下降算法更新Q神经网络参数θ,所述当前时隙的状态包括上一个时隙的发射功率、上一个时隙的误比特率和上一个时隙的信号干扰噪声比,所述动作包括当前时隙的发射功率和当前时隙的中继无人机,所述经验e包括当前时隙的状态、当前时隙的动作、当前时隙的效益和下一时隙的状态;步骤3、依次对划分的时隙执行步骤2中的操作,并在每间隔固定时隙T更新一次目标Q网络的参数令2.如权利要求1所述的一种基于深度强化学习的无人机中继抗干扰方法,其特征在于:在第k个时隙,U0选择一个U
r
,并以p
(k)
的发射功率向U
r
发送消息,U
r
接收到消息之后,计算接收消息的信号干扰噪声比和误比特率并判断传输是否中断,若传输没有中断,U
r
再以固定的中继功率p
r
向地面节点中继消息,地面节点接收到消息之后,计算接收消息的信号干扰噪声比和误比特率并判断传输是否中断,若传输没有中断那么整个通信过程的信号干扰噪声比和误比特率的获取方式如下:方式如下:3.如权利要求2所述的一种基于深度强化学习的无人机中继抗干扰方法,其特征在于:所述“判断传输是否中断”的方式具体为:将信号干扰噪声比与阈值τ比较,若信号干扰噪声比大于所述阈值τ,则判为通信过程没有中断。4.如权利要求3所述的一种基于深度强化学习的无人机中继抗干扰方法,其特征在于:所述中断率的计算公式如下:5.如权利要求2所述的一种基于深度强化学习的无人机中继抗干扰方法,其特征在于:用J1表示智能干扰机,J2表示固定干扰机,所述智能干扰机J1的干扰功率最大为J
max
,干扰功率被量化成Y级,B为干扰功率集,智能干扰机采取动作之后的效益计算公式如下:其中i等于0或1,C
j
表示智能干扰机能耗的权重,I{
·
}代表中断指示...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。