The invention discloses a deep Q neural network anti-interference model and an intelligent anti-interference algorithm. The model is that a group of transmitters and receivers communicate with one user, one or more jammers interfere with the user's communication, and the spectrum waterfall diagram of the receiver is used as the input state of learning to calculate the frequency and time domain characteristics of the interference. The algorithm is as follows: Firstly, the corresponding Q-value table is fitted by deep Q-neural network; secondly, the user selects a strategy according to probability, trains according to the return value of the strategy and the next environmental state, and updates the network weight and frequency selection strategy; when the maximum number of cycles is reached, the algorithm ends. The model of the invention is complete, the physical meaning is clear, the design algorithm is reasonable and effective, and the anti-interference scene based on the deep reinforcement learning algorithm can be well depicted.
【技术实现步骤摘要】
一种深度Q神经网络抗干扰模型及智能抗干扰算法
本专利技术属于无线通信
,特别是一种深度Q神经网络抗干扰模型及智能抗干扰算法。
技术介绍
由于无线通信环境的开放性,无线通信系统极易遭受恶意干扰的攻击。此外,由于人工智能技术的飞速发展,使得干扰智能化水平不断提高,未来的通信干扰将呈现“波形灵巧”、“决策智能”等典型特点,使得传统抗干扰技术(如跳频和扩频)的抗干扰能力明显下降,甚至完全丧失,给无线通信系统或网络的稳定和安全带来极大的挑战。因而,迫切需要研究更加高效的抗干扰方法。针对新型的干扰环境特性,引入人工智能技术将是一种可选的方案。用户采用各种智能学习的方法,对干扰波形样式、信号构成和决策规律等进行有效的分析,并以此为基础智能地选取对抗决策,将有效地提升其抗干扰能力。考虑到干扰环境的动态特性,强化学习成为研究智能抗干扰问题最优决策的一种热门工具(参考文献:C.J.C.H.Watkins,etal.,“Q-learning,”Mach.Learn.,,vol.8,pp.279-292,1992)。然而,它无法拓展到状态决策空间庞大的应用环境。
技术实现思路
本专利技术的目的在于提供一种深度Q神经网络抗干扰模型及智能抗干扰算法,很好地刻画基于深度强化学习算法的抗干扰场景。实现本专利技术目的的技术解决方案为:一种深度Q神经网络抗干扰模型,对该模型做如下刻画:一组发射端和接收端对为一个用户,一个用户进行通信,一个或多个干扰机对用户通信实施干扰;在动态未知环境中,将接收端的频谱瀑布图作为学习的输入状态,计算干扰的频域和时域特征,最终获取干扰的策略,并采用深度Q神经网 ...
【技术保护点】
1.一种深度Q神经网络抗干扰模型,其特征在于,对该模型做如下刻画:一组发射端和接收端对为一个用户,一个用户进行通信,一个或多个干扰机对用户通信实施干扰;在动态未知环境中,将接收端的频谱瀑布图作为学习的输入状态,计算干扰的频域和时域特征,最终获取干扰的策略,并采用深度Q神经网络对Q函数进行拟合,作为该模型的决策依据。
【技术特征摘要】
1.一种深度Q神经网络抗干扰模型,其特征在于,对该模型做如下刻画:一组发射端和接收端对为一个用户,一个用户进行通信,一个或多个干扰机对用户通信实施干扰;在动态未知环境中,将接收端的频谱瀑布图作为学习的输入状态,计算干扰的频域和时域特征,最终获取干扰的策略,并采用深度Q神经网络对Q函数进行拟合,作为该模型的决策依据。2.根据权利要求1所述的深度Q神经网络抗干扰模型,其特征在于,用户接收端的信干噪比SINR表示为:公式中(1)中,ft表示用户在代理指导下所选频率,t表示当前时刻;表示用户的功率,U(f)和bu分别表示用户的功率谱密度和基带信号带宽,gu表示用户发送端到接收端的信道增益,gj表示干扰到用户接收端的信道增益,ftj表示干扰选择的干扰频率,表示干扰的功率谱密度函数,n(f)表示噪声的功率谱密度函数;此外,用βth表示成功传输所需要的SINR门限,定义归一化门限如公式(2)所示:在接收终端部署了一个代理,该接收终端的功率谱密度函数如式(3)所示:其中,j=1,…,J表示干扰;模型中的离散频谱采样值定义为:其中,Δf表示频谱分辨率;i表示采样数,S(f+fL)为式(3)所述功率谱密度函数、f表示采样频率、fL为所选频率的下界;代理通过频谱向量st={st,1,st,2,...,st,N}决定传输频率,并通过可靠链路通知发送端;st,N为t时刻所决定的第N段传输频率。3.根据权利要求1所述的深度Q神经网络抗干扰模型,其特征在于,所述的在动态未知环境中,将接收端的频谱瀑布图作为学习的输入状态,计算干扰的频域和时域特征,最终获取干扰的策略,具体如下:在动态未知的通信环境中,模型中的抗干扰问题建模为马尔科夫决策过程,该环境存在的复杂干扰模式与历史信息有关,因此环境状态定义为St={st,st-1,...,st-T+1},其中,T表示回溯的历史状态数目,St表示一个T×N的二维矩阵,由St矩阵构建出频谱瀑布图。4.根据权利要求3所述的深度Q神经网络抗干扰模型,其特征在于,所述的环境状态中,S∈{S1,S2,...}表示当前的传播环境状态,a∈{f1,f2,...,fK}是用户的频率选择策略,P(S′|S,a)表示用户的频率选择策略a由状态S变为状态S′的转移概率;对于立即回报r定义为:其中,λ表示因状态改变带来的代价,at表示t时刻的信道选择动作。5.一种基于深度Q神经网络抗干扰模型的智能抗干扰算法,其特征在于,包括以下步骤:步骤1,初始化:给定ε=1,随机权重θ,感知初始环境S1,通过深度...
【专利技术属性】
技术研发人员:王金龙,徐煜华,刘鑫,徐逸凡,李洋洋,赵磊,冯智斌,
申请(专利权)人:中国人民解放军陆军工程大学,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。