【技术实现步骤摘要】
一种基于在线无人机航迹规划的辐射源定位方法
[0001]本专利技术涉及无线电监测
,具体涉及一种基于在线无人机航迹规划的辐射源定位方法。
技术介绍
[0002]随着无线电技术和应用的不断发展,无线电用频设备呈现指数增长趋势,不法分子利用无线电技术和设备从事违法犯罪的活动和手段日益趋于多样化,电磁频谱空间日益复杂。因此,快速有效定位非法信源对于及时管控非法用频设备以保障无线电安全至关重要。现有的辐射源定位技术受到地面条件的限制,无法快速地规划路径,无法在短时间内对非法辐射源实现较为准确的定位。
[0003]近年来,基于无人机平台的被动定位技术的逐步发展,无人机因其机动性高、可自主灵活规划航迹成为搜索地面用户辐射源的优良选择。以无人机为载体,采用相关算法规划航迹,虽然操作简单,但是随着信号强度不稳定,无人机往往会偏离最优路径,因此,有必要进一步改进算法,以实现资源的最大化利用。
[0004]专利号为CN115686065A的专利技术中公开了一种基于深度强化学习的无人机动态目标跟踪控制方法,该方法包括:无人机目标跟踪马尔科夫决策过程设计、无人机目标跟踪奖励函数设计、针对性深度神经网络结构设计、基于SAC算法的速度指令感知控制器训练与无人机动态目标控制器的使用。通过端到端一体化控制器,能够简化无人机动态目标跟踪过程,具有鲁棒性强、实时响应速度快和对不同目标运动模式适应能力强的特点。但是随着信号强度不稳定,无人机往往会偏离最优路径。
[0005]专利号为CN114337875A的专利技术中公开了一 ...
【技术保护点】
【技术特征摘要】
1.一种基于在线无人机航迹规划的辐射源定位方法,其特征在于,所述辐射源定位方法包括以下步骤:S1,控制配置有五个全向天线的无人机处于设定的高度,并且无人机通过五个全向天线接收周围的辐射信号,五个全向天线按照顺时针方向依次摆放在无人机上,每一个全向天线到无人机质心的距离相同;S2,利用面向搜索区域最小化的随机游走模型,使无人机搜索全局,该随机游走模型的步长规定为正态随机参量u与标准正态随机参量v的三分之二次方的比值,使随机游走模型的方差随时间呈现指数的关系,飞行路径呈现长短相间的特点;S3,对于无人机搜索辐射源的过程,进行马尔可夫决策过程建模,将无人机在搜索时段内累计的奖励回报值最大作为目标函数,在同一个位置会收到五个方向上大小不同的回报奖励值,回报值与每个全向天线的接收信号强度值有关;利用最优策略学习算法对所述五个全向天线所获取每个方向上的接收信号强度值进行处理,由处理结果决定无人机的状态以及飞行的动作,根据无人机与辐射源的距离差来判断无人机当前位置是否满足算法终止的条件;如果满足条件,则返回非法辐射源的位置信息以及无人机的搜索轨迹信息;如果不满足条件,则返回步骤2,继续搜索并采用五元全向天线接收信号;其中,无人机的状态包括无人机所处位置、无人机速度,以及无人机五个方向上接收信号强度。2.根据权利要求1所述的基于在线无人机航迹规划的辐射源定位方法,其特征在于,步骤S1中,控制配置有五个全向天线的无人机处于设定的高度,并且无人机通过五个全向天线接收周围的辐射信号的过程包括以下步骤:S11,控制配置有五个全向天线的无人机处于设定的高度,并且无人机通过五个全向天线接收周围的辐射信号;S12,将辐射源的空间坐标记作(x
o
,y0,z0),将无人机的质心作为几何中心,无人机的空间坐标记作(x
t
,y
t
,z
t
),并且无人机的坐标随着无人机的移动而发生改变;辐射源目标与无人机之间的距离记作d1:S13,将第i个全向天线所对应的坐标点与无人机质心所在坐标点连线,此条连线与二维坐标系中的x轴所成角度记作第i个天线的坐标为第i全向天线与辐射源目标的距离d2为:S14,构建对数路径损耗模型为:Pi[dB]=P0[dB]
‑
20log10(d2)
‑
ni+GR;其中,Pi[dB]为接收信号强度,单位为dB;P0[dB]为近地参考距离处接收信号强度,单位为dB;20log10(d2)为空间路径损耗,单位为dB;ni为噪声对接收信号强度的影响,是一个均值为0,方差为σ2的正态分布变量;GR是接收信号天线对信号的增益,单位为dB;S15,将Pi[dB]按对数函数取反函数得到接收信号强度的功率。3.根据权利要求1所述的基于在线无人机航迹规划的辐射源定位方法,其特征在于,步
骤S2中,将随机游走模型的步长记作s,步长s为随机变量,设置服从正态分布的随机参量u和v,u~N(0,σ2),v~N(0,1),每一次迭代的步长s计算公式满足下述公式:4.根据权利要求1所述的基于在线无人机航迹规划的辐射源定位方法,其特征在于,步骤S3中,利用最优策略学习算法对所述五个全向天线所获取每个方向上的接收信号强度值进行处理,由处理结果决定无人机的状态以及飞行的动作的过程包括以下步骤:S31,根据无人机的动作和状态,将描述无人机状态和动作的状态值函数记作V(s
t
,a
t
),初始化状态值函数V(s
t
,a
t
),其中s
t
代表无人机在t时刻时的状态,a
t
代表无人机在t时刻位于s
t
状态下的所选动作;设置折扣系数γE[0,1],学习系数α∈[0,1],概率阈值ε∈[0,1],折扣系数Y用来决定未来回报奖励所占的比重,学习系数α用来控制学习速率,概率阈值ε用来决定选择随机动作的概率;将无人机在搜索时段内累计的奖励回报值作为目标函数,根据时刻t的状态对应的目标函数累计值,得出动态规划最优方程:其中V(s
j
)为状态s
j
下得到的状态函数值,p为马尔科夫决策过程中的转移概率;S32,初始化无人机搜索时间t=0,初始化无人机起始状态s0,初始化状态值表,将状态值表记作状态值表用来暂存在某一时刻在可能出现的状态下选择不同动作产生的状态值,表的大小取决于状态空间的大小以及动作空间的大小,将状态值表的大小记作n
s
×
n
A
,其中n
s
表示状态空间中可能的状态数目,n
A
表示动作空间中可能的动作数目;S33,在无人机的当前状态下,利用五个全向天线获取五个方向上的接收信号强度值,并基于各个全向天线接收信号强度值得到对应方向上的回报及...
【专利技术属性】
技术研发人员:黄洋,罗玮凯,张成旺,张亦宁,华雨茜,崔皓禹,陈小敏,后裕琦,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。