面向多辐射源追踪的无人机群飞行轨迹优化方法技术

技术编号:33042768 阅读:37 留言:0更新日期:2022-04-15 09:24
一种面向多辐射源追踪的无人机群飞行轨迹优化方法,包括建立模块、估计模块、匹配模块、定位模块以及追踪模块。建立模块用于建立多约束条件下无人机群轨迹优化问题;估计模块采用深度神经网络得到接收信号强度和距离之间的映射关系;匹配模块采用交互式矩阵生成方法得到无人机与辐射源匹配方案;定位模块采用多球交会定位方法得到辐射源的参考位置;追踪模块采用深度强化学习方法设计无人机群的飞行轨迹优化算法。相对于传统方法,所提方法在平均追踪时间、任务完成率以及收敛速度等指标方面都具有明显的优势。方面都具有明显的优势。方面都具有明显的优势。

【技术实现步骤摘要】
面向多辐射源追踪的无人机群飞行轨迹优化方法


[0001]本专利技术涉及辐射源定位与追踪
,具体涉及一种面向多辐射源追踪的无人机群飞行轨迹优化方法。

技术介绍

[0002]近年来,无人机具有高机动性、按需部署和低成本等先天性的优势,作为移动传感器被广泛应用于定位和追踪系统。此外,相对于单个无人机,无人机群在多任务以及复杂任务场景下具有独特的优势,然而,无人机群也面临着通信交互、任务分配以及轨迹设计等多重挑战。
[0003]无人机之间的通信交互以及任务分配是实现无人机群追踪的一项关键技术,是群体智能领域中的重要研究方向之一。在执行任务之前,根据不同的任务需求,如航迹长度最短,飞行时间最短以及能耗最低等,不同无人机选择的任务也会有所不同。无人机如何将局部的环境感知共享并进行最优的任务分配值得深入研究。
[0004]动态未知环境下无人机群的轨迹优化是一个重大挑战。由于辐射源不断地向环境中辐射电磁信号,因此,无人机可根据接收到的信号强度对辐射源进行追踪,这不仅仅容易实现追踪的目的,而且可以有效地避免自身位置的暴露,可以应用于对有害的辐射源进行数据采集或目标侦察等一些实际的场景。现有研究主要集中于无人机群二维轨迹的优化设计,而三维轨迹的设计与优化更加实际却更具有挑战性,比如说信道环境的复杂性以及动作和状态空间的庞大性。另外,现有研究已经尝试应用强化学习方法于辐射源追踪场景,但是对于无人机群追踪多辐射源目标场景,如何设计有效的算法提升强化学习的收敛速度是一个亟需研究的问题。
[0005]现有的轨迹优化算法很多,包括经典的粒子群算法、模拟退火算法、遗传算法以及蚁群算法等,但是上述算法随机性较强,并且在动态未知、大规模、广域环境条件下无法高效求解。

技术实现思路

[0006]为解决上述问题,本专利技术提供了一种面向多辐射源追踪的无人机群飞行轨迹优化方法,相比于传统算法,所提方法在平均追踪时间、任务完成率以及收敛速度等指标方面都具有明显的优势。
[0007]为了克服现有技术中的不足,本专利技术提供了一种面向多辐射源追踪的无人机群飞行轨迹优化方法的解决方案,具体如下:
[0008]一种面向多辐射源追踪的无人机群飞行轨迹优化方法,包括如下步骤:
[0009]步骤1:提出一个多约束条件下的无人机群飞行轨迹优化问题,构建多约束条件下的无人机群轨迹优化模型;
[0010]步骤2:采用深度神经网络来估计信道模型,得到接收信号强度和距离之间的映射关系;
[0011]步骤3:采用交互式方法生成接收信号强度矩阵,计算出相应的距离矩阵并得到无人机与辐射源匹配方案;
[0012]步骤4:采用多球交会定位方法,结合接收信号强度和距离之间的映射关系计算出辐射源的参考位置;
[0013]步骤5:将原始优化问题转换为马尔科夫决策过程,并将辐射源的位置信息引入强化学习中,设计高效的无人机群飞行轨迹优化算法。
[0014]进一步地,所述步骤1中的提出一个多约束条件下的无人机群飞行轨迹优化问题,构建多约束条件下的无人机群轨迹优化模型,该内容包括:
[0015]考虑多架巡逻无人机协同对多个辐射源目标进行追踪,其中,辐射源的位置是未知且动态变化的。考虑无人机具有辐射源个体识别能力,比如识别辐射源的类别以及辐射源的发射功率等。在此基础上,无人机之间通过交互进行任务分配,即一个无人机只选择一个的辐射源进行跟随;随后,无人机通过接收到的信号强度对辐射源进行搜索,当接收到的信号强度值达到设定的阈值时,即完成了追踪任务。
[0016]考虑有K个辐射源,在t时刻,0≤t≤T,第k个辐射源的位置可以表示为考虑有N(N≥K)个无人机,第n个无人机的位置可以表示为在进行追踪任务之前,无人机按照预定的轨迹在空中进行巡查,第n个无人机的初始位置可以表示为采用时间离散法,将时间段T离散为M个等长的时隙δ
t
,T=Mδ
t
,时隙δ
t
需要足够小以保证在一个时隙内无人机的位置可以近似看作不变。设置集合内无人机的位置可以近似看作不变。设置集合因此,在第m个时隙,第k个辐射源的位置可以表示为无人机n的位置可以表示为一般来说,考虑对指定的区域进行搜索,即一个三维立方体空间R
LU
=[x
L
,x
U

[y
L
,y
U

[z
L
,z
U
],其中L和U分别表示三维空间的最低界限和最高界限。因此,无人机的位置需要满足综上,可以建立以下优化问题一:
[0017][0018]式中,优化目标为所有无人机追踪时间最小化。优化变量一为无人机与辐射源的匹配系数a
n,k
,即一个无人机只对一个辐射源进行追踪;优化变量二为无人机的飞行速度矢量包含飞行的方向和飞行的步长。约束条件C1给出了第n架无人机的飞行时间表达式,如果在第I时刻,无人机首次接收到的信号强度大于等于某一设定的阈值γ,则表示无人机任务完成,计时结束;如果在第I时刻,无人机首次接收到的信号强度小于设定的阈值γ,则继续追踪,直到首次接收到的信号强度大于或等于设定的阈值;约束条件C2表示匹配系数的取值范围为0或者1;约束条件C3表示一个无人机至多与一个辐射源进行匹配,即存在K个匹配对;约束条件C4表示无人机的飞行范围;约束条件C5表示无人机的能量有限,其中E
n,total
表示第n架无人机飞行消耗的总能量,是一个与速度和步长成正相关的函数,E
max
表示每架无人机携带的最大能耗;约束条件C6和C7表示无人机应该满足速度约束,其中V
max
为无人机的最大飞行速度。
[0019]进一步地,所述步骤2中的采用深度神经网络来估计信道模型,得到接收信号强度和距离之间的映射关系包括如下内容:
[0020]考虑通过辐射源识别技术可以识别出辐射源的类型、调制方式以及发射功率等。因此,首先构建虚拟环境来模拟真实环境中的无人机与辐射源,然后虚拟辐射源在虚拟环境中发射信号并随机运动,虚拟无人机在虚拟环境中飞行并同时记录辐射源位置、无人机位置以及无人机处接收到的信号强度大小,因此,可以记录大量的接收信号强度

距离模拟数据对。另外,由于接收信号强度与距离之间的关系是非线性的,为了较好地拟合接收信号强度

距离曲线,此处采取深度神经网络进行训练和估计。所采用的神经网络结构包含输入层,隐藏层和输出层,其中隐藏层包含两个具有50个神经元的Dense层以及两个Dropout层。Dense层采用经典的Relu激活函数,具体表达式如下:
[0021][0022]进一步地,所述步骤3中的采用交互式方法生成接收信号强度矩阵,计算出相应的距离矩阵并得到无人机与辐射源匹配方案,具体包括:
[0023]在进行追踪之前,一个无人机需要选择一个辐射源进行追踪。如果无人机的数量等于辐射源的数量,即N本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向多辐射源追踪的无人机群飞行轨迹优化方法,其特征在于,包括如下步骤:步骤1:提出一个多约束条件下的无人机群飞行轨迹优化问题,构建多约束条件下的无人机群轨迹优化模型;步骤2:采用深度神经网络来估计信道模型,得到接收信号强度和距离之间的映射关系;步骤3:采用交互式方法生成接收信号强度矩阵,计算出相应的距离矩阵并得到无人机与辐射源匹配方案;步骤4:采用多球交会定位方法,结合接收信号强度和距离之间的映射关系计算出辐射源的参考位置;步骤5:将原始优化问题转换为马尔科夫决策过程,并将辐射源的位置信息引入强化学习中,设计高效的无人机群飞行轨迹优化算法。2.根据权利要求1所述的面向多辐射源追踪的无人机群飞行轨迹优化方法,其特征在于,所述步骤1中的提出一个多约束条件下的无人机群飞行轨迹优化问题,构建多约束条件下的无人机群轨迹优化模型,包括:建立多架巡逻无人机协同对多个辐射源目标进行追踪,其中,辐射源的位置是未知且动态变化的;考虑无人机具有辐射源个体识别能力,用于识别辐射源的类别以及辐射源的发射功率;在此基础上,无人机之间通过交互进行任务分配,即一个无人机只选择一个的辐射源进行跟随;随后,无人机通过接收到的信号强度对辐射源进行搜索,当接收到的信号强度值达到设定的阈值时,即完成了追踪任务;具体内容包括:假设有K个辐射源,在t时刻,0≤t≤T,第k个辐射源的位置表示为假设有N个无人机,N≥K,第n个无人机的位置表示为在进行追踪任务之前,无人机按照预定的轨迹在空中进行巡查,第n个无人机的初始位置表示为采用时间离散法,将时间段T离散为M个等长的时隙δ
t
,T=Mδ
t
,时隙δ
t
需要满足在一个时隙内无人机的位置近似看作不变;设置集合在第m个时隙,第k个辐射源的位置表示为无人机n的位置表示为对指定的区域进行搜索,即一个三维立方体空间R
LU
=[x
L
,x
U
]
×
[y
L
,y
U
]
×
[z
L
,z
U
],其中L和U分别表示三维空间的最低界限和最高界限;无人机的位置需要满足建立以下优化问题一:
式中,优化目标为所有无人机追踪时间最小化;优化变量一为无人机与辐射源的匹配系数a
n,k
,即一个无人机只对一个辐射源进行追踪;优化变量二为无人机的飞行速度矢量包含飞行的方向和飞行的步长;约束条件C1给出了第n架无人机的飞行时间表达式,如果在第I时刻,无人机首次接收到的信号强度大于等于设定的阈值γ,则表示无人机任务完成,计时结束;如果在第I时刻,无人机首次接收到的信号强度小于设定的阈值γ,则继续追踪,直到首次接收到的信号强度大于或等于设定的阈值;约束条件C2表示匹配系数的取值范围为0或者1;约束条件C3表示一个无人机至多与一个辐射源进行匹配,即存在K个匹配对;约束条件C4表示无人机的飞行范围;约束条件C5表示无人机的能量有限,其中E
n,total
表示第n架无人机飞行消耗的总能量,是一个与速度和步长成正相关的函数,E
max
表示每架无人机携带的最大能耗;约束条件C6和C7表示无人机应该满足速度约束,其中V
max
为无人机的最大飞行速度。3.根据权利要求2所述的面向多辐射源追踪的无人机群飞行轨迹优化方法,其特征在于,所述步骤2中的采用深度神经网络来估计信道模型,得到接收信号强度和距离之间的映射关系,包括如下内容:首先构建虚拟环境来模拟真实环境中的无人机与辐射源,然后虚拟辐射源在虚拟环境中发射信号并随机运动,虚拟无人机在虚拟环境中飞行并同时记录辐射源位置、无人机位置以及无人机处接收到的信号强度大小,因此,记录大量的接收信号强度

距离模拟数据对;采取深度神经网络进行训练和估计;采用的神经网络结构包含输入层,隐藏层和输出层,其中隐藏层包含两个具有50个神经元的Dense层以及两个Dr...

【专利技术属性】
技术研发人员:丁国如谷江春王海超徐以涛
申请(专利权)人:中国人民解放军陆军工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1