基于生物正负反馈的有人机/无人机共融区域搜索控制方法技术

技术编号:38766596 阅读:8 留言:0更新日期:2023-09-10 10:39
本发明专利技术公开了一种基于生物正负反馈的有人机/无人机共融区域搜索方法,包括:步骤一,建立有人机无人机异构集群空间模型;步骤二,基于模型预测控制的有人机无人机集群控制;步骤三,建立基于刺激响应的生物启发神经网络环境模型;步骤四,建立无人机的决策模型并且设置相应的效能函数;步骤五,基于模型预测控制模型建立滚动鸽群优化模型策略;步骤六,建立基于时间戳同步机制的多无人机信息融合策略;步骤七,输出生物正负反馈模型预测控制的有人机无人机共融区域搜索结果图。该方法旨在未知目标和环境信息的条件下,有人机通过集群空间状态指令引导无人机通过生物激发抑制模型在环境未知的情况进行区域搜索,提高搜索效率和环境自适应性。环境自适应性。环境自适应性。

【技术实现步骤摘要】
基于生物正负反馈的有人机/无人机共融区域搜索控制方法


[0001]本专利技术公开了一种基于生物正负反馈的有人机/无人机共融区域搜索控制方法,属于人机混合集群自主搜索控制


技术介绍

[0002]近年来,无人机发展迅速,作为新型作战力量,已经从传统的侦察监视、水文气象等信息支援和信息保障领域,不断地渗透到各行各业当中,在跟踪、定位、遥控、遥测和数字传输方面能够承担着更加重要的任务。
[0003]通常无人机协同区域搜索问题是弱智能体之间的协同,而有人机/无人机协同区域搜索是强智能体和弱智能体之间的协同,传统的无中心分布式控制模式,需要无人机具有很强的独立计算、分析和决策能力和自主控制能力。这种策略在当下无人机的自主能力不高的情况下是难以现实的。考虑有人机位于集群空间状态的核心对其忠诚僚机的无人机进行指令控制,实现一名操作员对多架无人机的异构集群。虽然无人机技术在不断的完善,但是无人机仍存在着“固有缺点”,在进行单机作战的时候还不能满足高动态对抗的自主能力条件,且面临着很大的危险。因此,具备简洁高效的人在回路中进行干预控制,通过指令控制的有人机/无人机作战平台是实现协同作战的基础。
[0004]无人机协同区域搜索因其及时发现未知区域内的待救援目标,为后续救援人员提供目标位置,已经成为重要的研究内容。无人机的区域覆盖搜索算法,现多采用启发式的算法进行求解。常见的有基于启发式的覆盖算法、基于信息素的多无人机覆盖算法以及基于蚁群、粒子群等群智能算法的多无人机覆盖算法。然而,这些算法能在一定程度上提升覆盖率,但是算法的计算量比较大,且受群体数量众多的影响,没有充分实现群体之间互相分工合作的分布式特点,因此需要确定无人机之间的交互规则和交互方式,使得无人机群能够快速有效的创建信息完备的地图。为此,一种新的基于生物启发神经网络搜索模型被引入去表示覆盖过程中的环境状态信息,这种激发与抑制的生物正负反馈模型在区域覆盖的时候能使得无人机在未知区域中快速与环境和无人机群之间进行交互,较完整的利用和创建地图信息。刺激响应模型是一种基于生物学启发的计算模型,用于描述复杂系统中个体的集体行为,该模型以蚂蚁群营为例,将蚂蚁的信息获取,传递和利用过程抽象为一个具有四个元素的简单模型:信息源、信息素、反馈机制和临界阈值。这个模型揭示了群体行为的产生机制,即通过个体之间的信息传递和调节,实现整体的协调和适应性。
[0005]针对无人机异构集群在离散空间下的控制过程,经典控制方法在实际工程中,由于较难处理非线性、多约束、不确定和时变的控制系统,故而往往难以取得令人满意的结果。模型预测控制(Model Predictive Control,MPC)方法是基于模型的预测、滚动优化以及前馈

反馈的控制结构在每一个离散时间,根据获得的当前测量信息,求解一定时域范围内的优化解,并通过得到的控制序列的第一元素作用于被控对象;在下一个采样时刻,重复上述过程,用新的测量值作为此时预测系统未来动态的初始条件,刷新问题进行求解。
[0006]综上所述,为了在未知目标和环境信息的条件下,有人机通过集群空间状态指令
引导无人机通过生物激发抑制模型在环境未知的情况进行区域搜索,提高搜索效率和环境自适应性成为现有技术亟待解决的问题。

技术实现思路

[0007]针对现有技术存在的问题,本专利技术提供了一种基于生物正负反馈的有人机/无人机共融区域搜索方法,其目的是为了在未知目标和环境信息的条件下,有人机通过集群空间状态指令引导无人机通过生物激发抑制模型在环境未知的情况进行区域搜索,提高搜索效率和环境自适应性。
[0008]本专利技术的一种基于生物正负反馈的有人机/无人机共融区域搜索控制方法,包括:
[0009]步骤一:搭建有人机/无人机异构集群空间模型
[0010]基于每架无人机配置的空速、航向与航迹三通道自动驾驶仪中所包含三个平移自由度与两个旋转自由度,建立无人机的等效二阶系统动力学模型,利用无人机在大地坐标系下的个体状态变量,以及无人机与有人机之间的空间构型建立集群坐标系下的集群空间状态模型。
[0011]步骤二:基于模型预测控制的有人机/无人机集群控制
[0012]以集群空间状态的位置误差和速度误差为基础建立状态空间方程,并采用模型预测控制进行控制。
[0013]步骤三:建立基于刺激响应的生物启发神经网络环境模型
[0014]通过无人机的视场角范围、周围关联神经元的数量、环境因素产生的阈值效应模型以及栅格地图环境信息的抑制和激发建立环境模型。
[0015]步骤四:搭建无人机的决策模型并且设置相应的效能函数
[0016]无人机的决策模型主要由无人机移动角度为控制输入建立的,并通过对具有覆盖神经元活性值收益、转弯角度以及威胁碰撞来设置覆盖搜索效能函数。
[0017]步骤五:基于模型预测控制模型建立滚动鸽群优化模型策略
[0018]根据栅格地图的神经活性值计算出搜索代价函数的值,在预测区间内通过对L步进行预测,在多次L步的预测过程中,需要对搜索效益最大的一次预测进行挑选,建立滚动鸽群优化模型。
[0019]步骤六:建立基于时间戳同步机制的多无人机信息融合策略
[0020]利用每架无人机的生物栅格神经元活性值地图和时间戳地图来同步多无人机之间的信息融合。
[0021]步骤七:输出生物正负反馈的有人机/无人机共融区域搜索控制结果图
[0022]通过判断迭代时间是否达到最大迭代时间,如果达到,则跳出循环,输出有人机/无人机模型预测控制结果以及生物正负反馈搜索神经元活性值地图,否则,继续进行迭代优化过程,对整片区域进行搜索。
[0023]上述方案进一步的所述步骤一的搭建有人机/无人机异构集群空间模型为:
[0024][0025]式中:[x1,x2,x3,y1,y2,y3,z1,z2,z3]分别表示3架无人机个体状态变量在大地坐标系下的位置坐标,[χ1,χ2,χ3,γ1,γ2,γ3]表示3架无人机个体在大地坐标系下的平移和旋转姿态,[x
c
,y
c
,z
c

c

c
]表示集群空间{C}相对于大地坐标系下的参数值,也就是有人机在空间中的位置以及平移、旋转姿态,此处的下标c代表集群中心的含义,(χ
c1

c2

c3
)和(γ
c1

c2

c3
)表示无人机个体在集群坐标系下的旋转姿态变量,{p,q,α,β}的值决定了无人机集群的构型,p,q表示的是控制集群构型前向跟随距离的变量,α表示的是集群俯仰
指令角,β表示的是控制集群构型横向跟随距离的变量,g1,g2...,g
15
代表着无人机个体状态变量r与集群空间状态变量c内部变量的函数关系,(h,l,d)表示计算过程的中间向量,(p
c<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于生物正负反馈的有人机/无人机共融区域搜索控制方法,其特征在于,包括:步骤一:搭建有人机/无人机异构集群空间模型基于每架无人机配置的空速、航向与航迹三通道自动驾驶仪中所包含三个平移自由度与两个旋转自由度,建立无人机的等效二阶系统动力学模型,利用无人机在大地坐标系下的个体状态变量,以及无人机与有人机之间的空间构型建立集群坐标系下的集群空间状态模型;步骤二:基于模型预测控制的有人机/无人机集群控制以集群空间状态的位置误差和速度误差为基础建立状态空间方程,并采用模型预测控制进行控制;步骤三:建立基于刺激响应的生物启发神经网络环境模型通过无人机的视场角范围、周围关联神经元的数量、环境因素产生的阈值效应模型以及栅格地图环境信息的抑制和激发建立环境模型;步骤四:搭建无人机的决策模型并且设置相应的效能函数无人机的决策模型主要由无人机移动角度为控制输入建立的,并通过对具有覆盖神经元活性值收益、转弯角度以及威胁碰撞来设置覆盖搜索效能函数;步骤五:基于模型预测控制模型建立滚动鸽群优化模型策略根据栅格地图的神经活性值计算出搜索代价函数的值,在预测区间内通过对L步进行预测,在多次L步的预测过程中,需要对搜索效益最大的一次预测进行挑选,建立滚动鸽群优化模型;步骤六:建立基于时间戳同步机制的多无人机信息融合策略利用每架无人机的生物栅格神经元活性值地图和时间戳地图来同步多无人机之间的信息融合;步骤七:输出生物正负反馈的有人机/无人机共融区域搜索控制结果图通过判断迭代时间是否达到最大迭代时间,如果达到,则跳出循环,输出有人机/无人机模型预测控制结果以及生物正负反馈搜索神经元活性值地图,否则,继续进行迭代优化过程,对整片区域进行搜索。2.根据权利要求1所述的基于生物正负反馈的有人机/无人机共融区域搜索控制方法,其特征在于:所述步骤一的搭建有人机/无人机异构集群空间模型为:
式中:[x1,x2,x3,y1,y2,y3,z1,z2,z3]分别表示3架无人机个体状态变量在大地坐标系下的位置坐标,[χ1,χ2,χ3,γ1,γ2,γ3]表示3架无人机个体在大地坐标系下的平移和旋转姿态,[x
c
,y
c
,z
c

c

c
]表示集群空间{C}相对于大地坐标系下的参数值,也就是有人机在空间中的位置以及平移、旋转姿态,此处的下标c代表集群中心的含义,(χ
c1

c2

c3
)和(γ
c1

c2

c3
)表示无人机个体在集群坐标系下的旋转姿态变量,{p,q,α,β}的值决定了无人机集群的构型,p,q表示的是控制集群构型前向跟随距离的变量,α表示的是集群俯仰指令角,
β表示的是控制集群构型横向跟随距离的变量,g1,g2...,g
15
代表着无人机个体状态变量r与集群空间状态变量c内部变量的函数关系,(h,l,d)表示计算过程的中间向量,(p
c
,p1,p2,P
c
,P1,P2)代表的是计算过程中坐标点;所述步骤二基于模型预测控制的有人机/无人机集群控制包括U
k
=[u(k|k),u(k+1|k),...,u(k+i

1|k),u(k+N

1|k)]
T
ꢀꢀꢀꢀꢀꢀ
(12)其中,k表示的是采样时刻,u(k)为输入向量;所述步骤三建立基于刺激响应的生物启发神经网络环境模型包括:基本的刺激响应模型其中,i,j是分别表示无人机和神经元的个数,x
j
为生物神经元j的刺激程度,为无人机i的响应阈值,x
k
为神经元j相关联的其他神经元的刺激程度,m为相关联其他神经元的数目,T(x
j
)为此时无人机i执行任务x
j
的概率;和生物启发神经网络模型其中,h是第i个神经元具有联系的关联神经元个数;和分别表示激发和抑制输入;表示激发和抑制输入;为神经元i相邻的神经元j的活性值;均为正值常数,为的衰减速率,和分别为的上下限值,即所述步骤四搭建无人机的决策模型并且设置相应的效能函数包括:无人机r
i
的下一状态可表示为其中,其中,和分别表示位置、速度以及当前移动方向与横轴正方向的夹角,下标ri表示的无人机的序号,为正整数;组合后的协同区域搜索代价函数为f(k)=α1f
E
(k)+α2f
S
(k)+α3f
C
(k)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(29)其中,α1、α2、α3为不同代价函数对应的权重系数,f
E
神经元栅格图激励代价函数、f
S
转弯角度限制代价函数以及f
C
碰撞风险规避代价函数;所述步骤五基于模型预测控制模型建立滚动鸽群优化模型策略包括:
在预测区间内通过对L步进行预测,并且将每一步的代价函数f累加,得到对所有无人机L步的代价函数值之和表示为每次通过预测L步计算其代价函数值以后,确定此时的控制输入{u
m
(k),u
m
(k+1),u
m
(k+2),...,u
m
(k+L

1)}
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(31)将其中第一个输入值作用于无人机群当中;在多次L步的预测过程中,需要对搜索效益最大的一次预测进行挑选,考虑鸽群优化PIO在参数设计简单、迭代速度快以及全局寻优能力强的特点;选择PIO进行优化求解;步骤六:建立基于时间戳同步机制的多无人机信息融合策略当无人机之间进行信息交互的时候,由于当前的生物栅格神经元活性地图的活性值判断不仅与当前的无人机有关,还与范围内其他无人机的探测得到的活性值有关,因此每架无人机在实施搜索过程不仅要维护一个生物栅格神经元活性值地图还需要维护一个时间戳地图来同步信息交流过程;设时间戳为t
i,c
,表示无人机i对栅格c的最近一次更新的搜索地图更新;步骤七:输出生物正负反馈的有人机/无人机共融区域搜索控制结果图判断迭代时间是否达到最大迭代时间k
max
,如果达到,则跳出循环,输出有人机/无人机模型预测控制结果以及生物正负反馈搜索神经元活性值地图,否则,继续进行迭代优化过程,对整片区域进行搜索。3.根据权利要求1所述的基于生物正负反馈的有人机/无人机共融区域搜索控制方法,其特征在于,所述步骤一中,假设每架无人机配置了空速、航向与航迹三通道的自动驾驶仪,包含三个平移自由度与两个旋转自由度,建立无人机的等效二阶系统动力学模型如下:同时考虑无人机实用性约束:
式中:步骤一中提到的所有i为正整数,指代第i架无人机,为无人机i的三个轴向的速度,V
i
、χ
i
和γ
i
分别为水平速度,航向角和高度变化率,V
ic
、和分别为自动驾驶仪3个回路上的控制输入,其中上标c代表控制的含义,τ
v
,τ
χ
和τ
λ
分别为3个时间常数,V
max
,V
min
,n
max
和γ
max
均大于0,分别为最大速度、最小水平速度、最大横向过载和最大高度变化率,γ
min
为最小高度变化率,且小于0,g为重力加速度取为9.8m/s2;将无人机个体状态变量在大地坐标系下{G}表示为:r=[x1,x2,x3,y1,y2,y3,z1,z2,z3,χ1,χ2,χ3,γ1,γ2,γ3]
T
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)式中:[x1,x2,x3,y1,y2,y3,z1,z2,z3]分别表示3架无人机个体状态变量在大地坐标系下的位置坐标,[χ1,χ2,χ3,γ1,γ2,γ3]分别表示3架无人机个体在大地坐标系下的平移和旋转姿态;建立集群坐标系下{C}的集群空间状态变量如下c=[x
c
,y
c
,z
c

c

c

c1

c2

c3

c1

c2

c3
,p,q,α,β]
T
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)式中:[x
c
,y
c
,z
c

c

c
]表示集群空间{C}相对于大地坐标系下的参数值,也就是有人机在空间中的位置以及平移、旋转姿态,此处的下标c代表集群中心的含义,(χ
c1

c2

c3
)和(γ
c1

c2

c3
)表示无人机个体在集群坐标系下的旋转姿态变量,{p,q,α,β}的值决定了无人机集群的构型,p,q表示的是控制集群构型前向跟随距离的变量,α表示的是集群俯仰指令角,β表示的是控制集群构型横向跟随距离的变量;基于上述无人机个体状态变量r与集群空间状态变量c的选取,建立其运动学转换关系,g1,g2...,g
15
代表着无人机个体状态变量r与集群空间状态变量c内部变量的函数关系,KIN(
·
)代表着这两个变量转换的函数;其中,(h,l,d)表示计算过程的中间向量,(p
c
,p1,p2,P
c
,P1,P2)代表的是计算过程中坐标点;
考虑无人机个体速度变量与集群空间速度变量之间的关系,J
r
表示个体状态变量导数与集群空间状态变量导数之间进行转换的雅克比矩阵;其中,
对式(1)模型中无人机位置进行二阶微分可得相关的二阶系统控制输入如下所述步骤二中,将集群空间状态的位置误差和速度误差表示为e
i
=c
i

c
d
和得到关于误差的离散状态空间方程:即其中,Δt为采样时间,k表示的是采样时刻,u(k)为输入向量,x(k)∈R
n
为系统变量,A,B为系统的系数矩阵;通过该误差的状态空间方程建立模型预测控制模型MPC;为系统在一次迭代过程中产生e(0),控制输入序列在有限的时间内能够让位置误差和速度误差收敛为0;设从k时刻开始,系统的输入为U
k
=[u(k|k),u(k+1|k),...

【专利技术属性】
技术研发人员:段海滨龙泓霍梦真魏晨
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1