【技术实现步骤摘要】
内部状态未知的无人集群系统输出同步优化控制方法
[0001]本专利技术涉及无人机控制方法领域,具体涉及内部状态未知的无人集群系统输出同步优化控制方法。
技术介绍
[0002]近年来,专家学者受到自然界生物群集行为的启发将无人集群系统一致性应用于复杂系统协同控制中,无人集群系统一致性问题在智能电网、编队控制、无人机集群等领域有着重要的应用前景。
[0003]对于无人集群系统来说,一致性问题是一个基本现象。所有无人机在一致控制协议的作用下通过信息交换实现相同的状态。对未知的内部状态,现有的相关工作使用可测量的系统输入/输出数据来重构,用输入/输出数据进行重构内部状态时需要用到增广矩阵,而增广矩阵是一个状态不能完全可控的系统,容易导致追踪误差。另一方面,现有的工作较少考虑无人集群系统在执行任务过程中能量消耗问题。
技术实现思路
[0004]本专利技术所要解决的技术问题在于:如何解决现有的研究工作中,较少考虑无人集群系统在内部状态未知的情况下的优化问题,然而在实际中,一方面由于无人机的内部状态不容易测量,另一方面由于无人机算力、存储的有限以及任务的复杂性,所以考虑一种内部状态未知的无人集群系统输出同步优化控制方法。
[0005]本专利技术是通过以下技术方案解决上述技术问题的,本专利技术包括以下步骤:
[0006]S1:根据无人集群系统各个无人机之间的连接情况,构建出所述无人集群系统的拓扑结构及拉普拉斯连接矩阵;
[0007]S2:通过状态估计器估计所述无人集群系统未知的内部状态 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种内部状态未知的无人集群系统输出同步优化控制方法,其特征在于,包括以下步骤:S1:根据无人集群系统各个无人机之间的连接情况,构建出所述无人集群系统的拓扑结构及拉普拉斯连接矩阵;S2:通过状态估计器估计所述无人集群系统未知的内部状态,将所述无人机划分为领导者无人机和追随者无人机,重构无人机的局部状态误差系统,并定义性能函数;S3:采用Q学习算法中的Actor
‑
Critic网络结构分别近似无人机的控制动作和性能函数,采用Critic网络对所述性能函数进行近似处理,Actor网络根据所述性能函数更新无人机的控制动作;S4:Critic网络对Actor网络近似的控制动作进行评价,Actor网络根据Critic网络的评价对控制动作进行调整,整个过程使用梯度下降更新;在训练神经网络参数时采用经验回放策略和目标网络技术,当Actor
‑
Critic网络结构的神经网络参数不再更新时,即获取到近似优化输出一致控制策略。2.根据权利要求1所述的一种内部状态未知的无人集群系统输出同步优化控制方法,其特征在于:步骤S2中的状态估计器如下:其中,W是观测增益矩阵;表示追随者无人机i在k+1时刻的状态观测值,A,B
i
,C为不同的未知常数矩阵;追随者无人机i在k时刻的状态观测值,μ
i
(k)表示追随者无人机i在k时刻的控制输入,y
i
(k)表示追随者无人机i在k时刻的控制输出,表示追随者无人机i在k时刻的控制输出观测值。3.根据权利要求1所述的一种内部状态未知的无人集群系统输出同步优化控制方法,其特征在于:步骤S2中的领导者无人机与追随者无人机采用相对应的领导者动态方程与追随者动态方程进行更新;并根据所述领导者动态方程与追随者动态方程重构得到无人机的局部状态误差系统,基于所述无人机的局部状态误差系统确定性能函数,其中:领导者无人机动态方程表示为:追随者无人机动态方程表示为:其中,x0(k+1)表示领导者无人机在k+1时刻的状态值,x0(k)表示领导者无人机在k时刻的状态值,y0(k)表示领导者无人机在k时刻的控制输出,x
i
(k+1)表示追随者无人机i在k+1时刻的状态值,y
i
(k)表示追随者无人机i在k时刻的控制输出,x
i
(k)表示追随者无人机i在k时刻的状态值,μ
i
(k)表示追随者无人机i在k时刻的控制输入,A,B
i
,C为不同的未知常数矩阵;
无人机的局部状态误差系统重构为:其中,表示追随者无人机i在k时刻的局部状态误差系统,b
i
表示追随者无人机是否能接收领导者无人机的状态信息,b
i
=1表示追随者无人机能够接收领导者无人机的信息,b
i
=0表示追随者无人机不能接收领导者无人机的信息;a
ij
≥0表示追随者无人机i接收追随者无人机j的状态信息情况,a
ij
>0表示追随者无人机i能够接收追随者无人机j的状态信息,a
ij
=0表示追随者无人机i不能接收追随者无人机j的状态信息;N
技术研发人员:纪良浩,张翠娟,杨莎莎,郭兴,于凤敏,于南翔,李华青,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。