基于干扰观测器的高阶异质多智能体系统分布式优化方法技术方案

技术编号:38567851 阅读:13 留言:0更新日期:2023-08-22 21:04
本发明专利技术提供一种基于干扰观测器的高阶异质多智能体系统分布式优化方法,涉及控制与信息技术领域。本发明专利技术针对具有匹配和不匹配扰动的高阶异质多智能体系统,设计了有限时间干扰观测器估计扰动,互联系统中采用比例

【技术实现步骤摘要】
基于干扰观测器的高阶异质多智能体系统分布式优化方法


[0001]本专利技术涉及控制与信息
,尤其涉及一种基于干扰观测器的高阶异质多智能体系统分布式优化方法。

技术介绍

[0002]智能体是指具有自主、存储、计算和通信功能的个体。多智能体系统是指包含多个智能体,且个体间能通过与邻居个体进行信息交流,共同协作完成特定目标的系统。多智能体系统采用分布式的控制方法,不需要中心节点(中央控制器),每个个体仅利用自身及邻居的信息进行决策,因而具有通讯代价小、可扩展性好、鲁棒性强等优势。在分布式协调控制的实际应用中,许多控制任务要求多智能体系统满足一些优化指标,从而产生了多智能体系统的分布式优化问题,如传感器网络源点合作定位问题、多机器人系统优化聚集与编队问题、智能电网经济调度问题等。在分布式优化问题中,每个智能体有一个局部代价函数,需要优化的全局代价函数是所有局部代价函数的和。分布式优化的目标是通过局部信息交互,在仅局部代价函数可知的条件下,通过分布式算法,使各个智能体的状态收敛到多智能体系统全局代价函数的最优点。
[0003]在多智能体分布式优化领域,现有研究主要集中在对一阶系统进行分布式控制以实现优化目标,很少涉及具有不匹配扰动和高阶动态的多智能体系统。现实中的大部分控制对象都可以建模为一个非线性系统,在实际的优化任务中,系统通常具有二阶或更高阶的动态,因此对于非线性高阶系统的研究更具有普遍性。另一方面,实际系统不可避免的会受到各种干扰和不确定性的影响,如外部环境干扰、输入通道干扰和参数摄动等。在高阶系统中,干扰可能以异于控制输入的通道进入系统,即不匹配干扰。基于干扰观测器的主动抗干扰控制方法被提出用以解决系统内的不匹配干扰。本专利技术考虑一类在实际应用中存在的情况,如多机器人源搜索问题,多个智能体被放置在一个未知的场内,通过分布式算法搜索源点。这类情况中,智能体无法获得整个场全部位置的场强信息,故其优化器无法使用局部代价函数的全局梯度信息,而只能通过测量当前实时位置的场强来计算所在位置的局部代价函数梯度,这使优化器与跟踪控制器之间产生了反馈回路,形成的互联系统对分析产生了一些挑战。

技术实现思路

[0004]针对现有技术的不足,本专利技术提供一种基于干扰观测器的高阶异质多智能体系统分布式优化方法。相较于以往的研究,本专利技术能够应用于这类问题下更实际的多智能体系统,拓宽分布式控制与优化的应用领域,具有重要的实际应用价值。
[0005]基于干扰观测器的高阶异质多智能体系统分布式优化方法,包括以下步骤:
[0006]步骤1:构造多智能体系统网络拓扑图,其网络拓扑图是无向连通图其中,表示N个节点的集合,表示边的集合,表示邻
接矩阵,表示N
×
N维实数矩阵的集合;所述邻接矩阵中,如果节点i,j之间有边相连,则a
ij
=a
ji
=1,否则a
ij
=a
ji
=0。定义节点i的邻居节点集合为
[0007]步骤2:建立高阶异质多智能体系统的动力学模型,其中第i个智能体的动力学方程如下:
[0008][0009][0010]y
i
=x
i1
[0011]其中,M
i
≥1是第i个智能体的阶数,是系统的状态变量,u
i
是控制输入,与输入不在同一通道,属于不匹配扰动,是匹配扰动,y
i
是输出;各阶干扰d
ik
,k=1,...,M
i
是γ
ik

1阶可导的,且有满足的利普希茨常数
[0012]步骤3:为第i个智能体设计如下有限时间干扰观测器:
[0013][0014][0015][0016][0017][0018][0019]其中,h
ik
=x
i(k+1)
,k=1,...,M
i

1,是数值为正的观测器增益,l=1,...,γ
ik
分别是x
ik
和(d
ik
)
(l

1)
的估计,的估计,是中间变量,sgn(x)是符号函数,当x>0时sgn(x)=1,当x<0时sgn(x)=

1,当x=0时sgn(x)=0,sig
a
(x)=|x|
a
sgn(x),其中0<a<1;
[0020]步骤4:对互联系统采用如下比例

积分分布式优化器:
[0021][0022][0023]其中,是第i个智能体要优化的局部代价函数,p
i
和q
i
是虚拟变量,δ1、δ2、δ3和δ4是数值为正的常数;优化器实现分布式优化的目标,即表示N个节点的集合;
[0024]步骤5:根据高阶异质多智能体系统动力学模型建立如下误差系统模型:
[0025]e
i1
=x
i1

p
i
[0026]e
ik
=x
ik

α
i(k

1)
,k=2,...,M
i
[0027]其中,α
ik
是的x
i
子系统的虚拟控制律,
[0028]步骤6:根据有限时间干扰观测器估计的扰动和优化器产生的优化值,为互联系统设计如下跟踪控制器:
[0029][0030][0031][0032]其中,b
ik
和m
ik
,k=1,...,M
i
是数值为正的常数;
[0033]步骤7:为分布式优化器

跟踪控制器互联系统选取合适的复合李雅普诺夫函数,选取满足稳定性条件的值,实现目标优化。
[0034]采用上述技术方案所产生的有益效果在于:
[0035]本专利技术提供了一种基于干扰观测器的高阶异质多智能体系统分布式优化方法。该方法能够消除高阶异质多智能体系统中不匹配扰动的影响,在不具备全局梯度信息的情况下实现分布式优化目标,在应用中可行性更强。
[0036]与现有技术相比,本专利技术的具体有益技术效果在于:(1)研究对象为高阶系统,更符合实际系统的特性,具有更广的应用范围。(2)通过干扰观测器以前馈的方式补偿系统中存在的扰动,尤其是不匹配扰动,抑制干扰的速度较快,具有更高的应用价值。(3)该方法应用于一类实际场景中,即智能体不需要预先获得代价函数的全局梯度信息,仅通过实时输出的测量梯度即可完成优化目标。
附图说明
[0037]图1为本专利技术实施例提供的分布式优化方法流程图;
[0038]图2为本专利技术实施例中建立的网络拓扑结构示意图;
[0039]图3为本专利技术中实施例中各智能体在控制器作用下实现优化的状态轨迹图。
具体实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于干扰观测器的高阶异质多智能体系统分布式优化方法,其特征在于,包括以下步骤:步骤1:构造多智能体系统网络拓扑图;步骤2:建立高阶异质多智能体系统的动力学模型;步骤3:为第i个智能体设计有限时间干扰观测器;步骤4:对互联系统使用比例

积分分布式优化器;步骤5:根据高阶异质多智能体系统动力学模型建立误差系统模型;步骤6:根据有限时间干扰观测器估计的扰动和优化器产生的优化值,为互联系统设计跟踪控制器;步骤7:为分布式优化器

跟踪控制器互联系统选取合适的复合李雅普诺夫函数,选取满足稳定性条件的值,实现目标优化。2.根据权利要求1所述的一种基于干扰观测器的高阶异质多智能体系统分布式优化方法,其特征在于,步骤1中所述网络拓扑图是无向连通图其中,表示N个节点的集合,表示边的集合,表示邻接矩阵,表示N
×
N维实数矩阵的集合;所述邻接矩阵中,如果节点i,j之间有边相连,则a
ij
=a
ji
=1,否则a
ij
=a
ji
=0,定义节点i的邻居节点集合为3.根据权利要求1所述的一种基于干扰观测器的高阶异质多智能体系统分布式优化方法,其特征在于,步骤2中所述动力学模型中第i个智能体的动力学方程如下:法,其特征在于,步骤2中所述动力学模型中第i个智能体的动力学方程如下:y
i
=x
i1
其中,M
i
≥1是第i个智能体的阶数,是系统的状态变量,u
i
是控制输入,与输入不在同一通道,属于不匹配扰动,是匹配扰动,y
i
是输出;各阶干扰d
ik
,k=1,...,M
i
是γ
ik

1阶可导的,且有满足的利普希茨常数4.根据权利要求1所述的一种基于干扰观测器的高阶异质多智能体系统分布式优化方法,其特征在于,步骤3中所述有限时间干扰观测器如下:法,其特征在于,步骤3中所述有限时间干扰观测器如下:法,其特征在于,步骤3中所述有限时间干扰观测器如下:法,其特征在于,步骤3中所述有限时间干扰观测器如下:法,其特征在于,步骤3中所述有限时间干扰观测器如下...

【专利技术属性】
技术研发人员:陈飞张嘉祥项林英
申请(专利权)人:东北大学秦皇岛分校
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1