多智能体系统编队构型的协同优化方法及装置制造方法及图纸

技术编号:27318449 阅读:20 留言:0更新日期:2021-02-10 09:55
本申请公开了一种多智能体系统编队构型的协同优化方法及装置,所述方法包括:为每个智能体建立表示待优化位置的位置变量x

【技术实现步骤摘要】
多智能体系统编队构型的协同优化方法及装置


[0001]本申请实施例涉及信号处理技术,尤其涉及一种多智能体系统编队构型的协同优化方法及装置。

技术介绍

[0002]智能体泛指具有智能的自主体,通常具有计算能力、通信能力、响应能力等功能,常见的智能体包括人造卫星、无人机、无人车、智能电器、智能硬件、机电一体化传感器、货物仓储、发电机等。多个智能体组成的多智能体系统协同工作可以实现更复杂的任务功能。例如,多个传感器协同工作形成的无线传感器网络可以实现区域监测覆盖,多个小孔径相机协同工作形成的合成孔径相机可以实现等效大口径观测,多个发电机协同工作形成的发电机组可以实现大功率电能输出。
[0003]多智能体系统的协同能力通常依赖于编队构型,例如,含有相同数目多智能体的系统,其编队构型不同,其所能完成任务的能力也有所不同。所以,针对一个给定的多智能体系统,如何实现多智能编队系统编队构型的优化从而最大化系统整体的效能,是多智能体系统最终走向实际工程应用所要解决的关键问题之一。某些场景下,因场地限制、任务要求或物理系统天然约束等缘故,多智能体系统的等效质心需要保持不变,例如,多卫星编队飞行任务中,无论构型如何变化,编队系统的等效质心必须保持于所设计的轨道参考点不变。因此,如何解决多智能体系统等效质心不变约束情况下的编队构型优化问题,是这类系统应用的关键基础,具有重要的研究和应用意义。

技术实现思路

[0004]有鉴于此,本申请实施例提供一种多智能体系统编队构型的协同优化方法及装置。
[0005]根据本申请的第一方面,提供一种多智能体系统编队构型的协同优化方法,包括:
[0006]为每个智能体建立表示待优化位置的位置变量x
i
,建立对准变量θ
i
,建立增益变量γ
i
,其中,x
i
为维度为k的列向量,代表第i个智能体在k维空间的坐标,i为智能体的编号,k为正整数,θ
i
为非负实数,γ
i
为正实数;在t=0时刻,每个智能体初始化x
i
=P
i
,θ
i
=0,γ
i
=1,其中P
i
为第i个智能体当前的实际位置,同样是维度为k的列向量;
[0007]为每个智能体开启迭代过程,在每次迭代中,至少执行下述处理中的至少之一:计算本地效能梯度和约束梯度、进行邻居间的交互协调、进行位置变量更新、进行对准变量更新、进行增益变量更新;
[0008]判断迭代是否完成:确定每个智能体计算已经迭代的次数π
i
,当次数π
i
大于或大于等于给定的最大迭代次数π
max
时,迭代完成,否则重复迭代过程,其中,π
i
和π
max
均为正整数;
[0009]迭代完成后,将每个智能体将最终的位置变量x
i
作为构型优化的位置信息;
[0010]将智能体按构型优化的位置信息进行排布。
[0011]作为一种实现方式,所述计算本地效能梯度和约束梯度,包括:
[0012]计算智能体i本地效能函数u
i
(x
i
)在当前位置变量x
i
处的梯度值计算位置变量所允许取值空间的包络曲面函数Ω
i
(x
i
)在当前位置变量x
i
处的梯度值其中,本地效能函数u
i
(x
i
)是以向量x
i
为变量的标量值型凸函数,包络曲面函数Ω
i
(x
i
)是以向量x
i
为变量的标量值型凸函数,且任意位置变量所被允许的取值满足约束关系Ω
i
(x
i
)≤0;由此计算得到的为本地效能梯度,为约束梯度。
[0013]作为一种实现方式,所述进行邻居间的交互协调,包括:
[0014]使每个智能体i向邻居智能体广播位置变量x
i
、对准变量θ
i
、增益变量γ
i
、本地效能梯度约束梯度并接收所有邻居发送的相关变量信息,其中,邻居智能体是指能够与当前智能体发生通信交流和信息交互的网络拓扑邻近的智能体。
[0015]作为一种实现方式,所述进行位置变量更新,包括:
[0016]将每个智能体按下式(1)计算更新的变化率然后按式(2)进行更新位置变量x
i

[0017][0018][0019]其中,代表第i个智能体所有的邻居智能体组成的集合,m
i
为实数,代表第i个智能体的质量,

T取值为正实数,代表更新时间步长。
[0020]作为一种实现方式,所述进行对准变量更新,包括:
[0021]使每个智能体i根据更新后的位置变量x
i
,对每一个邻居智能体按照下式(3)计算最优的并按照式(4)计算更新的对准变量θ
i

[0022][0023][0024]其中,I
k
为阶数为k的单位矩阵,代表矩阵的克罗内克积运算,为正整数代表集合内元素的数量,abs()代表绝对值运算,对于每一个邻居内元素的数量,abs()代表绝对值运算,对于每一个邻居和均为实数。
[0025]作为一种实现方式,所述进行增益变量更新,包括:
[0026]使每个智能体i根据更新后的位置变量x
i
,按照下式(5)更新增益变量γ
i

[0027]γ
i
=exp(Ω
i
(x
i
))
ꢀꢀꢀꢀꢀꢀ
(5)
[0028]其中,exp()代表以自然常数e为底的指数函数运算。
[0029]根据本申请的第二方面,提供一种多智能体系统编队构型的协同优化装置,所述装置包括:
[0030]建立单元,用于为每个智能体建立表示待优化位置的位置变量x
i
,建立对准变量θ
i
,建立增益变量γ
i
,其中,x
i
为维度为k的列向量,代表第i个智能体在k维空间的坐标,i为智能体的编号,k为正整数,θ
i
为非负实数,γ
i
为正实数;在t=0时刻,每个智能体初始化x
i
=P
i
,θ
i
=0,γ
i
=1,其中P
i
为第i个智能体当前的实际位置,同样是维度为k的列向量;
[0031]迭代处理单元,用于为每个智能体开启迭代过程,在每次迭代中,至少执行下述处理中的至少之一:计算本地效能梯度和约束梯度、进行邻居间的交互协调、进行位置变量更新、进行对准变量更新、进本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多智能体系统编队构型的协同优化方法,其特征在于,所述方法包括:为每个智能体建立表示待优化位置的位置变量x
i
,建立对准变量θ
i
,建立增益变量γ
i
,其中,x
i
为维度为k的列向量,代表第i个智能体在k维空间的坐标,i为智能体的编号,k为正整数,θ
i
为非负实数,γ
i
为正实数;在t=0时刻,每个智能体初始化x
i
=P
i
,θ
i
=0,γ
i
=1,其中P
i
为第i个智能体当前的实际位置,同样是维度为k的列向量;为每个智能体开启迭代过程,在每次迭代中,至少执行下述处理中的至少之一:计算本地效能梯度和约束梯度、进行邻居间的交互协调、进行位置变量更新、进行对准变量更新、进行增益变量更新;判断迭代是否完成:确定每个智能体计算已经迭代的次数π
i
,当次数π
i
大于或大于等于给定的最大迭代次数π
max
时,迭代完成,否则重复迭代过程,其中,π
i
和π
max
均为正整数;迭代完成后,将每个智能体将最终的位置变量x
i
作为构型优化的位置信息;将智能体按构型优化的位置信息进行排布。2.根据权利要求1所述的方法,其特征在于,所述计算本地效能梯度和约束梯度,包括:计算智能体i本地效能函数u
i
(x
i
)在当前位置变量x
i
处的梯度值计算位置变量所允许取值空间的包络曲面函数Ω
i
(x
i
)在当前位置变量x
i
处的梯度值其中,本地效能函数u
i
(x
i
)是以向量x
i
为变量的标量值型凸函数,包络曲面函数Ω
i
(x
i
)是以向量x
i
为变量的标量值型凸函数,且任意位置变量所被允许的取值满足约束关系Ω
i
(x
i
)≤0;由此计算得到的为本地效能梯度,为约束梯度。3.根据权利要求2所述的方法,其特征在于,所述进行邻居间的交互协调,包括:使每个智能体i向邻居智能体广播位置变量x
i
、对准变量θ
i
、增益变量γ
i
、本地效能梯度约束梯度并接收所有邻居发送的相关变量信息,其中,邻居智能体是指能够与当前智能体发生通信交流和信息交互的网络拓扑邻近的智能体。4.根据权利要求3所述的方法,其特征在于,所述进行位置变量更新,包括:将每个智能体按下式(1)计算更新的变化率然后按式(2)进行更新位置变量x
i
::其中,代表第i个智能体所有的邻居智能体组成的集合,m
i
为实数,代表第i个智能体的质量,

T取值为正实数,代表更新时间步长。5.根据权利要求4所述的方法,其特征在于,所述进行对准变量更新,包括:使每个智能体i根据更新后的位置变量x
i
,对每一个邻居智能体按照下式(3)计算最优的并按照式(4)计算更新的对准变量θ
i

其中,I
k
为阶数为k的单位矩阵,代表矩阵的克罗内克积运算,为正整数代表集合内元素的数量,abs()代表绝对值运算,对于每一个邻居内元素的数量,abs()代表绝对值运算,对于每一个邻居和均为实数。6.根据权利要求5所述的方法,其特征在于,所述进行增益变量更新,包括:使每个智能体i根据更新后的位置变量x
i
,按照下式(5)更新增益变量γ
i
:γ
i
=exp(Ω
i
(x
i
))
ꢀꢀꢀꢀꢀꢀ
(5)其中,ex...

【专利技术属性】
技术研发人员:王晓初周庆瑞孙昌浩冯宇婷邱华鑫
申请(专利权)人:中国空间技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1