一种多智能体系统分布式优化控制方法及存储介质技术方案

技术编号：31085772 阅读：25 留言：0更新日期：2021-12-01 12:38

本发明专利技术提供了一种多智能体系统分布式优化控制方法存储介质，本方法使用分布式交替方向乘子法优化框架，该算法拥有优秀的迭代速度，同时具有很强的鲁棒性与普适性，通信门限函数的设计，规定智能体只有当本地信息更新足够有效时才能进行通信，保证了通信的高效性，大幅度减少系统优化所消耗的通信资源，对其迭代次数的设定也对系统降低通信损耗的能力有影响。自适应惩罚函数的设计，根据智能体状态值的不同，具体设计了智能体在每次迭代中的惩罚项，能够保证系统的收敛速度，使系统每次迭代都具有足够的有效性，对其最大迭代次数k

全部详细技术资料下载

【技术实现步骤摘要】
一种多智能体系统分布式优化控制方法及存储介质

[0001]本专利技术涉及
，具体涉及一种多智能体系统分布式优化控制方法及存储介质。

技术介绍

[0002]现有技术中提高多智能体的网络系统性能的分布式交替方向乘子算法，通过整合很多经典优化思路，例如梯度下降法，原始对偶算法等等，结合现代统计学习遇到的问题，提出了比较好实施的分布式计算框架，从原始对偶算子的角度出发，核心为原始对偶算法的增广拉格朗日法，能够解决特定形式的有约束凸优化问题。框架能够解决很多的优化问题，也拥有不错的收敛速率，但通信问题无法解决，没有考虑限制通信的条件，导致系统达到一致性的同时会产生很多的通信损耗，制约网络系统的进一步发展。
[0003]还有一种针对无中心网络系统的优化算法，基于分布式交替方向乘子算法框架，进一步考虑了通信问题，从通信问题中降低通信次数的方面出发，设计了通信审查方法，采用审查的方式，避免了系统中许多不必要的通信，达到了降低网络系统通信损耗的目的。但审查方式会加大网络系统计算量，同时在网络系统收敛后期，会出现许多无效的通信，或...

【技术保护点】

【技术特征摘要】
1.一种多智能体系统分布式优化控制方法，其特征在于，包括：初始化所述多智能体系统的本地状态量；初始化后的所述多智能体系统中的智能体迭代更新本地变量信息，迭代更新规则为：其中，k代表迭代次数，为函数f
i
(x
i
)取得最小值时状态值x
i
的取值，为第k次迭代时智能体i的本地数据原始变量信息，且i,j为两个相邻智能体，i的邻居智能体的集合记作N
i
，i的邻居智能体的数量d
i
＝|N
i
|，表示第k
‑
1次迭代时智能体i对于邻居j设置的惩罚项系数，表示智能体对自身设置的惩罚项系数，为第k
‑
1次迭代时的对偶变量，通过迭代更新得到状态值x
i
；迭代过程中，根据不同的所述智能体之间原始变量的误差，利用第一公式更新所述惩罚项系数，所述第一公式为：其中，k
max2
为惩罚项最大更新次数，惩罚函数变量c0为惩罚项初始设定值，为智能体i对自身设置的惩罚项系数，为智能体i对邻居j设置的惩罚项系数，为衡量第k次迭代时智能体i的本地状态值与系统中所有智能体的最大最小状态值差距的函数，且其中，为第k次迭代时智能体i的误差函数值，为第k次迭代时智能体j的误差函数值，为第k次迭代时智能体j的本地数据原始变量信息；在迭代过程中，根据原始变量状态值，利用第二公式更新门限函数，所述第二公式为：其中其中为智能体i第k
‑
1次的通信变量，用于记录通信后本地的原始变量值，τ
k
是人为设定的随更新次数递减的序列，k
maxl
为通信门限函数的最大更新次数。根据所述门限函数，确认所述智能体是否能通信，若能通信，则所述智能体间交换信息，且更新其中为智能体i存储的通信变量，若智能体不能通信，则更新利用第三公式迭代更新所述对偶变量，所述第三公式为：
其中，为第k次迭代时的对偶变量，为第k次迭代时对自身设置的惩罚项，为第k次迭代时对邻居j设置的惩罚项；智能体迭代更新本地变量信息时，同步判断所述多智能体系统的更新误差是否满足预设条件，若满足所述预设条件，则完成迭代过程，若不满足所述预设条件，则多智能体系统重新按照所述迭代更新规则迭代更新，直至满足所...

【专利技术属性】
技术研发人员：姜晓伟，曹爽，张斌，李刚，
申请(专利权)人：中国地质大学武汉，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人