【技术实现步骤摘要】
一种多智能体系统分布式优化控制方法及存储介质
[0001]本专利技术涉及
,具体涉及一种多智能体系统分布式优化控制方法及存储介质。
技术介绍
[0002]现有技术中提高多智能体的网络系统性能的分布式交替方向乘子算法,通过整合很多经典优化思路,例如梯度下降法,原始对偶算法等等,结合现代统计学习遇到的问题,提出了比较好实施的分布式计算框架,从原始对偶算子的角度出发,核心为原始对偶算法的增广拉格朗日法,能够解决特定形式的有约束凸优化问题。框架能够解决很多的优化问题,也拥有不错的收敛速率,但通信问题无法解决,没有考虑限制通信的条件,导致系统达到一致性的同时会产生很多的通信损耗,制约网络系统的进一步发展。
[0003]还有一种针对无中心网络系统的优化算法,基于分布式交替方向乘子算法框架,进一步考虑了通信问题,从通信问题中降低通信次数的方面出发,设计了通信审查方法,采用审查的方式,避免了系统中许多不必要的通信,达到了降低网络系统通信损耗的目的。但审查方式会加大网络系统计算量,同时在网络系统收敛后期,会出现许多无效的通信,或 ...
【技术保护点】
【技术特征摘要】
1.一种多智能体系统分布式优化控制方法,其特征在于,包括:初始化所述多智能体系统的本地状态量;初始化后的所述多智能体系统中的智能体迭代更新本地变量信息,迭代更新规则为:其中,k代表迭代次数,为函数f
i
(x
i
)取得最小值时状态值x
i
的取值,为第k次迭代时智能体i的本地数据原始变量信息,且i,j为两个相邻智能体,i的邻居智能体的集合记作N
i
,i的邻居智能体的数量d
i
=|N
i
|,表示第k
‑
1次迭代时智能体i对于邻居j设置的惩罚项系数,表示智能体对自身设置的惩罚项系数,为第k
‑
1次迭代时的对偶变量,通过迭代更新得到状态值x
i
;迭代过程中,根据不同的所述智能体之间原始变量的误差,利用第一公式更新所述惩罚项系数,所述第一公式为:其中,k
max2
为惩罚项最大更新次数,惩罚函数变量c0为惩罚项初始设定值,为智能体i对自身设置的惩罚项系数,为智能体i对邻居j设置的惩罚项系数,为衡量第k次迭代时智能体i的本地状态值与系统中所有智能体的最大最小状态值差距的函数,且其中,为第k次迭代时智能体i的误差函数值,为第k次迭代时智能体j的误差函数值,为第k次迭代时智能体j的本地数据原始变量信息;在迭代过程中,根据原始变量状态值,利用第二公式更新门限函数,所述第二公式为:其中其中为智能体i第k
‑
1次的通信变量,用于记录通信后本地的原始变量值,τ
k
是人为设定的随更新次数递减的序列,k
maxl
为通信门限函数的最大更新次数。根据所述门限函数,确认所述智能体是否能通信,若能通信,则所述智能体间交换信息,且更新其中为智能体i存储的通信变量,若智能体不能通信,则更新利用第三公式迭代更新所述对偶变量,所述第三公式为:
其中,为第k次迭代时的对偶变量,为第k次迭代时对自身设置的惩罚项,为第k次迭代时对邻居j设置的惩罚项;智能体迭代更新本地变量信息时,同步判断所述多智能体系统的更新误差是否满足预设条件,若满足所述预设条件,则完成迭代过程,若不满足所述预设条件,则多智能体系统重新按照所述迭代更新规则迭代更新,直至满足所...
【专利技术属性】
技术研发人员:姜晓伟,曹爽,张斌,李刚,
申请(专利权)人:中国地质大学武汉,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。