面向大规模多Agent系统的非对称分布式约束优化算法及系统技术方案

技术编号：11079745 阅读：140 留言：0更新日期：2015-02-25 18:05

本发明专利技术公开了一种面向大规模多Agent系统的非对称分布式约束优化算法及系统，包括以下步骤：S1，构造约束图；S2，每个Agent随机选择状态信息si,t并发送到其邻居Agent；S3，每个Agent计算初始最佳响应状态s′i,t+1后再计算增益信息GIi,t并将所述增益信息GIi,t发送到其邻居Agent；S4，每个Agent计算最佳响应s′i,t+1，计算最佳响应s′i,t+1的预测概率P并产生一个随机概率Pm，如果Pm＜P，则s′i,t+1＝s′i,t+1；否则si,t+1＝si,t；S5，每个Agent计算状态信息si,t+1的状态出现频率如果则采用随机调度方法；否则采用确定性调度，执行Agent的状态改变；发送si,t+1，令t＝t+1；S6，当t＞tmax，结束算法，否则返回步骤S3。本发明专利技术适用于大规模多Agent的协调优化问题，解决有用户偏好以及不确定环境下多Agent系统的优化控制。

全部详细技术资料下载

【技术实现步骤摘要】
面向大规模多Agent系统的非对称分布式约束优化算法及系统
本专利技术涉及Agent系统的非对称分布式约束优化问题的求解，特别是涉及一种面向大规模多Agent系统的非对称分布式约束优化算法及系统，适用于电力发电优化策略计算，尤其是微网配置问题的求解。
技术介绍
分布式约束优化问题（DistributedConstraintOptimization Problems,DCOPs)是解决多Agent系统问题的一个基本框架。DCOPs常用来作为多Agent 协作问题的重要而有用的抽象，可对多Agent领域许多真实问题建模。DCOPs强调利用本地的局部交互获得全局的最优性，是协调多个Agent解决分布式问题的有效技术，已成为分布式人工智能领域的研究热点。目前已逐步运用于任务调度、资源分配、传感器网络、交通管理、微网配置等实际应用中。但是，当前在这些应用领域中，对于多Agent系统仍然使用的是对称性特性，即认为各Agent对与其有约束关系的其他Agent的特征、取值（策略）空间及代价（收益）函数有准确的信息，每个Agent没有个人的偏好信息和隐私性，进而简化了其求解的过程。但是，在实际问题中，大多数的多Agent系统都具有非对称特征，即每个个体具有自己的偏好且不希望与其他个体共享。例如，在微网控制中，每个分布式电源（DG)由于各自的特性不同（如风能或水电站电源等等），彼此之间的影响是不同的，在相同网络配置下相邻DG的收益也不相同，而每个DG并不清楚其他DG的收益情况。因此，现实情况使得在此类多Agent系统...

【技术保护点】
一种面向大规模多Agent系统的非对称分布式约束优化算法，其特征在于，包括以下步骤：S1，根据具有非对称关系的Agent构造约束图，令t＝0，所述t为时刻；S2，每个Agent随机选择状态信息si,t，根据约束图向邻居Agent发送所述状态信息si,t，所述i为Agent的序号；S3，每个Agent接收到邻居Agent的状态信息sj,t后，所述每个Agent计算初始最佳响应状态s′i,t+1，计算增益信息GIi,t并将所述增益信息GIi,t发送到其邻居Agent；S4，每个Agent接收到所有邻居Agent的增益信息GIj,t及所有邻居Agent的的状态信息sj,t后，计算最佳响应s′i,t+1，计算最佳响应s′i,t+1的预测概率P并产生一个随机概率Pm，如果Pm＜P，则si,t+1＝s′i,t+1；否则si,t+1＝si,t；S5，计算状态信息si,t+1的状态出现频率如果则采用随机调度；否则采用确定性调度，执行Agent的状态改变；发送si,t+1，令t＝t+1；S6，当t＞tmax，结束算法，所述tmax为允许的最大时刻；否则返回步骤S3。

【技术特征摘要】
1. 一种面向大规模多Agent系统的非对称分布式约束优化算法，其特征在于，包括以下步骤： S1，根据具有非对称关系的Agent构造约束图，令t = 0,所述t为时刻； 52, 每个Agent随机选择状态信息siit，根据约束图向邻居Agent发送所述状态信息 Si，t，所述i为Agent的序号； 53, 每个Agent接收到邻居Agent的状态信息Sj，t后，所述每个Agent计算初始最佳响应状态s' iit+1，计算增益信息GIiit并将所述增益信息GIiit发送到其邻居Agent ; 54, 每个Agent接收到所有邻居Agent的增益信息GIj，t及所有邻居Agent的的状态信息后，计算最佳响应s' iit+1，计算最佳响应s' iit+1的预测概率P并产生一个随机概率 P111,如果 P111 < P,则 si;t+1 = s' i，t+1 ;否则 si;t+1 = si;t ; 55, 计算状态信息Si，t+1的状态出现频率$/+1，如果CU =G，则采用随机调度；否则采用确定性调度，执行Agent的状态改变；发送si;t+1，令t = t+Ι ; 56, 当t > tmax，结束算法，所述tmax为允许的最大时刻；否则返回步骤S3。2. 根据权利要求1所述的面向大规模多Agent系统的非对称分布式约束优化算法，其特征在于，在步骤S3中，所述Agent i只接收邻居Agent的状态信息Sj，t，所述初始最佳响应V i;t+1的计算方法为：其中，为iV〇或1，所述L表示邻居Agent j在系统中的影响程度，uiW表示 Agent的私有信息，Si表不Agent的状态信息集合，Si是Si中的一个状态信息，Sj， t表不在 t时刻邻居Agent j的状态信息，j表示Agent i的邻居Agent的序号，V (i)表示Agent i 的邻居集合。3. 根据权利要求1所述的面向大规模多Agent系统的非对称分布式约束优化算法，其特征在于，所述增益信息GIiit的计算方法为：其中，ui(j)表示Agent的私有信息，s' i;t+1表示初始最佳响应，Sj，t表示在t时刻邻居 Agent j的状态信息，si;t表示在t时刻Agent的状态信息，j表示Agent i的邻居Agent 的序号，V (i)表Agent i的邻居集合。4. 根据权利要求1所述的面向大规模多Agent系统的非对称分布式约束优化算法，其特征在于，所述最佳响应s' iit+1的计算方法为：其中，为\、〇或1，所述L表示邻居Agent j在系统中的影响程度，Ai^为转移矩阵，Si是Agent的状态信息集合，Si是Si中的一个状态信息，s i;t是t时刻Agent i的状态信息，Sj，t是t时刻邻居Agent j的状态信息，IFi，t是影响因子，<,+1是状态出现频率。5. 根据权利要求4所述的面向大规模多Agent系统的非对称分布式约束优化算法，其特征在于，所沭影响闵子IF^的计算方法为：其中，j表示Agent i的邻居Agent的序号，V (i)表示Agent i的邻居集合，GIj，t是邻居Agent j的增益信息。6. 根据权利要求1或4所述的面向大规模多Agent系统的非对称分布式约束优化算法，其特征在于，所述状态出现...

【专利技术属性】
技术研发人员：陈自郁，陈民铀，张程，石美凤，李英豪，
申请(专利权)人：重庆大学，
类型：发明
国别省市：重庆;85

全部详细技术资料下载我是这个专利的主人