【技术实现步骤摘要】
面向大规模多Agent系统的非对称分布式约束优化算法及 系统
本专利技术涉及Agent系统的非对称分布式约束优化问题的求解,特别是涉及一种面 向大规模多Agent系统的非对称分布式约束优化算法及系统,适用于电力发电优化策略计 算,尤其是微网配置问题的求解。
技术介绍
分布式约束优化问题(DistributedConstraintOptimization Problems,DCOPs)是解决多Agent系统问题的一个基本框架。DCOPs常用来作为多Agent 协作问题的重要而有用的抽象,可对多Agent领域许多真实问题建模。DCOPs强调利用本地 的局部交互获得全局的最优性,是协调多个Agent解决分布式问题的有效技术,已成为分 布式人工智能领域的研究热点。目前已逐步运用于任务调度、资源分配、传感器网络、交通 管理、微网配置等实际应用中。但是,当前在这些应用领域中,对于多Agent系统仍然使用 的是对称性特性,即认为各Agent对与其有约束关系的其他Agent的特征、取值(策略) 空间及代价(收益)函数有准确的信息,每个Agent没有个人的偏好信息和隐私性,进而简 化了其求解的过程。 但是,在实际问题中,大多数的多Agent系统都具有非对称特征,即每个个体具有 自己的偏好且不希望与其他个体共享。例如,在微网控制中,每个分布式电源(DG)由于各 自的特性不同(如风能或水电站电源等等),彼此之间的影响是不同的,在相同网络配置下 相邻DG的收益也不相同,而每个DG并不清楚其他DG的收益情况。因此,现实情况使得在 此类多Agent系统 ...
【技术保护点】
一种面向大规模多Agent系统的非对称分布式约束优化算法,其特征在于,包括以下步骤:S1,根据具有非对称关系的Agent构造约束图,令t=0,所述t为时刻;S2,每个Agent随机选择状态信息si,t,根据约束图向邻居Agent发送所述状态信息si,t,所述i为Agent的序号;S3,每个Agent接收到邻居Agent的状态信息sj,t后,所述每个Agent计算初始最佳响应状态s′i,t+1,计算增益信息GIi,t并将所述增益信息GIi,t发送到其邻居Agent;S4,每个Agent接收到所有邻居Agent的增益信息GIj,t及所有邻居Agent的的状态信息sj,t后,计算最佳响应s′i,t+1,计算最佳响应s′i,t+1的预测概率P并产生一个随机概率Pm,如果Pm<P,则si,t+1=s′i,t+1;否则si,t+1=si,t;S5,计算状态信息si,t+1的状态出现频率如果则采用随机调度;否则采用确定性调度,执行Agent的状态改变;发送si,t+1,令t=t+1;S6,当t>tmax,结束算法,所述tmax为允许的最大时刻;否则返回步骤S3。
【技术特征摘要】
1. 一种面向大规模多Agent系统的非对称分布式约束优化算法,其特征在于,包括以 下步骤: S1,根据具有非对称关系的Agent构造约束图,令t = 0,所述t为时刻; 52, 每个Agent随机选择状态信息siit,根据约束图向邻居Agent发送所述状态信息 Si,t,所述i为Agent的序号; 53, 每个Agent接收到邻居Agent的状态信息Sj,t后,所述每个Agent计算初始最佳响 应状态s' iit+1,计算增益信息GIiit并将所述增益信息GIiit发送到其邻居Agent ; 54, 每个Agent接收到所有邻居Agent的增益信息GIj,t及所有邻居Agent的的状态信 息后,计算最佳响应s' iit+1,计算最佳响应s' iit+1的预测概率P并产生一个随机概率 P111,如果 P111 < P,则 si;t+1 = s' i,t+1 ;否则 si;t+1 = si;t ; 55, 计算状态信息Si,t+1的状态出现频率$/+1,如果CU =G,则采用随机调度;否则采 用确定性调度,执行Agent的状态改变;发送si;t+1,令t = t+Ι ; 56, 当t > tmax,结束算法,所述tmax为允许的最大时刻;否则返回步骤S3。2. 根据权利要求1所述的面向大规模多Agent系统的非对称分布式约束优化算法,其 特征在于,在步骤S3中,所述Agent i只接收邻居Agent的状态信息Sj,t,所述初始最佳响 应V i;t+1的计算方法为:其中,为iV〇或1,所述L表示邻居Agent j在系统中的影响程度,uiW表示 Agent的私有信息,Si表不Agent的状态信息集合,Si是Si中的一个状态信息,Sj, t表不在 t时刻邻居Agent j的状态信息,j表示Agent i的邻居Agent的序号,V (i)表示Agent i 的邻居集合。3. 根据权利要求1所述的面向大规模多Agent系统的非对称分布式约束优化算法,其 特征在于,所述增益信息GIiit的计算方法为:其中,ui(j)表示Agent的私有信息,s' i;t+1表示初始最佳响应,Sj,t表示在t时刻邻居 Agent j的状态信息,si;t表示在t时刻Agent的状态信息,j表示Agent i的邻居Agent 的序号,V (i)表Agent i的邻居集合。4. 根据权利要求1所述的面向大规模多Agent系统的非对称分布式约束优化算法,其 特征在于,所述最佳响应s' iit+1的计算方法为:其中,为\、〇或1,所述L表示邻居Agent j在系统中的影响程度,Ai^为转移矩 阵,Si是Agent的状态信息集合,Si是Si中的一个状态信息,s i;t是t时刻Agent i的状态 信息,Sj,t是t时刻邻居Agent j的状态信息,IFi,t是影响因子,<,+1是状态出现频率。5. 根据权利要求4所述的面向大规模多Agent系统的非对称分布式约束优化算法,其 特征在于,所沭影响闵子IF^的计算方法为:其中,j表示Agent i的邻居Agent的序号,V (i)表示Agent i的邻居集合,GIj,t是邻 居Agent j的增益信息。6. 根据权利要求1或4所述的面向大规模多Agent系统的非对称分布式约束优化算 法,其特征在于,所述状态出现...
【专利技术属性】
技术研发人员:陈自郁,陈民铀,张程,石美凤,李英豪,
申请(专利权)人:重庆大学,
类型:发明
国别省市:重庆;85
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。