当前位置: 首页 > 专利查询>重庆大学专利>正文

面向大规模多Agent系统的非对称分布式约束优化算法及系统技术方案

技术编号:11079745 阅读:140 留言:0更新日期:2015-02-25 18:05
本发明专利技术公开了一种面向大规模多Agent系统的非对称分布式约束优化算法及系统,包括以下步骤:S1,构造约束图;S2,每个Agent随机选择状态信息si,t并发送到其邻居Agent;S3,每个Agent计算初始最佳响应状态s′i,t+1后再计算增益信息GIi,t并将所述增益信息GIi,t发送到其邻居Agent;S4,每个Agent计算最佳响应s′i,t+1,计算最佳响应s′i,t+1的预测概率P并产生一个随机概率Pm,如果Pm<P,则s′i,t+1=s′i,t+1;否则si,t+1=si,t;S5,每个Agent计算状态信息si,t+1的状态出现频率如果则采用随机调度方法;否则采用确定性调度,执行Agent的状态改变;发送si,t+1,令t=t+1;S6,当t>tmax,结束算法,否则返回步骤S3。本发明专利技术适用于大规模多Agent的协调优化问题,解决有用户偏好以及不确定环境下多Agent系统的优化控制。

【技术实现步骤摘要】
面向大规模多Agent系统的非对称分布式约束优化算法及 系统
本专利技术涉及Agent系统的非对称分布式约束优化问题的求解,特别是涉及一种面 向大规模多Agent系统的非对称分布式约束优化算法及系统,适用于电力发电优化策略计 算,尤其是微网配置问题的求解。
技术介绍
分布式约束优化问题(DistributedConstraintOptimization Problems,DCOPs)是解决多Agent系统问题的一个基本框架。DCOPs常用来作为多Agent 协作问题的重要而有用的抽象,可对多Agent领域许多真实问题建模。DCOPs强调利用本地 的局部交互获得全局的最优性,是协调多个Agent解决分布式问题的有效技术,已成为分 布式人工智能领域的研究热点。目前已逐步运用于任务调度、资源分配、传感器网络、交通 管理、微网配置等实际应用中。但是,当前在这些应用领域中,对于多Agent系统仍然使用 的是对称性特性,即认为各Agent对与其有约束关系的其他Agent的特征、取值(策略) 空间及代价(收益)函数有准确的信息,每个Agent没有个人的偏好信息和隐私性,进而简 化了其求解的过程。 但是,在实际问题中,大多数的多Agent系统都具有非对称特征,即每个个体具有 自己的偏好且不希望与其他个体共享。例如,在微网控制中,每个分布式电源(DG)由于各 自的特性不同(如风能或水电站电源等等),彼此之间的影响是不同的,在相同网络配置下 相邻DG的收益也不相同,而每个DG并不清楚其他DG的收益情况。因此,现实情况使得在 此类多Agent系统中,需要充分考虑其非对称性特征。 非对称分布式约束优化问题(AsymmetricDistributedConstraint OptimizationProblems,ADCOPs)是在分布式约束优化问题(DCOPs)的基础上增加了 非对称特性的新模型,具有更强的建模能力和更好的工程应用前景。ADCOPs由多元组 <A,X,D,C>构成。其中A= (A1,A2,…,AJ表示m个Agent的集合,Agent负责给变量集 合X中的变量选择赋值;X=U1,x2,...,xj表示η个变量;D= {D1;D2,...,Dj是一组离 散而有限的值域集合,Di表示Xi的值域;C表示各变量之间的约束关系集合。C中的约束关 系描述如下: I!:D丨'XD1'x.xDit -eC.D;eIXiie (I) u称为代价函数或收益函数。以二元关系为例,对于ADCOPs求解目标是: X*=argmaxu;j(.Xi-Cl^xj =Clj) djIi ^argmaxY(z/;(;)(x; =d;.,xy.=til) +ii{l)i{x-di,xi =J1)) d^Di,d,^Df ( 2 ) 其中ui(j),u⑴^DiXDj -R+,ui(j),u⑴」eUij。 公式⑵中Ui(j)和u(i)j分别表示在Xi与Xj取相同赋值下,Agent和邻居Agent 得到的代价或收益,并且Ui(j)和u⑴』是Agent和邻居Agent的私有信息,彼此不共 享。由于ADCOPs多用于多Agent系统的决策优化中,因此在实际应用中,决策集合S= (S1,S2, ...,SJ取代D作为实际值域集合。从上述公式可见,ADCOPs中具有非对称关系的 各Agent,虽然彼此影响,但各自的影响情况(代价或收益)是不同的,并且该情况彼此不共 享。很多有非对称关系的多Agent系统能较方便地用ADCOPs建模,然而对ADCOPs的求解 较困难。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种面向大 规模多Agent系统的非对称分布式约束优化算法及系统。 为了实现本专利技术的上述目的,本专利技术提供了一种面向大规模多Agent系统的非对 称分布式约束优化算法,包括以下步骤: Sl,根据具有非对称关系的Agent构造约束图,令t= 0,所述t为时刻; S2,每个Agent随机选择状态信息si;t,根据约束图向邻居Agent发送所述状态信 息si;t,其中,i为Agent的序号,在本实施方式中,每个Agent随机选择状态信息si;t是指: 每个Agent的状态信息具有一个设定的取值范围,从这个取值范围内随机选择一个状态信 息SijttJ S3,每个Agent接收到邻居Agent的状态信息Sj,t后,所述每个Agent计算初始最 佳响应状态s'iit+1后再计算增益信息GIiit并将所述增益信息GIiit发送到其邻居Agent; S4,每个Agent接收到所有邻居Agent的增益信息GIj,t及所有邻居Agent的的状 态信息Siit后,计算最佳响应s'iit+1,计算最佳响应s'iit+1的预测概率P并产生一个随机概 率P111,如果P111<P,则si;t+1=s'i;t+1;否则si;t+1 = si;t ; 在分布式控制问题中,每个Agent与邻居Agent交换信息,然后自主地进行优化决 策,因此对其算法的设计主要在信息交换机制和各Agent的内部处理上。本专利技术采用同步 的信息交换机制,即各Agent发送完t时刻的个人决策信息后,只有接收到全部邻居Agent 在t时刻的个人决策信息后才进行内部新的决策处理。 S5,计算状态信息Si,t+1的状态出现频率<,+1,如果d=(),则采用随机调度;否 则采用确定性调度,执行Agent的状态改变;发送si;t+1,令t=t+Ι; S6,当t>tmax,结束算法,所述tmax为允许的最大时刻;否则返回步骤S3。 本专利技术适用于大规模多Agent的协调优化问题,可以解决有用户偏好以及不确定 环境下多Agent系统的优化控制。Agent通过网络连接,交换信息,相互协作完成共同的任 务。单独Agent只与有连接关系的Agent(邻居Agent)之间进行信息共享,且个体Agent 能根据自身的周围环境以及目标自主做出决策,而不受其他Agent的限制。Agent与Agent 之间存在竞争和合作关系,通过自身协调来解决目标与行为之间的冲突。 在本专利技术的一种优选实施方式中,在步骤S3中,所述Agenti只接收邻居Agent 的状态信息
,所述初始最佳响应s'iit+1的计算方法为: .Vi ,=Urgmaxi_v /(.v;),本文档来自技高网
...

【技术保护点】
一种面向大规模多Agent系统的非对称分布式约束优化算法,其特征在于,包括以下步骤:S1,根据具有非对称关系的Agent构造约束图,令t=0,所述t为时刻;S2,每个Agent随机选择状态信息si,t,根据约束图向邻居Agent发送所述状态信息si,t,所述i为Agent的序号;S3,每个Agent接收到邻居Agent的状态信息sj,t后,所述每个Agent计算初始最佳响应状态s′i,t+1,计算增益信息GIi,t并将所述增益信息GIi,t发送到其邻居Agent;S4,每个Agent接收到所有邻居Agent的增益信息GIj,t及所有邻居Agent的的状态信息sj,t后,计算最佳响应s′i,t+1,计算最佳响应s′i,t+1的预测概率P并产生一个随机概率Pm,如果Pm<P,则si,t+1=s′i,t+1;否则si,t+1=si,t;S5,计算状态信息si,t+1的状态出现频率如果则采用随机调度;否则采用确定性调度,执行Agent的状态改变;发送si,t+1,令t=t+1;S6,当t>tmax,结束算法,所述tmax为允许的最大时刻;否则返回步骤S3。

【技术特征摘要】
1. 一种面向大规模多Agent系统的非对称分布式约束优化算法,其特征在于,包括以 下步骤: S1,根据具有非对称关系的Agent构造约束图,令t = 0,所述t为时刻; 52, 每个Agent随机选择状态信息siit,根据约束图向邻居Agent发送所述状态信息 Si,t,所述i为Agent的序号; 53, 每个Agent接收到邻居Agent的状态信息Sj,t后,所述每个Agent计算初始最佳响 应状态s' iit+1,计算增益信息GIiit并将所述增益信息GIiit发送到其邻居Agent ; 54, 每个Agent接收到所有邻居Agent的增益信息GIj,t及所有邻居Agent的的状态信 息后,计算最佳响应s' iit+1,计算最佳响应s' iit+1的预测概率P并产生一个随机概率 P111,如果 P111 < P,则 si;t+1 = s' i,t+1 ;否则 si;t+1 = si;t ; 55, 计算状态信息Si,t+1的状态出现频率$/+1,如果CU =G,则采用随机调度;否则采 用确定性调度,执行Agent的状态改变;发送si;t+1,令t = t+Ι ; 56, 当t > tmax,结束算法,所述tmax为允许的最大时刻;否则返回步骤S3。2. 根据权利要求1所述的面向大规模多Agent系统的非对称分布式约束优化算法,其 特征在于,在步骤S3中,所述Agent i只接收邻居Agent的状态信息Sj,t,所述初始最佳响 应V i;t+1的计算方法为:其中,为iV〇或1,所述L表示邻居Agent j在系统中的影响程度,uiW表示 Agent的私有信息,Si表不Agent的状态信息集合,Si是Si中的一个状态信息,Sj, t表不在 t时刻邻居Agent j的状态信息,j表示Agent i的邻居Agent的序号,V (i)表示Agent i 的邻居集合。3. 根据权利要求1所述的面向大规模多Agent系统的非对称分布式约束优化算法,其 特征在于,所述增益信息GIiit的计算方法为:其中,ui(j)表示Agent的私有信息,s' i;t+1表示初始最佳响应,Sj,t表示在t时刻邻居 Agent j的状态信息,si;t表示在t时刻Agent的状态信息,j表示Agent i的邻居Agent 的序号,V (i)表Agent i的邻居集合。4. 根据权利要求1所述的面向大规模多Agent系统的非对称分布式约束优化算法,其 特征在于,所述最佳响应s' iit+1的计算方法为:其中,为\、〇或1,所述L表示邻居Agent j在系统中的影响程度,Ai^为转移矩 阵,Si是Agent的状态信息集合,Si是Si中的一个状态信息,s i;t是t时刻Agent i的状态 信息,Sj,t是t时刻邻居Agent j的状态信息,IFi,t是影响因子,<,+1是状态出现频率。5. 根据权利要求4所述的面向大规模多Agent系统的非对称分布式约束优化算法,其 特征在于,所沭影响闵子IF^的计算方法为:其中,j表示Agent i的邻居Agent的序号,V (i)表示Agent i的邻居集合,GIj,t是邻 居Agent j的增益信息。6. 根据权利要求1或4所述的面向大规模多Agent系统的非对称分布式约束优化算 法,其特征在于,所述状态出现...

【专利技术属性】
技术研发人员:陈自郁陈民铀张程石美凤李英豪
申请(专利权)人:重庆大学
类型:发明
国别省市:重庆;85

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1