一种基于改进拟态物理法的多智能体系统运动控制方法技术方案

技术编号:22185303 阅读:55 留言:0更新日期:2019-09-25 03:23
本发明专利技术公布了一种基于改进拟态物理法的多智能体系统运动控制方法,涉及多智能体协同运动控制领域。所述方法首先建立单个智能体的运动模型,并对多智能体个体的运动规则用拟态物理力的方法进行描述;接着,将拟态物理法与经典聚集、避碰和速度一致规则相结合,同时利用距离和相对速度来计算聚集系数与速度一致系数;然后,利用注意力参数调节调节改进拟态物理法各项的作用效果,使智能体有选择的跟随其他智能体或者目标;最后,通过使用改进拟态物理法对智能体运动进行调节,实现多智能体系统的聚集运动、速度一致和多目标环境下的分群运动。该方法主要解决了经典的多智能体系统运动控制算法在聚集运动过程中出现的边界振荡问题和多目标环境下多智能体系统的分群运动问题。

A Motion Control Method for Multi-Agent System Based on Modified Mimetic Physics

【技术实现步骤摘要】
一种基于改进拟态物理法的多智能体系统运动控制方法
本专利技术属于多智能体系统运动控制领域,特别是考虑多个目标环境下的自主分群方法。
技术介绍
多智能体系统(multi-agentsystems,MAS)是由大量简单自主个体组成的自组织群体系统,虽然MAS的基本单位智能水平很低,但是整体却表现出较高的智能水平,能够完成搜索、侦查、救援等复杂的任务,多智能体系统运动控制是多智能体系统应用的基础,即通过自组织的方式实现群体的聚集运动、速度一致以及分群运动。目前的多智能体运动控制算法主要针对聚集运动和速度一致,并以SAC原则为基础出现了大量的分布式集群运动控制算法,如Three-Circle法、人工势场法、社会力模型等。其中SAC原则是指每一个智能体遵循三条简单的规则——避撞(Separation)、对齐(Alignment)和聚集(Cohesion)。Three-Circle法简单且容易理解,但是由于智能体的感知范围被分为三个不连续的区域,因此在聚集过程中容易发生振荡现象。人工势场法通常需要建立全局势场,且存在局部极小值的问题,导致智能体间避碰失败。社会力法不需要全局控制,但由于与人工势场法在本质上是相同的,因此也存在人工势场法局部极小值问题。拟态物理法将个体间的相互作用抽象为物理力,省去了人工势场法的求梯度过程,且不存在人工势场法局部极小值问题,因此广泛应用于多智能体编队及重构、无人机编队、智能车编队等。但是当环境中存在多个目标时,经典的拟态物理法无法实现多智能体系统的分群运动。
技术实现思路
本专利技术的目的在于提供一种基于改进拟态物理法的多智能体系统运动控制方法,能够实现多智能系统的聚集运动、速度一致和分群运动,解决了经典SAC算法边界振荡问题和实现了多目标环境下多智能体系统的分群运动。为实现上述目的,本专利技术采用以下技术方案:一种基于改进拟态物理法的多智能体系统运动控制方法,包括:步骤一,将每个智能体抽象为质点,建立单个智能体的二阶运动模型。步骤二,根据智能体感知范围得到智能体的邻居序号集Ni,获取感知范围内邻居智能体的状态信息以及目标的位置信息步骤三,根据邻居智能体的状态信息和目标的位置信息选择注意对象并确定自身的目标感知状态步骤四,根据智能体与邻居智能体或注意对象的距离,计算改进拟态物理法的聚集系数kp、速度一致系数kv和避碰系数kr。步骤五,利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入ui。步骤六,根据步骤五计算的控制输入与步骤一单个智能体的运动模型,对智能体进行控制。步骤七,判断每个智能体是否都到达目标点,如果没有,则跳转步骤二进行循环,否则结束运动。本专利技术具有以下优点:1.在智能体的感知距离内,同时考虑相对速度与相对位置来计算聚集系数和速度一致系数,实现多智能体系统的聚集运动,解决了经典基于SAC原则的运动控制算法在聚集运动过程中存在的边界振荡问题。2.将拟态物理法与SAC原则相结合,融合聚集区域与速度一致区域,在经典拟态物理法吸引力与排斥力的基础上,增加速度一致作用力,实现了多智能体系统的速度一致运动。3.考虑到多目标情形下多智能体系统的分群运动,将注意力跟随机制与改进拟态物理法相结合,利用注意力参数调节目标点或邻居智能体的作用效果,实现了多智能体系统分群运动。附图表说明图1为本专利技术方法的流程图。图2为多智能体系统坐标示意图。图3为t=3s和t=9s时多智能体系统群体运动状态。图4为25s内每个智能体的速度方向变化曲线。图5为本专利技术算法、经典SAC算法、人工势场法、改进的SAC算法一致性指数变化曲线。图6为基于改进拟态物理法的多智能体系统分群运动轨迹。图7为分群运动过程中每个智能体的速度变化曲线。具体实施方式结合所附图表,对本专利技术的技术方案作具体说明。如图1所示,本专利技术的一种基于改进拟态物理法的多智能体系统运动控制方法,具体包括以下步骤:步骤1:将每个智能体抽象为质点,建立单个智能体的二阶运动模型。具体过程为:对智能体所处环境建立笛卡尔坐标系,如图2所示,图中圆圈表示智能体,三角形表示目标,速度向量由箭头表示。设智能体Agenti在环境中的位置为pi=(xi,yi),速度为目标的位置为将单个智能体均抽象为质点,其运动模型为:式中,pi是智能体Agenti的位置向量,vi是智能体Agenti的速度向量;ui为Agenti的控制输入,N为多智能体系统中智能体的总数。步骤2:根据智能体感知范围得到智能体的邻居序号集,获取感知范围内邻居智能体的状态信息以及目标的位置信息。具体过程为:获取编号为i的智能体Agenti的邻居序号集Ni为:Ni={j|||pi-pj||≤δ,j∈{1,2,…,N},j≠i}(2)式中,pi为智能体Agenti的位置向量,pj为智能体Agentj的位置向量,||pi-pj||为智能体Agenti与智能体Agentj的欧氏距离,δ>0为智能体的感知距离。获取的邻居智能体的状态信息用元组表示,为Agentj(j∈Ni)的目标感知状态。当Agentj能感知到目标时,反之当目标与智能体的距离小于智能体的感知距离δ时,表示智能体能感知到目标,则获取目标的位置信息为这里表示编号为m的目标Tm位置向量。步骤3:根据邻居智能体的状态信息和目标的位置信息选择注意对象并确定自身的目标感知状态具体过程为:当智能体Agenti能够感知到目标时,根据目标的位置信息选择欧氏距离最近的目标作为注意对象同时设置Agenti的目标感知状态为当智能体Agenti没有感知到目标且邻居智能体Agentj(j∈Ni)的目标感知状态时,则选择最近的智能体Agentj作为注意对象同时设置Agenti的目标感知状态为当智能体Agenti既感知不到目标,且其邻居智能体的目标感知状态均为0时,则令Agenti的注意对象同时设置Agenti的目标感知状态为步骤4:根据智能体与邻居智能体或注意对象的距离,计算改进拟态物理法的聚集系数、速度一致系数和避碰系数。具体为:式中,kp为聚集系数,kv为速度一致系数,kr为避碰系数;α,β和γ为增益系数,d为智能体Agenti与邻居智能体Agentj或注意对象的欧氏距离;ra为智能体的速度一致距离,rs为智能体的避碰距离;q为指数因子。步骤5:利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入。具体过程为:(5.1)计算智能体Agenti与邻居智能体Agentj(j∈Ni)的位置差和速度差具体为:式中,pj表示智能体Agentj的位置向量,pi表示智能体Agenti的位置向量;vj表示智能体Agentj的速度向量,vi表示智能体Agenti的速度向量。(5.2)计算改进拟态物理法的速度一致项和避碰项具体为:式中,kp、kv和kr分别为位置协同系数、速度协同系数和避碰系数,rS为智能体的避碰距离,δ为智能体的感知距离,ra为智能体的速度一致距离。(5.3)计算改进拟态物理法的注意力跟随项具体为:式中,为注意对象的位置,为注意对象的速度。显然,当注意对象为静止目标时,(5.4)利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入ui,具体为:式中,αi为注意力参数,表示为:步骤6:根据步骤5计算的控制输入与步骤1单个智能本文档来自技高网...

【技术保护点】
1.一种基于改进拟态物理法的多智能体系统运动控制方法,其特征在于,包括以下步骤:步骤一,将每个智能体抽象为质点,建立单个智能体的二阶运动模型。步骤二,根据智能体感知范围得到智能体的邻居序号集,获取感知范围内邻居智能体的状态信息以及目标的位置信息。步骤三,根据邻居智能体的状态信息和目标的位置信息选择注意对象。步骤四,根据智能体与邻居智能体或注意对象的距离,计算改进拟态物理法的聚集系数、速度一致系数和避碰系数。步骤五,利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入。步骤六,根据步骤五计算的控制输入与步骤一单个智能体的运动模型,对智能体进行控制。步骤七,判断每个智能体是否都到达目标点,如果没有,则跳转步骤二进行循环,否则结束运动。

【技术特征摘要】
1.一种基于改进拟态物理法的多智能体系统运动控制方法,其特征在于,包括以下步骤:步骤一,将每个智能体抽象为质点,建立单个智能体的二阶运动模型。步骤二,根据智能体感知范围得到智能体的邻居序号集,获取感知范围内邻居智能体的状态信息以及目标的位置信息。步骤三,根据邻居智能体的状态信息和目标的位置信息选择注意对象。步骤四,根据智能体与邻居智能体或注意对象的距离,计算改进拟态物理法的聚集系数、速度一致系数和避碰系数。步骤五,利用注意力参数调节改进拟态物理法各项的作用效果,计算每个智能体的控制输入。步骤六,根据步骤五计算的控制输入与步骤一单个智能体的运动模型,对智能体进行控制。步骤七,判断每个智能体是否都到达目标点,如果没有,则跳转步骤二进行循环,否则结束运动。2.如权利要求1所述的一种基于改进拟态物理法的多智能体运动控制方法,其特征在于,所述步骤一中将每个智能体抽象为质点,建立单个智能体的二阶运动模型,具体为:式中,pi是智能体Agenti的位置向量,vi是智能体Agenti的速度向量;ui为Agenti的控制输入,N为多智能体系统中智能体的总数。3.如权利要求1所述的一种基于改进拟态物理法的多智能体运动控制方法,其特征在于,所述步骤二中根据智能体感知范围得到智能体的邻居序号集,获取感知范围内邻居智能体的状态信息以及目标的位置信息,具体包括:获取智能体Agenti的邻居序号集Ni为:Ni={j|||pi-pj||≤δ,j∈{1,2,…,N},j≠i}(2)式中,pi为智能体Agenti的位置向量,pj为智能体Agentj的位置向量,||pi-pj||为智能体Agenti与智能体Agentj的欧氏距离,δ>0为智能体的感知距离。获取邻居智能体的状态信息用元组表示,为Agentj(j∈Ni)的目标感知状态。当Agentj能感知到目标时,反之当目标与智能体的距离小于智能体的感知距离δ时,表示智能体能感知到目标,则获取目标的位置信息为这里表示编号为m的目标Tm位置向量。4.如权利要求1所述的一种基于改进拟态物理法的多智能体运动控制方法,其特征在于,所述步骤三中根据邻居智能...

【专利技术属性】
技术研发人员:丁勇高振龙何金
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1