一种多智能体分布式协同动态覆盖方法及系统技术方案

技术编号:27068793 阅读:23 留言:0更新日期:2021-01-15 14:50
本发明专利技术公开了一种多智能体分布式协同动态覆盖方法及系统。所述方法包括:更新目标智能体上一时刻的覆盖信息素图得到本地更新信息素图;判断邻居节点集是否为空;若否,则接收邻居节点集发送的消息包,并采用消息包更新目标智能体当前时刻的本地更新信息素图得到融合更新信息素图;基于目标智能体当前时刻的位置、速度和融合更新信息素图,计算目标智能体当前时刻的综合控制项;若是,则基于目标智能体当前时刻的位置、速度和本地更新信息素图计算目标智能体当前时刻的综合控制项;由目标智能体当前时刻的综合控制项计算目标智能体下一时刻的位置和下一时刻的速度。本发明专利技术能实现未知环境条件下基于多智能体协同的快速完全覆盖。

【技术实现步骤摘要】
一种多智能体分布式协同动态覆盖方法及系统
本专利技术涉及多智能体协同覆盖领域,特别是涉及一种多智能体分布式协同动态覆盖方法及系统。
技术介绍
基于多智能体的态势感知技术可被广泛应用于搜索营救、区域侦察观测、火力打击、信息采集、巡逻、地形测绘、交通要道态势监控等任务。覆盖任务区域是执行上述任务的基础和前提。由于单个智能体的覆盖能力受限,通常需要多个智能体组网协作执行覆盖任务。多智能体协同动态覆盖系统要求单个节点具有自主感知、分布式信息处理、决策和行为的能力,并且多节点之间能够实施高效协同合作,以实时获取有效的、优化的覆盖路径,引导多智能体协同动态覆盖系统在给定的时间内快速搜索感兴趣的目标,尽可能多地获取任务区域的信息,从而降低任务区域信息的不确定性,获取最大感知收益。然而,在未知环境下的态势感知过程中,智能体的移动受限于自身探测方式、观测区域及运动模式,且与环境中的未知障碍物密切关联,需要实现多智能体对任务区域的全局最优覆盖且运动控制条件是简易可行的。此外,由于智能体通常能力有限,单个节点需要在无法预知全局信息的情况下,通过局部通信和交互合作完成复杂覆盖任务。因而,多智能体协同动态覆盖系统需要采用基于局部信息的分布式合作机制,且由于个体能力的限制,要尽量减少覆盖过程中各智能体节点的通信量和计算量。目前,为避免局部最优、降低优化或控制难度,已有大多数多智能体协同覆盖方法大致可分为三类。第一类方法基于区域划分的思路,首先采用多边形分割、质心Voronoi图划分、模糊C均值聚类等方法把任务区域分割为与智能体等数量的子区域,然后再进行规划分配以完成覆盖侦察任务。这种思路是预知任务区域情况下的集中式控制策略,若有智能体出现失效问题,则需立即重新进行区域划分和任务分配。第二类方法采用编队协同的思路:多智能体协同动态覆盖系统中所有个体保持相对于领导者的期望距离和方向,通过控制领导者的运动并同时保持编队结构来简化多智能体协同动态覆盖系统的覆盖问题。第三类方法是完全随机覆盖策略,是未知环境下执行覆盖的一种简单方法,多智能体协同动态覆盖系统中的每个智能体节点在保持自身避障的基础上采用完全随机访问的控制策略实现区域覆盖。对于区域覆盖能力和目标搜索有效性而言,区域划分及编队协同这两类方法在已知确定环境下被认为是一种高效可行的方式。但是,该类方法的优势主要来自于预先的任务分配,因其不具备节点故障的鲁棒性及不具备扩展性,故难以运用于高度动态变化的复杂实际环境。此外,与区域分区及编队协同这两类方法相比,完全随机覆盖方法可以运用于未知环境。然而,随机覆盖并不是实际有效的策略,因为多智能体协同动态覆盖系统中单个智能体很可能会重复访问相同的区域,而不是探索未访问的其他区域,进而造成全局覆盖效率较低。未知环境下的多智能体分布式协同动态覆盖系统需要兼顾到五个主要方面需求:第一是所有智能体相互之间以及智能体与障碍物之间能够在未知环境中避免碰撞,即多智能体协同动态覆盖系统中每个智能体具有实时避障能力;第二是多智能体协同动态覆盖系统的组织方式是分布式无中心控制,支持部分节点的随时加入或退出,即多智能体协同动态覆盖系统的可扩展性;第三是多智能体协同动态覆盖系统需要实现全局最优覆盖,不能陷入局部最优;第四是每个智能体仅需与附近的邻居节点进行信息交互,尽可能降低覆盖过程中各智能体节点的通信和计算需求,以延长多智能体协同动态覆盖系统寿命,即多智能体协同动态覆盖系统的节能策略;第五是多智能体协同动态覆盖系统中个别节点的失效不能严重影响区域覆盖任务的执行,即多智能体协同动态覆盖系统的运行稳定性。目前,尚未发现已有研究可以完全解决未知环境下多智能体分布式动态覆盖问题。由于任务区域内可能存在未知障碍物且智能体的有效运动控制必须满足一定条件,加之需要尽可能节省每个智能体的通信和计算开销以延长多智能体协同动态覆盖系统生存周期,导致环境不确定条件下基于多智能体协同的快速完全覆盖难题更加具有挑战性。
技术实现思路
基于此,有必要提供一种多智能体分布式协同动态覆盖方法及系统,以实现未知环境条件下基于多智能体协同的快速完全覆盖。为实现上述目的,本专利技术提供了如下方案:一种多智能体分布式协同动态覆盖方法,包括:获取目标智能体当前时刻的位置和当前时刻的速度;更新目标智能体上一时刻的覆盖信息素图,得到目标智能体当前时刻的本地更新信息素图;判断邻居节点集是否为空,得到第一判断结果;所述邻居节点集为目标智能体通信范围内的所有智能体的集合;若所述第一判断结果为否,则接收所述邻居节点集发送的消息包,并采用所述消息包更新所述目标智能体当前时刻的本地更新信息素图,得到目标智能体当前时刻的融合更新信息素图;所述消息包包括所述邻居节点集中各智能体的身份标识号、各智能体当前时刻的位置和各智能体当前时刻的本地更新信息素图;基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图,计算目标智能体当前时刻的综合控制项;所述综合控制项为斥力控制项和效益控制项加权求和而成,或为斥力控制项、效益控制项和避障控制项加权求和而成;若所述第一判断结果为是,则基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的本地更新信息素图计算目标智能体当前时刻的综合控制项;所述综合控制项为效益控制项加权而成,或为避障控制项和效益控制项加权求和而成;由所述目标智能体当前时刻的综合控制项计算目标智能体下一时刻的位置和下一时刻的速度,并将下一时刻作为当前时刻再返回更新目标智能体上一时刻的覆盖信息素图,得到目标智能体当前时刻的本地更新信息素图的步骤。可选的,所述基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图,计算目标智能体当前时刻的综合控制项,具体包括:计算斥力控制项;判断目标智能体当前时刻是否存在障碍物,得到第二判断结果;若所述第二判断结果为是,则根据所述目标智能体当前时刻的位置和所述目标智能体当前时刻的速度计算避障控制项,根据所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图计算效益控制项,并将所述斥力控制项、所述避障控制项和所述效益控制项加权求和得到目标智能体当前时刻的综合控制项;若所述第二判断结果为否,则根据所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图计算效益控制项,并将所述斥力控制项和所述效益控制项加权求和得到目标智能体当前时刻的综合控制项。可选的,所述基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的本地更新信息素图计算目标智能体当前时刻的综合控制项,具体包括:判断目标智能体当前时刻是否存在障碍物,得到第三判断结果;若所述第三判断结果为是,则根据所述目标智能体当前时刻的位置和所述目标智能体当前时刻的速度计算避障控制本文档来自技高网
...

【技术保护点】
1.一种多智能体分布式协同动态覆盖方法,其特征在于,包括:/n获取目标智能体当前时刻的位置和当前时刻的速度;/n更新目标智能体上一时刻的覆盖信息素图,得到目标智能体当前时刻的本地更新信息素图;/n判断邻居节点集是否为空,得到第一判断结果;所述邻居节点集为目标智能体通信范围内的所有智能体的集合;/n若所述第一判断结果为否,则接收所述邻居节点集发送的消息包,并采用所述消息包更新所述目标智能体当前时刻的本地更新信息素图,得到目标智能体当前时刻的融合更新信息素图;所述消息包包括所述邻居节点集中各智能体的身份标识号、各智能体当前时刻的位置和各智能体当前时刻的本地更新信息素图;/n基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图,计算目标智能体当前时刻的综合控制项;所述综合控制项为斥力控制项和效益控制项加权求和而成,或为斥力控制项、效益控制项和避障控制项加权求和而成;/n若所述第一判断结果为是,则基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的本地更新信息素图计算目标智能体当前时刻的综合控制项;所述综合控制项为效益控制项加权而成,或为避障控制项和效益控制项加权求和而成;/n由所述目标智能体当前时刻的综合控制项计算目标智能体下一时刻的位置和下一时刻的速度,并将下一时刻作为当前时刻再返回更新目标智能体上一时刻的覆盖信息素图,得到目标智能体当前时刻的本地更新信息素图的步骤。/n...

【技术特征摘要】
1.一种多智能体分布式协同动态覆盖方法,其特征在于,包括:
获取目标智能体当前时刻的位置和当前时刻的速度;
更新目标智能体上一时刻的覆盖信息素图,得到目标智能体当前时刻的本地更新信息素图;
判断邻居节点集是否为空,得到第一判断结果;所述邻居节点集为目标智能体通信范围内的所有智能体的集合;
若所述第一判断结果为否,则接收所述邻居节点集发送的消息包,并采用所述消息包更新所述目标智能体当前时刻的本地更新信息素图,得到目标智能体当前时刻的融合更新信息素图;所述消息包包括所述邻居节点集中各智能体的身份标识号、各智能体当前时刻的位置和各智能体当前时刻的本地更新信息素图;
基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图,计算目标智能体当前时刻的综合控制项;所述综合控制项为斥力控制项和效益控制项加权求和而成,或为斥力控制项、效益控制项和避障控制项加权求和而成;
若所述第一判断结果为是,则基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的本地更新信息素图计算目标智能体当前时刻的综合控制项;所述综合控制项为效益控制项加权而成,或为避障控制项和效益控制项加权求和而成;
由所述目标智能体当前时刻的综合控制项计算目标智能体下一时刻的位置和下一时刻的速度,并将下一时刻作为当前时刻再返回更新目标智能体上一时刻的覆盖信息素图,得到目标智能体当前时刻的本地更新信息素图的步骤。


2.根据权利要求1所述的一种多智能体分布式协同动态覆盖方法,其特征在于,所述基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图,计算目标智能体当前时刻的综合控制项,具体包括:
计算斥力控制项;
判断目标智能体当前时刻是否存在障碍物,得到第二判断结果;
若所述第二判断结果为是,则根据所述目标智能体当前时刻的位置和所述目标智能体当前时刻的速度计算避障控制项,根据所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图计算效益控制项,并将所述斥力控制项、所述避障控制项和所述效益控制项加权求和得到目标智能体当前时刻的综合控制项;
若所述第二判断结果为否,则根据所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图计算效益控制项,并将所述斥力控制项和所述效益控制项加权求和得到目标智能体当前时刻的综合控制项。


3.根据权利要求1所述的一种多智能体分布式协同动态覆盖方法,其特征在于,所述基于所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的本地更新信息素图计算目标智能体当前时刻的综合控制项,具体包括:
判断目标智能体当前时刻是否存在障碍物,得到第三判断结果;
若所述第三判断结果为是,则根据所述目标智能体当前时刻的位置和所述目标智能体当前时刻的速度计算避障控制项,根据所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的本地更新信息素图计算效益控制项,并将所述避障控制项和所述效益控制项加权求和得到目标智能体当前时刻的综合控制项;
若所述第三判断结果为否,则根据所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的本地更新信息素图计算效益控制项,并将所述效益控制项加权得到目标智能体当前时刻的综合控制项。


4.根据权利要求2所述的一种多智能体分布式协同动态覆盖方法,其特征在于,在所述计算斥力控制项之前还包括:
判断区域是否完全覆盖,得到第四判断结果;
若所述第四判断结果为否,则执行计算斥力控制项的步骤。


5.根据权利要求2所述的一种多智能体分布式协同动态覆盖方法,其特征在于,所述根据所述目标智能体当前时刻的位置、所述目标智能体当前时刻的速度和所述目标智能体当前时刻的融合更新信息素图计算效益控制项,具体包括:
由所述目标智能体当前时刻的融合更新信息素图和所述目标智能体当前时刻的位置计算目标智能体当前时刻最大化收益的目标位置;
由所述目标智能体当前时刻最大化收益的目标位置、所述目标智能体当前时刻的...

【专利技术属性】
技术研发人员:刘瑜李刚丁自然王学谦谭大宁董博远
申请(专利权)人:中国人民解放军海军航空大学清华大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1