一种面向动态任务的多智能体分布式任务分配方法组成比例

技术编号:26690870 阅读:38 留言:0更新日期:2020-12-12 02:42
本发明专利技术提供一种面向动态任务的多智能体分布式任务分配方法,考虑到任务的动态演化性,利用拍卖‑征召算法形成预分配方案,实用性强,可以被用来完成协同多点聚集、协同多目标侦察与协同多目标围捕等任务,使智能体间的决策无冲突且有效保证了任务完成效率,任务分配率达到100%;此外,本发明专利技术智能体行为和通讯都是基于统一的框架,基于这种框架智能体可以增添或删减,增加了整个系统的鲁棒性,适用与智能体会出现损毁,以及随时会增加智能体的场景。

【技术实现步骤摘要】
一种面向动态任务的多智能体分布式任务分配方法
本专利技术属于多智能体任务分配
,尤其涉及一种面向动态任务的多智能体分布式任务分配方法。
技术介绍
随着无人系统等理论的发展,智能体性能的提高,使用多智能体完成高度危险、任务点分散、时间敏感、蕴含多种不确定性的动态任务(例如森林救火)已经成为未来趋势。在森林救火任务中因为自然或者人为的因素,火势(任务的强度)会随着时间发生改变。在火灾发生初期,可能一个智能体就可以扑灭火源,但是火势会随着时间的推移不断增大,导致任务的强度也随之变大,单个的智能体已经不能满足复杂救火任务需求,需要利用多个智能体一起协同完成这些给定的救火任务。多智能体协作可以有效提高救援效率,并减少救援人员的所需数量和伤亡。从解决机制上看,多智能体任务分配可分为集中式与分布式。集中式分配中有一个机器人作为中央规划器,通过与其他机器人的通信获取当前任务和环境状态,然后进行全局任务分配。该方法具有良好的全局特性,但依赖单一的中心规划器。在分布式任务分配中没有中央规划器。每个智能体通过自身对环境信息的感知自主进行任务选择和决策,多个智能体通过相互协商形成任务分配方案。常用的分布式任务分配方法有基于市场机制的方法、基于空闲链的方法、阈值响应法等。分布式决策适合并行计算,扩展性和鲁棒性都较好,适用于较大规模的系统。但是目前已有的分布式任务分配方法,它们任务建模大多假设认为任务的强度不会改变,都没有考虑到任务的强度随时间变化的情况。
技术实现思路
为解决上述问题,本专利技术提供一种面向动态任务的多智能体分布式任务分配方法,能够有效、快速地对多个目标任务进行分配,使动态任务尽快完成。一种面向动态任务的多智能体分布式任务分配方法,基于拍卖-征召算法为多智能体分配分布式任务,所述方法包括以下步骤:S1:将各智能体分别作为当前智能体执行如下操作:获取当前智能体i对各未完成任务的出价值,将出价值最大值对应的未完成任务作为当前智能体i最擅长的任务j*,并以此构建当前智能体i对应的投标向量A(i)=[i,j*,fi(j*)],再将投标向量A(i)广播给其他智能体,其中,fi(j*)为当前智能体i对其最擅长的任务j*的出价值;S2:各智能体分别将接收到的投标向量中的出价值与自身投标向量中的出价值作对比,将其中的最小值对应的投标向量作为自身最终的投标向量APM,且将广播出投标向量APM的智能体作为任务经理,任务经理将其最擅长的任务作为自身任务列表中下一个待执行的任务jPM;S3:各智能体判断任务经理是否能独立完成任务jPM,若任务经理不能独立完成任务jPM,各智能体分别获取自身对任务jPM的出价值与自身最擅长任务的出价值之间的差值;任务经理接收到各智能体传递出的差值后,向差值最大的前m个智能体发送任务联盟邀请,使所述前m个智能体将任务jPM分别作为其自身任务列表中下一个待执行的任务,形成任务联盟,再进入步骤S4,其中,m为使得参与任务jPM的所有智能体的能力值总和大于任务jPM的强度变化率所需要加入的最少智能体数量;若任务经理能够独立完成任务jPM,则任务经理单独形成任务联盟,并直接进入步骤S4;S4:将任务jPM从未完成任务中剔除,重新执行步骤S1~S3,直到所有任务均被分配。进一步地,在将任务jPM从未完成任务中剔除前,执行以下步骤:S3a:任务经理向没有将任务jPM作为任务列表中下一个待执行任务的智能体广播征召信息,其中,所述征召信息包括任务联盟中各智能体的编号以及任务jPM的完成时间S3b:各个接收到征召信息的智能体分别根据自身位置信息与征召信息获取自身与任务联盟一起完成任务jPM的完成时间tcc,并将完成时间tcc发送给任务经理;S3c:任务经理根据所有完成时间tcc中的最小值计算时间差值比TS:S3d:任务经理判断所述时间差值比TS是否大于预设阈值,若大于,则任务经理向最小值对应的智能体发送任务联盟邀请,使得该智能体将任务jPM作为其自身任务列表中下一个待执行的任务,并完成任务联盟的更新,进入步骤S3e;若不大于,进入步骤S4;S3e:采用更新后的任务联盟重新执行步骤S3a~S3d,直到时间差值比TS不大于预设阈值。进一步地,所述完成时间tcc的计算方法为:其中,ε为设定阈值,为当前的任务联盟中第si个智能体的能力值,且si=1,2,…,m,为第si个智能体到达任务jPM所在位置的时刻,为第l个智能体到达任务jPM所在位置的时刻,bl为接收到征召信息的第l个智能体的能力值,为任务jPM的强度状态变化率。进一步地,当任意一个智能体完成其任务列表中的所有任务后,该智能体获取其他智能体当前执行的任务,根据自身位置信息、各个当前执行的任务的位置信息、任务强度信息以及对应的任务联盟获取自身完成各个当前执行的任务的完成时间,将完成时间最大值对应的当前执行的任务加入到自己的任务列表中,开始执行该任务。进一步地,当前智能体i对各未完成任务的出价值的获取方法为:其中,fi(j)为当前智能体i对第j个任务的出价值,λj为第j个任务的强度状态变化率,为当前智能体i到达第j个任务所在位置的时刻,为当前时刻,为当前智能体i的位置坐标,为第j个任务的位置坐标,为当前智能体i的速度。进一步地,所述智能体为无人机、机器人、侦察机或者智能打击武器。有益效果:1、本专利技术提供一种面向动态任务的多智能体分布式任务分配方法,考虑到任务的动态演化性,利用拍卖-征召算法形成预分配方案,实用性强,可以被用来完成协同多点聚集、协同多目标侦察与协同多目标围捕等任务,使智能体间的决策无冲突且有效保证了任务完成效率,任务分配率达到100%;此外,本专利技术智能体行为和通讯都是基于统一的框架,基于这种框架智能体可以增添或删减,增加了整个系统的鲁棒性,适用与智能体会出现损毁,以及随时会增加智能体的场景。2、本专利技术提供一种面向动态任务的多智能体分布式任务分配方法,在得到完成某一任务的任务联盟后,根据当前任务联盟的征召信息和任务联盟以外的各智能体的信息,找到能够大大缩短任务完成时间的其他智能体,并请求这些智能体加入任务联盟,能够在有效保证任务分配效率的基础上,进一步缩短任务的完成时间。3、本专利技术提供一种面向动态任务的多智能体分布式任务分配方法,在各智能体完成自身预分配任务后,智能体根据任务执行情况,动态地调整自身规划协助其他智能体完成任务,能够加速整体任务的完成。附图说明图1为本专利技术提供的一种多智能体分布式任务分配方法的流程图;图2为当智能体位于任务点时任务状态变化示意图;图3为预分配方案生成过程示意图;图4为本专利技术实施例中任务点1的状态变化图;图5为本专利技术实施例中任务点2的状态变化图;图6为本专利技术实施例中任务点3的状态变化图。具体实施方式为了使本
的人员更好地理解本申请方案,下本文档来自技高网
...

【技术保护点】
1.一种面向动态任务的多智能体分布式任务分配方法,其特征在于,基于拍卖-征召算法为多智能体分配分布式任务,具体包括以下步骤:/nS1:将各智能体分别作为当前智能体执行如下操作:/n获取当前智能体i对各未完成任务的出价值,将出价值最大值对应的未完成任务作为当前智能体i最擅长的任务j

【技术特征摘要】
1.一种面向动态任务的多智能体分布式任务分配方法,其特征在于,基于拍卖-征召算法为多智能体分配分布式任务,具体包括以下步骤:
S1:将各智能体分别作为当前智能体执行如下操作:
获取当前智能体i对各未完成任务的出价值,将出价值最大值对应的未完成任务作为当前智能体i最擅长的任务j*,并以此构建当前智能体i对应的投标向量A(i)=[i,j*,fi(j*)],再将投标向量A(i)广播给其他智能体,其中,fi(j*)为当前智能体i对其最擅长的任务j*的出价值;
S2:各智能体分别将接收到的投标向量中的出价值与自身投标向量中的出价值作对比,将其中的最小值对应的投标向量作为自身最终的投标向量APM,且将广播出投标向量APM的智能体作为任务经理,任务经理将其最擅长的任务作为自身任务列表中下一个待执行的任务jPM;
S3:各智能体判断任务经理是否能独立完成任务jPM,若任务经理不能独立完成任务jPM,各智能体分别获取自身对任务jPM的出价值与自身最擅长任务的出价值之间的差值;任务经理接收到各智能体传递出的差值后,向差值最大的前m个智能体发送任务联盟邀请,使所述前m个智能体将任务jPM分别作为其自身任务列表中下一个待执行的任务,形成任务联盟,再进入步骤S4,其中,m为使得参与任务jPM的所有智能体的能力值总和大于任务jPM的强度变化率所需要加入的最少智能体数量;若任务经理能够独立完成任务jPM,则任务经理单独形成任务联盟,并直接进入步骤S4;
S4:将任务jPM从未完成任务中剔除,重新执行步骤S1~S3,直到所有任务均被分配。


2.如权利要求1所述的一种面向动态任务的多智能体分布式任务分配方法,其特征在于,在将任务jPM从未完成任务中剔除前,执行以下步骤:
S3a:任务经理向没有将任务jPM作为任务列表中下一个待执行任务的智能体广播征召信息,其中,所述征召信息包括任务联盟中各智能体的编号以及任务jPM的完成时间
S3b:各个接收到征召信息的智能体分别根据自身位置信息与征召信息获取自身与任务联盟一起完成任务jPM的完成时间tcc,并将完成时间tcc发送给任务...

【专利技术属性】
技术研发人员:辛斌丁玉隆陈杰方浩杜鑫张昊
申请(专利权)人:北京理工大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1