用于运行多代理系统中的机器人的方法、机器人以及多代理系统技术方案

技术编号:25053234 阅读:24 留言:0更新日期:2020-07-29 05:40
本发明专利技术涉及一种用于运行具有多个机器人(1)的多代理系统的方法,其中所述机器人(1)中的每个机器人都周期性地实施如下方法直至达到目标系统状态:‑基于当前的系统状态(q1‑q10),确定(S11)可能的选项,在所述可能的选项的情况下在预先给定的确定性有限自动机(DEA)中实现沿着系统状态的路径的进展,其中所述选项限定了如下行动,通过所述行动能实现从当前的系统状态(q1‑q10)过渡到随后的系统状态(q1‑q10);‑针对所述可能的选项中的每个选项,确定(S12)用于执行通过所述选项来说明的行动的成本值;‑执行(S14、S15)拍卖,其中针对每个选项所确定的成本值被其余的机器人(1)中的每个机器人都考虑到;以及‑根据所有针对相关选项所确定的或所接收到的成本值,实施(S16)对应于所述选项之一的行动。

【技术实现步骤摘要】
【国外来华专利技术】用于运行多代理系统中的机器人的方法、机器人以及多代理系统
本专利技术涉及多代理系统以及尤其是用于通过借助于协同拍卖过程对任务的分发来控制多代理系统的机器人的方法。
技术介绍
机器人的团队进行协同来共同完成任务尤其是在环境条件有不确定性的情况下以及在任务规范中有时间相关性的情况下是困难的。将任务规范分解成子任务需要适当的机制来对任务规范进行分解,其中尤其是由于真实环境的不确定性而不能令人满意地针对各个机器人分配操作命令。为了描绘机器人的各个操作之间的时间相关性,公知描述语言、即所谓的线性时序逻辑(LinearTemporalLogic,LTL),该描述语言以LTL规范的方式来描绘任务规范。根据LTL规范,可以以本身公知的方式推导出各个机器人的行动计划、也就是说操作命令的集合。用于机器人应用的LTL能够实现:将时间边界条件集成到概率模型中,尤其是在马尔可夫决策过程的情况下(MDP:MarkovDecisionProcesses)将时间边界条件集成到概率模型中。马尔可夫决策过程能够实现:描绘包括实施行动的未知时长和在环境中的随本文档来自技高网...

【技术保护点】
1.一种用于运行具有多个机器人(1)的多代理系统的方法,其中所述机器人(1)中的每个机器人都周期性地实施如下方法直至达到目标系统状态:/n- 基于当前的系统状态(q1-q10),确定(S11)可能的选项,在所述可能的选项的情况下在预先给定的确定性有限自动机(DEA)中实现沿着系统状态的路径的进展,其中所述选项限定了如下行动,通过所述行动能实现从当前的系统状态(q1-q10)过渡到随后的系统状态(q1-q10);/n- 针对所述可能的选项中的每个选项,确定(S12)用于执行通过所述选项来说明的行动的成本值;/n- 执行(S14、S15)拍卖,其中针对每个选项所确定的成本值被其余的机器人(1)中的...

【技术特征摘要】
【国外来华专利技术】20171222 DE 102017223717.11.一种用于运行具有多个机器人(1)的多代理系统的方法,其中所述机器人(1)中的每个机器人都周期性地实施如下方法直至达到目标系统状态:
-基于当前的系统状态(q1-q10),确定(S11)可能的选项,在所述可能的选项的情况下在预先给定的确定性有限自动机(DEA)中实现沿着系统状态的路径的进展,其中所述选项限定了如下行动,通过所述行动能实现从当前的系统状态(q1-q10)过渡到随后的系统状态(q1-q10);
-针对所述可能的选项中的每个选项,确定(S12)用于执行通过所述选项来说明的行动的成本值;
-执行(S14、S15)拍卖,其中针对每个选项所确定的成本值被其余的机器人(1)中的每个机器人都考虑到;
-根据所有针对相关选项所确定的或所接收到的成本值,实施(S16)对应于所述选项之一的行动。


2.根据权利要求1所述的方法,其中如果针对相对应的选项确定自己的成本值,所述成本值说明了所有针对相对应的选项所接收到的成本值的最低成本,则实施对应于所述选项之一的行动。


3.根据权利要求1或2所述的方法,其中如果针对所述选项中的任何一个选项都没有确定自己的成本值,所述成本值说明了所有针对相对应的选项所接收到的成本值的最低成本,则不实施对应于所述选项之一的行动。


4.根据权利要求1或2所述的方法,其中如果针对所述选项中的任何一个选项都没有确定自己的成本值,所述成本值说明了所有针对相对应的选项所接收到的成本值的最低成本,则实施沿着在所述确定性有限自动机(DEA)中的路径的其它选项的行动,而且其中所述其它选项被选择为使得履行与所述其它选项相对应的行动并不违反对在所述拍卖中所分发的选项的行动的执行。


5.根据权利要求1至4中任一项所述的方法,其中选项的成本值根据实施被分配给所述选项的行动的时长和/或在实施被分配给所述选项的行动时所述选项通向用于达到所述系统状态(q1-q10)的状态条件的概率来确定。


6.根据权利要求5所述的方法,其中在实施被分配给选项的行动时实现用于达到所述系统状态(q1-q10)的状态条件的概率在实施所述行动...

【专利技术属性】
技术研发人员:M比尔格PC席林格
申请(专利权)人:罗伯特·博世有限公司
类型:发明
国别省市:德国;DE

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1