【技术实现步骤摘要】
rules
方法解决多机器人间的运动冲突,即机器人陷入局部最小值的问题,最终实现水面环境下多机器人对围捕目标的协同追踪
。
附图说明
[0015]图1为本专利技术实施例1所述多机器人协同追踪方法的流程示意图;
[0016]图2为本专利技术实施例1中机器人移动方向示意图;
[0017]图3为本专利技术实施例1中围捕模型示意图;
[0018]图4为本专利技术实施例1中采用
D3QN
时的流程示意图;
[0019]图5为本专利技术实施例2所述所述多机器人协同追踪系统的结构示意图
。
具体实施方式
[0020]本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序
。
应该理解这样使用的术语在适当情况下可以互换,这仅仅是描述本申请的实施例中对相同属性的对象在描述时所采用的区分方式
。
此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程
、
方法
、
系统
、
产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程
、
方法
、
产品或设备固有的其它单元
。
[0021]附图仅用于示例性说明,不能理解为对本专利的限制;
[0022]为了更好说明本实施例,附图某些部件会有省略
、
放大或缩小, ...
【技术保护点】
【技术特征摘要】
1.
一种面向水上围捕任务的多机器人协同追踪方法,其特征在于,包括:对多机器人在有障碍物的水面环境围捕围捕目标进行分析,建立多机器人协同追踪的围捕模型;基于所述围捕模型,根据
APF
方法设计多机器人围捕控制器,并在
APF
方法的基础上引入
Wall Following rules
方法;根据控制任务需求,利用全连通网络搭建强化学习评价函数模型和控制策略模型,并对所述多机器人围捕控制器进行训练,得到训练完成的围捕控制策略;响应于所述围捕控制策略,所述多机器人围捕控制器控制多机器人完成对所述围捕目标的协同追踪
。2.
根据权利要求1所述的一种面向水上围捕任务的多机器人协同追踪方法,其特征在于,对于第
i
个所述机器人,所述多机器人围捕控制器采用总虚力作为所述机器人的参考航向,其公式表示如下:
F
i
=
F
a
,
i
+F
r
,
i
+F
in
,
i
式中,
F
a
,
i
表示所述机器人受到的吸引力;
F
r
,
i
表示所述机器人受到的排斥力;
F
in
,
i
表示所述机器人受到的个体间力;将第
i
个所述机器人受到的吸引力
、
排斥力的合力记为
F
ar
,
i
,判断
F
ar
,
i
与
F
a
,
i
间的夹角是否超过第一预设阈值:若是,令第
i
个所述机器人沿垂直于
F
r
,
i
的方向移动;否则,令第
i
个所述机器人沿总虚力方向移动
。3.
根据权利要求2所述的一种面向水上围捕任务的多机器人协同追踪方法,其特征在于,所述令第
i
个所述机器人沿垂直于
F
r
,
i
的方向移动,包括:判断第
i
个所述机器人受到的所述个体间力
F
in
,
i
是否超过第二预设阈值:若是,令第
i
个所述机器人沿与
F
in
,
i
间夹角最小的方向移动;否则,令第
i
个所述机器人沿与其当前航向
φ
i
间夹角最小的方向移动
。4.
根据权利要求2所述的一种面向水上围捕任务的多机器人协同追踪方法,其特征在于,所述围捕模型被配置有所述机器人的感知范围
、
捕获距离,以及所述机器人的观测数据;对于第
i
个所述机器人,所述排斥力的公式表示如下:式中,
ρ0表示所述障碍物的影响范围;
η
表示正比例因子;
x
o,i
表示距离第
i
个所述机器人最近的所述障碍物的坐标位置;
x
i
表示第
i
个所述机器人的坐标位置;所述吸引力为归一化的单位向量;所述个体间力的公式表示如下:其中,
P(i)
表示第
i
个所述机器人感知到的同伴的集合;
x
j
表示
P(i)
内第
j
个所述机器人的坐标位置;...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。