当前位置: 首页 > 专利查询>中山大学专利>正文

一种面向水上围捕任务的多机器人协同追踪方法技术

技术编号:39897069 阅读:9 留言:0更新日期:2023-12-30 13:10
本发明专利技术公开了一种面向水上围捕任务的多机器人协同追踪方法,涉及机器人控制技术领域

【技术实现步骤摘要】
rules
方法解决多机器人间的运动冲突,即机器人陷入局部最小值的问题,最终实现水面环境下多机器人对围捕目标的协同追踪

附图说明
[0015]图1为本专利技术实施例1所述多机器人协同追踪方法的流程示意图;
[0016]图2为本专利技术实施例1中机器人移动方向示意图;
[0017]图3为本专利技术实施例1中围捕模型示意图;
[0018]图4为本专利技术实施例1中采用
D3QN
时的流程示意图;
[0019]图5为本专利技术实施例2所述所述多机器人协同追踪系统的结构示意图

具体实施方式
[0020]本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序

应该理解这样使用的术语在适当情况下可以互换,这仅仅是描述本申请的实施例中对相同属性的对象在描述时所采用的区分方式

此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程

方法

系统

产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程

方法

产品或设备固有的其它单元

[0021]附图仅用于示例性说明,不能理解为对本专利的限制;
[0022]为了更好说明本实施例,附图某些部件会有省略

放大或缩小,并不代表实际产品的尺寸;相同或相似的标号对应相同或相似的部件;
[0023]对于本领域的普通技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的

[0024]以下将结合附图和实施例对本专利技术的技术方案做进一步的说明,本领域技术人员可由本说明书中所揭露的内容轻易地了解本专利技术的其他优点与功效

本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变

应当理解,优选实施例仅为了说明本专利技术,而不是为了限制本专利技术的保护范围

[0025]需要说明的是,以下实施例中所提供的图示仅以示意方式说明本专利技术的基本构想,遂图式中仅显示与本专利技术中有关的组件而非按照实际实施时的组件数目

形状及尺寸绘制,其实际实施时各组件的型态

数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂

[0026]实施例1[0027]本实施例提出了一种面向水上围捕任务的多机器人协同追踪方法,参阅图1,包括:
[0028]对多机器人在有障碍物的水面环境围捕围捕目标进行分析,建立多机器人协同追踪的围捕模型;
[0029]基于所述围捕模型,根据
APF
方法设计多机器人围捕控制器,并在
APF
方法的基础上引入
Wall Following rules
方法;
[0030]根据控制任务需求,利用全连通网络搭建强化学习评价函数模型和控制策略模
型,并对所述多机器人围捕控制器进行训练,得到训练完成的围捕控制策略;
[0031]响应于围捕控制策略,所述多机器人围捕控制器控制多机器人完成对所述围捕目标的协同追踪

[0032]本实施例中,基于
APF
方法的多机器人围捕控制器可保障机器人在有障碍物的水面环境后可以完成相应的避障和围捕的任务,并降低了后续强化学习的训练复杂度;在
APF
方法的基础上加入
Wall Following rules(
沿墙规则
)
方法,可解决多机器人靠近围捕目标时出现的局部最小解问题,避免沿墙运动时多机器人间的运动冲突;随后加入强化学习方法,构建了基于人工势场法

Wall Following rules

强化学习的自适应协同追踪方法,训练完成的围捕控制策略可保证控制器对于水上围捕任务的鲁棒性

[0033]在一些示例中,所述机器人为无人航行器,包括但不限于无人船舶

水下机器人

[0034]在一优选实施例中,对于第
i
个所述机器人,所述多机器人围捕控制器采用总虚力作为所述机器人的参考航向,其公式表示如下:
[0035]F
i

F
a

i
+F
r

i
+F
in

i
[0036]式中,
F
a

i
表示所述机器人受到的吸引力;
F
i

i
表示所述机器人受到的排斥力;
F
in

i
表示所述机器人受到的个体间力;
[0037]将第
i
个所述机器人受到的吸引力

排斥力的合力记为
F
ar

i
,判断
F
ar

i

F
a

i
间的夹角是否超过第一预设阈值:若是,令第
i
个所述机器人沿垂直于
F
r

i
的方向移动;否则,令第
i
个所述机器人沿总虚力方向移动

[0038]需要说明的是,
APF
方法是一种在线路径规划算法,该算法将目标和障碍物分别看做对机器人有吸引力和排斥力的物体,机器人沿吸引力与排斥力的合力来进行运动;此外,所述个体间力表示多机器人间的力,其可能表现为吸引力,也可能表现为排斥力,由本领域技术人员根据实际情况自行设定

[0039]在一些示例中,对于任意两个机器人,当其中一个机器人与另一机器人
(
即同伴
)
间的距离超过指定距离时,个体间力表现为吸引力;当其与同伴间的距离小于指定距离时,个体间力表现为排斥力

[0040]该优选实施例中,所述机器人每次移动前,根据合力
F
ar

i
与吸引力
F
a

i
间的夹角大小确定移动方向,实现在
APF
方法中
Wall Following rules
方法的引入

[0041]在一些示例中,所述第一预设阈值为
90
°
;参阅图2,当合力
F
ar

i
与吸引力
F<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种面向水上围捕任务的多机器人协同追踪方法,其特征在于,包括:对多机器人在有障碍物的水面环境围捕围捕目标进行分析,建立多机器人协同追踪的围捕模型;基于所述围捕模型,根据
APF
方法设计多机器人围捕控制器,并在
APF
方法的基础上引入
Wall Following rules
方法;根据控制任务需求,利用全连通网络搭建强化学习评价函数模型和控制策略模型,并对所述多机器人围捕控制器进行训练,得到训练完成的围捕控制策略;响应于所述围捕控制策略,所述多机器人围捕控制器控制多机器人完成对所述围捕目标的协同追踪
。2.
根据权利要求1所述的一种面向水上围捕任务的多机器人协同追踪方法,其特征在于,对于第
i
个所述机器人,所述多机器人围捕控制器采用总虚力作为所述机器人的参考航向,其公式表示如下:
F
i

F
a

i
+F
r

i
+F
in

i
式中,
F
a

i
表示所述机器人受到的吸引力;
F
r

i
表示所述机器人受到的排斥力;
F
in

i
表示所述机器人受到的个体间力;将第
i
个所述机器人受到的吸引力

排斥力的合力记为
F
ar

i
,判断
F
ar

i

F
a

i
间的夹角是否超过第一预设阈值:若是,令第
i
个所述机器人沿垂直于
F
r

i
的方向移动;否则,令第
i
个所述机器人沿总虚力方向移动
。3.
根据权利要求2所述的一种面向水上围捕任务的多机器人协同追踪方法,其特征在于,所述令第
i
个所述机器人沿垂直于
F
r

i
的方向移动,包括:判断第
i
个所述机器人受到的所述个体间力
F
in

i
是否超过第二预设阈值:若是,令第
i
个所述机器人沿与
F
in

i
间夹角最小的方向移动;否则,令第
i
个所述机器人沿与其当前航向
φ
i
间夹角最小的方向移动
。4.
根据权利要求2所述的一种面向水上围捕任务的多机器人协同追踪方法,其特征在于,所述围捕模型被配置有所述机器人的感知范围

捕获距离,以及所述机器人的观测数据;对于第
i
个所述机器人,所述排斥力的公式表示如下:式中,
ρ0表示所述障碍物的影响范围;
η
表示正比例因子;
x
o,i
表示距离第
i
个所述机器人最近的所述障碍物的坐标位置;
x
i
表示第
i
个所述机器人的坐标位置;所述吸引力为归一化的单位向量;所述个体间力的公式表示如下:其中,
P(i)
表示第
i
个所述机器人感知到的同伴的集合;
x
j
表示
P(i)
内第
j
个所述机器人的坐标位置;...

【专利技术属性】
技术研发人员:张清瑞刘坤达刘赟韵于程浩
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1