机器人导航规划方法及存储介质和终端设备技术

技术编号:39799382 阅读:6 留言:0更新日期:2023-12-22 02:30
本发明专利技术涉及机器人导航规划方法及存储介质和终端设备,包括:构建以全局路径规划

【技术实现步骤摘要】
机器人导航规划方法及存储介质和终端设备


[0001]本专利技术涉及控制领域,特别是涉及一种机器人的导航技术


技术介绍

[0002]当前机器人技术在各行各业都有着广泛的应用,例如送餐机器人

安防机器人等

这些场景中,机器人可能会面对复杂的地形环境,遇到人和车辆等各种障碍物,给导航带来极大挑战

所以应运而生了机器人导航技术,即根据地图和环境信息给出机器人的移动方向和速度大小,引导机器人朝着目标点运动,同时能够防止碰到障碍物

[0003]传统算法,如专利申请
CN107436148B
公开了根据全局路径

局部代价地图

障碍物的运动状态信息和估计的运动轨迹,来计算机器人的导航策略,提高避障能力,没有使用深度学习算法,其导航响应速度和准确度都不太高

[0004]随着深度学习技术的发展,已应用于机器人导航中,如专利申请
CN115585813A
公开了一种基于注意力机制的深度强化学习机器人导航方法,来提高陌生且复杂环境中进行导航能力;专利申请
CN112882469B
公开了将全局路径作为初始路径,并在该路径中选择一个位于机器人和目标点间的路点作为机器人的临时目标,用于训练基于深度强化学习的导航模型,能够提高机器人的导航效率

[0005]这些方法取得了不错的效果,但仍然至少存在以下两个问题:1)为应对环境信息的更新或者障碍物的出现,导航系统需要进行全局路径的重规划,但是现有重规划的时机都是通过设置规则来选择的,可能会出现过于频繁或者不够及时的问题;2)在局部路径的规划中,忽略了移动障碍物之间的位置和速度关系,导致在行人

障碍物较多的拥挤环境中性能较差

[0006]因此,如何进一步提高机器人的导航效果,改善上述至少一个问题,是本领域亟待解决的核心要点


技术实现思路

[0007]为解决上述技术问题,本专利技术提供一种机器人导航规划方法,包括:
S1
:构建以全局路径规划

局部代价地图和机器人动作为输入,是否进行全局路径重规划或机器人下一步动作为输出的导航模型;
S2
:根据机器人所处环境,确定当前全局路径规划;
S3
:根据机器人状态,确定当前局部代价地图和当前机器人动作;
S4
:将当前全局路径规划

当前局部代价地图和当前机器人动作,输入导航模型,输出是否进行全局路径重规划或机器人下一步动作;
S5
:若输出为进行全局路径重规划,则返回步骤
S2
;若输出为机器人下一步动作,则根据输出结果导航机器人下一步动作;导航模型,包括输入层

特征提取层

拼接层和输出层;输入层,以状态空间
state=[keypoints, costmap, velocity]为输入;其中
keypoints
表示由当前位置到
m
个路径点的坐标向量,为全局路径规划;
costmap
表示局部代价地图;
velocity
表示机器人速度;
m
是后续路径点的个数;特征提取层,包括三部分;第一部分以状态空间
state
中的机器人速度为输入,包括两个全连接层,提取得到第一特征;第二部分以状态空间
state
中的
m
个路径点的坐标向量为输入,包括两个全连接层,提取得到第二特征;第三部分以状态空间
state
中的局部代价地图为输入,包括一个深度卷积网络,和一个全连接层,提取得到第三特征;拼接层,将第一特征

第二特征和第三特征进行拼接,再将拼接结果输入到一个全连接层中;输出层,以动作空间
action=[Replan, Vs]为输出;其中,
Replan
表示是否进行全局路径重规划, Vs
表示下一步动作,包括速度大小和方向

[0008]进一步地,
Vs
包括若干个离散动作,用速度和方向表示

[0009]进一步地,
Vs

a*b
个离散动作组成;其中
a
为速度数量,
a
个速度在 (0, V_max ]之间呈平均间隔
;b
为方向数量,
b
个方向均匀分布在 [

Turn_max, Turn_max)
之间;其中
V_max
是机器人的最大速度,
Turn_max
是机器人的最大角度;动作空间总共有
a*b+1


[0010]进一步地,选择导航模型输出得分最高的动作确定是否进行全局路径重规划或下一步动作

[0011]进一步地,采用深度强化学习方法对导航模型进行训练,训练的奖励函数表示为:
R = R_step + R_collision + R_safety + R_waypoint
其中,
R_step
表示较小的负的步长得分;
R_collision
表示对碰撞的惩罚得分;
R_safety
表示避免碰撞的安全得分;
R_waypoint
表示靠近目标的奖励得分

[0012]进一步地,骤
S2
,包括:
S21
:根据机器人所处环境,确定全局路径点;
S22
:将全局路径点做路径规划,确定从当前点到目标点的可行路径

[0013]进一步地,步骤
S3
,包括:
S31
:机器人感应周围环境的点云数据;
S32
:根据点云数据,分别确定周围障碍物的位置坐标
、X
轴速度和
Y
轴速度,以分别得到局部障碍物位置代价图
、X
轴速度代价图和
Y
轴速度代价图;
S33
:将局部障碍物位置代价图
、X
轴速度代价图和
Y
轴速度代价图进行拼接,得到局部代价地图

[0014]进一步地,步骤
S32
,包括:根据点云数据,计算周围障碍物的位置坐标,并填充至栅格地图中,得到局部障碍物位置代价图;对点云数据进行聚类,估计周围移动障碍物的速度,分别投射到
X
轴和
Y
轴上,并将其值填充至地图中障碍物的位置上,得到
X
轴速度代价图和
Y
轴速度代价图
...

【技术保护点】

【技术特征摘要】
1.
一种机器人导航规划方法,其特征在于,包括:
S1
:构建以全局路径规划

局部代价地图和机器人动作为输入,是否进行全局路径重规划或机器人下一步动作为输出的导航模型;
S2
:根据机器人所处环境,确定当前全局路径规划;
S3
:根据机器人状态,确定当前局部代价地图和当前机器人动作;
S4
:将当前全局路径规划

当前局部代价地图和当前机器人动作,输入导航模型,输出是否进行全局路径重规划或机器人下一步动作;
S5
:若输出为进行全局路径重规划,则返回步骤
S2
;若输出为机器人下一步动作,则根据输出结果导航机器人下一步动作;导航模型,包括输入层

特征提取层

拼接层和输出层;输入层,以状态空间
state=[keypoints, costmap, velocity]
为输入;其中
keypoints
表示由当前位置到
m
个路径点的坐标向量,为全局路径规划;
costmap
表示局部代价地图;
velocity
表示机器人速度;
m
是后续路径点的个数;特征提取层,包括三部分;第一部分以状态空间
state
中的机器人速度为输入,包括两个全连接层,提取得到第一特征;第二部分以状态空间
state
中的
m
个路径点的坐标向量为输入,包括两个全连接层,提取得到第二特征;第三部分以状态空间
state
中的局部代价地图为输入,包括一个深度卷积网络,和一个全连接层,提取得到第三特征;拼接层,将第一特征

第二特征和第三特征进行拼接,再将拼接结果输入到一个全连接层中;输出层,以动作空间
action=[Replan, Vs]
为输出;其中,
Replan
表示是否进行全局路径重规划, Vs
表示下一步动作,包括速度大小和方向
。2.
根据权利要求1所述的机器人导航规划方法,其特征在于,
Vs
包括若干个离散动作,用速度和方向表示
。3.
根据权利要求2所述的机器人导航规划方法,其特征在于,
Vs

a*b
个离散动作组成;其中
a
为速度数量,
a
个速度在 (0, V_max ]
之间呈平均间隔
;b
为方向数量,
b
个方向均匀分布在 [

Turn_max, Turn_max)
之间;其中
...

【专利技术属性】
技术研发人员:陈俊逸汤继敏
申请(专利权)人:长沙小钴科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1