当前位置: 首页 > 专利查询>湖南大学专利>正文

一种室内移动机器人增强地图学习路径规划方法技术

技术编号:10933617 阅读:128 留言:0更新日期:2015-01-21 13:49
本发明专利技术公开了一种室内移动机器人增强地图学习路径规划方法,其步骤为:(1)获取周围环境信息,建立障碍概率密度模型;(2)利用贪心算法和增强地图学习方法进行路径规划;(3)室内移动机器人路径选择及自适应速度调整策略。采用的增强地图学习路径规划能够根据室内移动机器人的当前状况和机器人固有的非完整约束,实时规划当前最佳路径,同时自适应的速度调整策略可以兼顾室内移动机器人的越障能力,目标点收敛能力和规划效率,使室内移动机器人能够安全有效的到达指定位置。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了,其步骤为:(1)获取周围环境信息,建立障碍概率密度模型;(2)利用贪心算法和增强地图学习方法进行路径规划;(3)室内移动机器人路径选择及自适应速度调整策略。采用的增强地图学习路径规划能够根据室内移动机器人的当前状况和机器人固有的非完整约束,实时规划当前最佳路径,同时自适应的速度调整策略可以兼顾室内移动机器人的越障能力,目标点收敛能力和规划效率,使室内移动机器人能够安全有效的到达指定位置。【专利说明】
本专利技术涉及地面轮式机器人的自主导航领域,特别涉及一种室内移动机器人增强 地图学习路径规划方法。
技术介绍
随着机器人技术的发展和人工智能研究的不断深入,智能机器人在人类生活中扮 演越来越重要的角色。作为常见生活机器人的一种,室内移动机器人作为服务人员的代替 者多用于室内移动展会,家庭服务,酒店大厅引导等复杂动态环境。在这类环境中,环境信 息非结构化,静态动态障碍物交错存在,环境信息变化明显,这些因素对室内移动机器人的 工作能力提出了极大的挑战和要求。为较好地完成服务任务,室内移动机器人需要具有探 测障碍物,区分识别障碍物,实时规划可行路径,稳定控制行动的能力。随着传感器技术、计 算机技术和网络通信技术的不断发展,实时路径规划作为智能机器人的大脑成为室内移动 机器人研究的重中之重。 室内移动机器人在环境中的任务可以理解为从哪儿来?到哪儿去?怎么去?去 做什么?而路径规划能够统筹传感器获得的环境信息做出最符合机器人当前状况的路径 决策,即怎么去。常规的路径规划可以分别静态规划和动态规划,静态规划是指机器人已具 备全局环境信息,机器人通过离线计算得到全局环境下最优的规划路径,而动态路径规划 多针对动态未知环境中的路径选择,机器人对环境信息理解有限且环境可能发生改变,与 真实情况具有高度的相似性。对于室内移动机器人,我们期望其能够实现在室内移动动态 环境中的实时最佳路径选择和动态障碍物躲避。 作为控制和规划的对象,室内移动机器人是一类具有时变、强耦合和非完整性的 多输入多输出非线性系统。由于环境多变复杂且需要考虑较多因素,其规划决策变的十分 复杂。在现有的技术中,常规的路径规划,如模糊规划,遗传算法,蚁群算法,神经网络等,往 往不能同时满足动态环境和实时性的要求。另外,轮式移动机器人存在的非完整性也制约 着室内移动机器人的路径选择。因此,研究具有学习能力的路径规划算法成为现阶段实时 动态路径规划研究的一个主流趋势。而设计一种简单可靠、实时性好、便于实现、能够应付 多类动态未知环境的室内移动机器人规划方法是保证服务工作正常有效进行的关键技术 和现实难题。
技术实现思路
本专利技术针对上述现有技术中现在路径规划方法中难以同时满足动态未知环境规 划和实时规划的要求,采用增强地图学习的路径规划方法,随着室内移动机器人的移动,不 断加深理解新获得的周围环境信息,迭代计算随机选取路径的代价函数,学习计算得出当 前时刻最优的路径,保证了室内移动机器人的静态障碍下的良好避障性能,而且满足了动 态障碍出现时的实时规划功能,达到具有较高智能化的室内移动机器人的自主导航和路径 规划方法。 -种室内移动机器人增强地图学习路径规划方法,包括以下几个步骤: 步骤1 :建立已探测区域受障碍物影响的概率模型; 首先,通过室内移动机器人自身携带的声呐传感器,获得室内移动机器人的周围 环境信息;其次,将室内移动机器人所经过的区域作为已探测区域,依据所述的周围环境信 息建立已探测区域受障碍物影响的概率模型,并依据声呐传感器实时采集的周围环境信息 实时更新已探测区域受障碍物影响的概率模型; 所述已探测区域受障碍物影响的概率模型如下: 【权利要求】1. ,其特征在于,包括以下几个步 骤: 步骤1 :建立已探测区域受障碍物影响的概率模型; 首先,通过室内移动机器人自身携带的声呐传感器,获得室内移动机器人的周围环境 信息;其次,将室内移动机器人所经过的区域作为已探测区域,依据所述的周围环境信息建 立已探测区域受障碍物影响的概率模型,并依据声呐传感器实时采集的周围环境信息实时 更新已探测区域受障碍物影响的概率模型; 所述已探测区域受障碍物影响的概率模型如下:其中,室内移动机器人工作空间信息集合为3,所述空间信息包括所有目标位置及所 有障碍物位置;当前探测范围内工作空间信息集合为3_.,已探测出的工作空间信息集合 为 J ^now - ^detected - ^ f {(X,Y)}为已探测区域K k 3de_/丨;在3的地图上探测 到有M个障碍物,fi(X,Y)为第i个障碍物的对室内移动机器人路径选择的影响函数,采用 正态分布表示如下: 1 (-τ-] f;{XJ)=n^e -σ ^2πσ? 其中,〇 i为第i个障碍物的影响范围系数,取值范围为 ;Di为第i个障碍物到已 探测区域内所有位置的距离矩阵,矩阵大小与地图大小一致为N*N ; 步骤2 :基于贪心算法和增强学习迭代策略,在设定的最大迭代次数kmax内,迭代更新 当前位置Pn(W(t)与目标位置PgMl之间的路径代价函数,以达到收敛的路径代价函数对应的 路径作为当前时刻的最佳路径,具体过程如下: 步骤2. 1 :令k = 1,k表示迭代次数; 步骤2. 2:判断当前迭代次数是否已超过设定的最大迭代次数,若超过,则返回步骤 2. 1,;否则,进入步骤2. 3 ; 步骤2.3 :从获得的周围环境信息对应的已知地图中,随机选择一个位置 Pk插入室内移动机器人所在当前位置P_(t)与目标位置PgMl,其中,P k满足条件 丨/>,.Π ,{pj为之前迭代最佳路径代价函数下的路径点集合,3为室内移 动机器人工作空间信息集合;按以下公式计算第k次迭代得到的路径代价函数: 其中,第k-1次迭代得到的路径代价函数,且=1 + ·,Rp-pPt 为已知地图上当前位置PMW(t)与所选位置Pk之间的连接权值,(?为采用贪心算法获得的在 第k次迭代完成后获得的从位置pk到目标位置pgMl的最佳路径代价函数:其中,为目标位置PgMi的代价函数,且0^?, = 0 ; ,为已知地图上在第k次所 选位置点Pk和第k-Ι次所选位置Ph之间的连接权值; 在已知地图中任意两位置?3和^之间的连接权值^ 由两位置之间的直线距离和该 直线上穿过的障碍物影响概率构成:+DH其中,为位置Pa到位置Pb两点之间的物理位置距离;为位置Pa到位置P b的 路径点集合,ds为路径积分单元;max ()为最大值求函数; 步骤2. 4 :判断迭代后得到的路径代价函数是否已经达到收敛,如果收敛,则退 出迭代过程,将已收敛的路径代价函数对应的路径作为最佳路径进入步骤3 ;否则,将迭代 次数k加1,返回步骤2. 2 ; 步骤3 :以步骤2得到的最佳路径作为室内移动机器人当前的预选择路径,依据预选择 路径和室内移动机器人的位置和速度矢量判断室内移动机器人的偏转角是否满足轮式 机器人不能侧向滑动的非完整约束,确定室内移动机器人是否按照预选择路径方向移动: 若不满足,则返回步骤2;若满足则以设定的室内移动机器人移动速度本文档来自技高网
...

【技术保护点】
一种室内移动机器人增强地图学习路径规划方法,其特征在于,包括以下几个步骤:步骤1:建立已探测区域受障碍物影响的概率模型;首先,通过室内移动机器人自身携带的声呐传感器,获得室内移动机器人的周围环境信息;其次,将室内移动机器人所经过的区域作为已探测区域,依据所述的周围环境信息建立已探测区域受障碍物影响的概率模型,并依据声呐传感器实时采集的周围环境信息实时更新已探测区域受障碍物影响的概率模型;所述已探测区域受障碍物影响的概率模型如下:F(X,Y)=1-Πi=1M[1-fi(X,Y)]]]>其中,室内移动机器人工作空间信息集合为所述空间信息包括所有目标位置及所有障碍物位置;当前探测范围内工作空间信息集合为已探测出的工作空间信息集合为{(X,Y)}为已探测区域,在的地图上探测到有M个障碍物,fi(X,Y)为第i个障碍物的对室内移动机器人路径选择的影响函数,采用正态分布表示如下:fi(X,Y)=12πσie(-Di22σi)]]>其中,σi为第i个障碍物的影响范围系数,取值范围为[0,1];Di为第i个障碍物到已探测区域内所有位置的距离矩阵,矩阵大小与地图大小一致为N*N;步骤2:基于贪心算法和增强学习迭代策略,在设定的最大迭代次数kmax内,迭代更新当前位置pnow(t)与目标位置pgoal之间的路径代价函数,以达到收敛的路径代价函数对应的路径作为当前时刻的最佳路径,具体过程如下:步骤2.1:令k=1,k表示迭代次数;步骤2.2:判断当前迭代次数是否已超过设定的最大迭代次数,若超过,则返回步骤2.1,;否则,进入步骤2.3;步骤2.3:从获得的周围环境信息对应的已知地图中,随机选择一个位置pk插入室内移动机器人所在当前位置pnow(t)与目标位置pgoal,其中,pk满足条件{pr}为之前迭代最佳路径代价函数下的路径点集合,为室内移动机器人工作空间信息集合;按以下公式计算第k次迭代得到的路径代价函数其中,第k‑1次迭代得到的路径代价函数,且为已知地图上当前位置pnow(t)与所选位置pk之间的连接权值,为采用贪心算法获得的在第k次迭代完成后获得的从位置pk到目标位置pgoal的最佳路径代价函数:Gpk=Rpk,pgoal+Gpgoalk=1min{Rpk,pgoal+Gpgoal,Rpk,pk-1+Gpk-1}k≠1]]>其中,为目标位置pgoal的代价函数,且为已知地图上在第k次所选位置点pk和第k‑1次所选位置pk‑1之间的连接权值;在已知地图中任意两位置pa和pb之间的连接权值由两位置之间的直线距离和该直线上穿过的障碍物影响概率构成:Rpa,pb=dpa,pb+max(∫Cpa,pbF(X,Y)ds)]]>其中,为位置pa到位置pb两点之间的物理位置距离;为位置pa到位置pb的路径点集合,ds为路径积分单元;max()为最大值求函数;步骤2.4:判断迭代后得到的路径代价函数是否已经达到收敛,如果收敛,则退出迭代过程,将已收敛的路径代价函数对应的路径作为最佳路径进入步骤3;否则,将迭代次数k加1,返回步骤2.2;步骤3:以步骤2得到的最佳路径作为室内移动机器人当前的预选择路径,依据预选择路径和室内移动机器人的位置和速度矢量判断室内移动机器人的偏转角φt是否满足轮式机器人不能侧向滑动的非完整约束,确定室内移动机器人是否按照预选择路径方向移动:若不满足,则返回步骤2;若满足则以设定的室内移动机器人移动速度沿当前时刻规划出的最佳路径方向移动,进入下一时刻的路径规划,t=t+1,返回步骤1,直到室内移动机器人移动到目标位置,完成路径规划;所述室内移动机器人的偏转角φt是否满足轮式机器人不能侧向滑动的非完整约束是指:φt∈[0,60°]∪[120°,180°];其中,pt和pt‑1分别为室内移动机器人当前位置和上一时刻所在位置,为在t时刻,室内移动机器人由规划得到的最佳路径中第一个路径点,即室内移动机器人在t+1时刻的预抵达位置;pt‑1由pt‑1=pt‑vt得到,v为设定的室内移动机器人移动速度。...

【技术特征摘要】

【专利技术属性】
技术研发人员:王耀南陈彦杰钟杭潘琪
申请(专利权)人:湖南大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1