【技术实现步骤摘要】
基于深度强化学习的机器人导航方法及系统、设备、介质
本专利技术涉及机器人导航
,更为具体来说,本专利技术提供了基于深度强化学习的机器人导航方法及系统、设备、介质。
技术介绍
随着人工智能技术的不断发展,智能机器人领域也在蓬勃发展。智能机器人具有感知、决策等多种功能,因而在辅助或替代人类工作方面具有巨大的潜力。其中,机器人自主移动能力作为衡量机器人智能程度的重要指标,可见导航任务是大多数具有移动功能的智能机器人在实际应用中需解决的首要问题。但是已有的方案(例如图搜索法、快速搜索随机树算法、人工势场法等)在实现智能机器人导航任务时,往往存在需环境先验信息、无法在完全未知的环境中导航或计算复杂度过大等一个或多个问题。
技术实现思路
为解决现有技术存在的至少一个问题,本专利技术能够提供一种基于深度强化学习的机器人导航方法及系统、设备、介质,从而可达到提高机器人智能化水平、降低计算复杂度等一个或多个技术目的。为实现上述的技术目的,本专利技术一个或者多个实施例具体提供了一种基于深度强化学习的机器人导航方 ...
【技术保护点】
1.一种基于深度强化学习的机器人导航方法,其特征在于,包括:/n获取实时观测数据;/n基于所述实时观测数据构建环境地图以及确定机器人的当前位置和目标点相对位置;/n生成导航动作信息,并依据所述导航动作信息控制所述机器人从当前位置向所述目标点相对位置移动;/n经过第一设定时长后判断所述机器人是否到达所述目标点相对位置;/n根据未到达所述目标点相对位置生成新导航路径,并控制所述机器人沿着所述新导航路径移动,以及再经过第二设定时长后返回所述获取实时观测数据步骤;/n或者根据到达所述目标点相对位置结束导航。/n
【技术特征摘要】
1.一种基于深度强化学习的机器人导航方法,其特征在于,包括:
获取实时观测数据;
基于所述实时观测数据构建环境地图以及确定机器人的当前位置和目标点相对位置;
生成导航动作信息,并依据所述导航动作信息控制所述机器人从当前位置向所述目标点相对位置移动;
经过第一设定时长后判断所述机器人是否到达所述目标点相对位置;
根据未到达所述目标点相对位置生成新导航路径,并控制所述机器人沿着所述新导航路径移动,以及再经过第二设定时长后返回所述获取实时观测数据步骤;
或者根据到达所述目标点相对位置结束导航。
2.根据权利要求1所述的基于深度强化学习的机器人导航方法,其特征在于,所述根据未到达所述目标点相对位置生成新导航路径包括:
判断在环境地图上是否成功检索到从当前位置到目标点相对位置的可行驶路径,根据检索成功将可行驶路径上的点作为新导航路径的终点,或者根据检索失败将环境地图中未经过区域的点作为新导航路径的终点。
3.根据权利要求1或2所述的基于深度强化学习的机器人导航方法,其特征在于,所述控制所述机器人从当前位置向所述目标点相对位置移动包括:
利用环境特征数据变化和所述机器人与所述目标点相对位置的距离变化计算好奇心探索因子,基于所述好奇心探索因子控制机器人的活动范围;好奇心探索因子用于表征所述机器人趋向于未经过区域的期望程度。
4.根据权利要求3所述的基于深度强化学习的机器人导航方法,其特征在于,还包括:
对所述实时观测数据进行特征提取处理,以得到环境特征数据;
依据构建的环境地图、机器人的当前位置及所述目标点相对位置确定所述机器人与所述目标点相对位置的距离。
5.根据权利要求1所述的基于深度强化学习的机器人导航方法,其特征在于,还包括:
在所述机器人移动过程中计算所述机器人与障碍物之间的当前...
【专利技术属性】
技术研发人员:赵锴,张文祺,李鹏,傅汇乔,叶发萍,江微杰,朱晓,王韬,
申请(专利权)人:杭州未名信科科技有限公司,浙江省北大信息技术高等研究院,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。