一种实现路径跟随的方法和装置制造方法及图纸

技术编号:28294538 阅读:27 留言:0更新日期:2021-04-30 16:17
本发明专利技术公开了一种实现路径跟随的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:采集一条或多条规划路径和与所述规划路径相对应的实际路径,根据所述实际路径上的实际位置,确定位置误差及所述目标位置对应的曲率信息;根据所述位置误差、所述曲率信息,基于深度强化学习网络,训练得到输出控制指令的路径跟随控制模型;根据当前实际位置与待跟随路径上对应于所述当前实际位置的当前目标位置的位置误差及对应的曲率信息,使用所述路径跟随控制模型,获取对应的当前控制指令。该实施方式通过深度强化学习算法对规划的路径进行跟随,得到了具有通用性的路径跟随控制模型,保证了路径跟随的控制精度。

【技术实现步骤摘要】
一种实现路径跟随的方法和装置
本专利技术涉及计算机
,尤其涉及一种实现路径跟随的方法和装置。
技术介绍
随着自动化和人工智能技术的不断发展,无人车、机器人等智能设备层出不穷,而无论是无人车、机器人还是机械臂等移动设备,为实现智能化功能均需要严格根据人类意图或人类规划的路径进行运动,即实现路径跟随。现阶段实现路径跟随的方法主要有两种:基于PID控制技术的路径跟随,代表方法有PI控制、PID控制、模糊PID等,该类方法通过传统的误差控制进行有差控制,根据实际的运行轨迹和规划运动路径之间的差值,进行运动控制量的调整,从而对运动过程进行控制,最终实现对路径的跟随;基于强化学习的路径跟随方法,通过建立路径特征和运动控制指令之间的映射关系,进行路径的跟随。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:基于PID控制策略的路径跟随方案,因为PID控制技术是有差控制,因而无法精确跟随路径,每一步的实际路径与规划的路径始终有一定误差存在且无法克服;针对不同的无人车、机器人的那个设备,或跟路径所在环境变化时,需要对PID控本文档来自技高网...

【技术保护点】
1.一种实现路径跟随的方法,其特征在于,包括:/n采集一条或多条规划路径和与所述规划路径相对应的实际路径,根据所述实际路径上的实际位置,确定所述实际位置与所述规划路径上对应于所述实际位置的目标位置的位置误差及所述目标位置对应的曲率信息;/n根据所述位置误差、所述曲率信息,基于深度强化学习网络,训练得到用于根据所述位置误差、所述曲率信息输出控制指令的路径跟随控制模型,所述控制指令指示了跟随所述规划路径的运动方向、运动速度;/n根据当前实际位置与待跟随路径上对应于所述当前实际位置的当前目标位置的位置误差及对应的曲率信息,使用所述路径跟随控制模型,获取对应的当前控制指令,用以根据所述当前控制指令对所...

【技术特征摘要】
1.一种实现路径跟随的方法,其特征在于,包括:
采集一条或多条规划路径和与所述规划路径相对应的实际路径,根据所述实际路径上的实际位置,确定所述实际位置与所述规划路径上对应于所述实际位置的目标位置的位置误差及所述目标位置对应的曲率信息;
根据所述位置误差、所述曲率信息,基于深度强化学习网络,训练得到用于根据所述位置误差、所述曲率信息输出控制指令的路径跟随控制模型,所述控制指令指示了跟随所述规划路径的运动方向、运动速度;
根据当前实际位置与待跟随路径上对应于所述当前实际位置的当前目标位置的位置误差及对应的曲率信息,使用所述路径跟随控制模型,获取对应的当前控制指令,用以根据所述当前控制指令对所述待跟随路径进行跟随。


2.根据权利要求1所述的实现路径跟随的方法,其特征在于,
所述深度强化学习网络为DeepQNetwork网络。


3.根据权利要求1所述的实现路径跟随的方法,其特征在于,所述深度强化学习网络包括:深度学习神经网络和强化学习神经网络;
所述深度学习神经网络,用于根据所述位置误差、所述曲率信息生成状态函数,所述状态函数用于预测其他所述位置误差和相对应的所述曲率信息;
所述强化学习神经网络,用于根据所述状态函数所预测的所述位置误差、所述曲率信息生成一个或多个控制指令,并对所述一个或多个控制指令评分,根据所述评分的最大值,确定所述位置误差、所述曲率信息对应的控制指令。


4.根据权利要求1所述的实现路径跟随的方法,其特征在于,
所述深度强化学习网络包括两个结构一致但参数不同的神经网络:目标值神经网络、当前值神经网络;所述目标值神经网的参数与所述当前值神经网络历史参数一致;
使用所述目标值神经网络与所述当前值神经网络分别获取所述曲率信息、所述位置误差对应的控制指令的评分,并通过反向传递所述控制指令的评分差值实现对所述当前值神经网络参数的更新,直至根据所述当前值神经网络输出的控制指令采集的与所述规划路径相对应的实际路径上的实际位置与所述规划路径上对应于所述实际位置的目标位置的位置误差小于阈值位置误差;
在所述当前值神经网络参数的更新次数小于阈值次数的情况下,不更新所述目标值神经网络参数,在所述当前值神经网络参数的更新次数不小于阈值次数的情况下,更新所述目标值神经网络参数。


5.一种实现路径跟随的装置,其特征在于,包括:信息采集模块、模型获取模块、路径跟随模块;其中,
所述信息获取模块,用于采集一条或多条规划路径和与所述规划路径相对应的实际路径,根据所述实际路径上的实际位置,确定所述实际位置与所述规划路径上对应于所述实际...

【专利技术属性】
技术研发人员:高萌李柏李雨倩刘懿
申请(专利权)人:北京京东乾石科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1