一种路径规划方法、装置、电子设备以及存储介质制造方法及图纸

技术编号：32210448 阅读：12 留言：0更新日期：2022-02-09 17:16

本公开提供了一种路径规划方法、装置、电子设备以及存储介质，涉及深度学习及时空大数据技术领域，尤其涉及路径规划的领域。具体实现方案为：构建栅格地图；获取Q表；从Q表中确定智能体当前的栅格状态数据所属的第一对应关系；根据第一对应关系中的动作数据执行相应的动作并返回下一个栅格状态数据和奖励值；根据奖励值和深度强化学习模型的参数对第一对应关系的Q值进行更新，得到更新后的Q表；判断是否满足终止条件，若满足终止条件，则根据智能体经过的栅格得到路径；若不满足终止条件，则返回执行从Q表中确定智能体当前的栅格状态数据所属的第一对应关系的操作。本公开的方法具有时效性高、鲁棒性强的效果，同时规划的路线更加科学。更加科学。更加科学。

全部详细技术资料下载

【技术实现步骤摘要】
一种路径规划方法、装置、电子设备以及存储介质

[0001]本公开涉及深度学习及时空大数据领域，尤其涉及路径规划领域的一种路径规划方法、装置、电子设备以及存储介质。

技术介绍

[0002]海洋运输发展至今已经有几百年历史，海洋运输的发展受限于船舶航线路径规划科学性。传统的海洋路径规划主要依赖于船员通过人工手段绘制，这既消耗了大量的人力，同时规划出来的路线也不够准确。

技术实现思路

[0003]本公开提供了一种路径规划方法、装置、电子设备以及存储介质。
[0004]根据本公开的一方面，提供了一种路径规划方法，包括：
[0005]构建智能体的栅格地图，所述栅格地图中的每个栅格对应了一个栅格状态数据；
[0006]获取Q表，所述Q表用于记录栅格状态数据和动作数据的对应关系，以及表征该对应关系的Q值；
[0007]从所述Q表中确定所述智能体当前的栅格状态数据所属的第一对应关系；
[0008]根据第一对应关系中的动作数据执行相应的动作以使所述智能体移动到下一个栅格，并返回所述智能体的下一个栅格状态数据；
[0009]根据奖励函数返回下一个栅格状态数据对应的奖励值；
[0010]根据所述奖励值和深度强化学习模型的参数对所述第一对应关系的Q值进行更新，得到更新后的Q表；
[0011]判断是否满足终止条件，若满足终止条件，则根据智能体经过的栅格得到路径；若不满足终止条件，则返回执行所述从所述Q表中确定所述智能体当前的栅格状态数据所属的第一对应关系的操作。<...

【技术保护点】

【技术特征摘要】
1.一种路径规划方法，包括：构建智能体的栅格地图，所述栅格地图中的每个栅格对应了一个栅格状态数据；获取Q表，所述Q表用于记录栅格状态数据和动作数据的对应关系，以及表征该对应关系的Q值；从所述Q表中确定所述智能体当前的栅格状态数据所属的第一对应关系；根据第一对应关系中的动作数据执行相应的动作以使所述智能体移动到下一个栅格，并返回所述智能体的下一个栅格状态数据；根据奖励函数返回下一个栅格状态数据对应的奖励值；根据所述奖励值和深度强化学习模型的参数对所述第一对应关系的Q值进行更新，得到更新后的Q表；判断是否满足终止条件，若满足终止条件，则根据智能体经过的栅格得到路径；若不满足终止条件，则返回执行所述从所述Q表中确定所述智能体当前的栅格状态数据所属的第一对应关系的操作。2.根据权利要求1所述的方法，所述得到更新后的Q表后，该方法还包括：更新目标值Q网络的权重和状态值Q网络的权重。3.根据权利要求2所述的方法，其中，所述深度强化学习模型的参数包括：最大迭代周期、学习率、折扣因子以及探索度。4.根据权利要求3所述的方法，其中，所述深度强化学习模型的参数还包括：经验池容量、目标值Q网络权重更新周期。5.根据权利要求4所述的方法，其中，所述更新目标值Q网络的权重和状态值Q网络的权重，包括：根据所述学习率、所述折扣因子、奖励值以及下一状态最大的Q值确定目标Q值；根据所述目标Q值更新状态值Q网络的权重；间隔目标Q网络权重更新周期，更新一次目标值Q网络的权重，使得目标值Q网络的权重等于状态值Q网络的权重。6.根据权利要求1所述的方法，其中，所述奖励函数设置为：若智能体碰到障碍物，得到奖励值
‑
b；若智能体正常行驶，得到奖励值
‑
c；若智能体到达目的地，得到奖励值d；其中，b、c、d均为正整数，且b＞d＞c。7.根据权利要求1所述的方法，其中，所述终止条件为深度强化学习模型的迭代时间大于最大迭代周期或智能体到达目的地。8.一种路径规划装置，包括：构建模块，用于构建智能体的栅格地图，所述栅格地图中的每个栅格对应了一个栅格状态数据；获取模块，用于获取Q表，所述Q表用于记录栅格状态数据和动作数据的对应关系，以及表征该对应关系的Q值；确定模块，用于从所述Q表中确定所述智能体当前的栅格状态数...

【专利技术属性】
技术研发人员：周英敏，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人