【技术实现步骤摘要】
本专利技术涉及路径规划技术,尤其涉及基于深度强化学习的无人船动态路径规划方法及系统。
技术介绍
1、随着人工智能技术的不断发展,无人船在海洋调查、环境监测、搜索救援等领域得到了广泛应用。无人船能够在复杂的海洋环境中自主航行,完成各种任务,具有高效、低成本、低风险等优点。然而,动态、不确定的海洋环境给无人船的路径规划带来了挑战。传统的路径规划方法难以适应海洋环境的动态变化,限制了无人船的自主性和智能性。
2、目前,无人船路径规划的常用方法包括图搜索法、采样法、优化法等。a*算法是一种经典的启发式图搜索算法,通过评估节点到目标点的代价,选择最优路径。
3、然而,上述传统方法在动态海洋环境中存在一定局限性。图搜索法和采样法难以处理连续状态空间,需要进行离散化,导致计算复杂度高;优化法容易陷入局部最优,难以适应环境的动态变化。此外,这些方法通常依赖于预先建立的环境模型,难以处理未知或不确定的环境信息。
技术实现思路
1、本专利技术实施例提供基于深度强化学习的无人船动态路径规
...【技术保护点】
1.基于深度强化学习的无人船动态路径规划方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,将所述无人船的初始位置、目标位置以及海洋环境信息输入至预先构建的深度强化学习模型中,所述深度强化学习模型通过对无人船动态路径规划样本数据的学习训练,建立起无人船状态、动作和奖励之间的映射关系包括:
3.根据权利要求2所述的方法,其特征在于,使用目标网络计算下一状态的最大Q值包括:
4.根据权利要求1所述的方法,其特征在于,基于所述深度强化学习模型,使用状态值函数评估无人船在各个状态下采取不同动作的长期回报,根据所述长期回报确定
...【技术特征摘要】
1.基于深度强化学习的无人船动态路径规划方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,将所述无人船的初始位置、目标位置以及海洋环境信息输入至预先构建的深度强化学习模型中,所述深度强化学习模型通过对无人船动态路径规划样本数据的学习训练,建立起无人船状态、动作和奖励之间的映射关系包括:
3.根据权利要求2所述的方法,其特征在于,使用目标网络计算下一状态的最大q值包括:
4.根据权利要求1所述的方法,其特征在于,基于所述深度强化学习模型,使用状态值函数评估无人船在各个状态下采取不同动作的长期回报,根据所述长期回报确定无人船的最优动作策略,得到无人船的局部路径规划结果包括:
5.根据权利要求4所述的方法,其特...
【专利技术属性】
技术研发人员:刘言,郑志成,张润,吕波,于飞,
申请(专利权)人:北京星网船电科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。