一种基于海流预测模型的路径规划方法技术

技术编号:19423875 阅读:16 留言:0更新日期:2018-11-14 10:09
本发明专利技术属于水下机器人控制领域,公开了一种基于海流预测模型的路径规划方法,包含如下步骤:根据路径关键点对航行区域进行栅格化处理;利用区域海洋模式对航行区域进行海流预测,拟合计算得到实时的海流信息;利用电子海图信息标记禁航区;将不同深度的禁航信息和起点终点位置信息按照不同深度的平面栅格进行存储栅格各点的经纬度、是否为禁航区、是否到达终点;计算当前位置到终点的方向并在所有下一步行驶方向中确定可选动作;使用Q学习寻求马尔科夫决策过程规划的最优策略并输出路径。本发明专利技术充分考虑实时的海流对路径规划的影响,通过BP神经网络和bagging算法进行拟合,使用强化学习来寻求最优解,加快收敛速度,降低运算的复杂度。

【技术实现步骤摘要】
一种基于海流预测模型的路径规划方法
本专利技术属于水下机器人控制领域,尤其涉及一种基于海流预测模型的路径规划方法。
技术介绍
水下机器人也称无人遥控潜水器,是一种工作于水下的极限作业机器人。水下环境恶劣危险,人的潜水深度有限,所以水下机器人已成为开发海洋的重要工具。水下机器人可在高度危险环境、被污染环境以及零可见度的水域代替人工在水下长时间作业,水下机器人上一般配备声呐系统、摄像机、照明灯和机械臂等装置,能提供实时视频、声呐图像,机械臂能抓起重物,水下机器人在石油开发、海事执法取证、科学研究和军事等领域得到广泛应用。由于水下机器人运行的环境复杂,水声信号的噪声大,而各种水声传感器普遍存在精度较差、跳变频繁的缺点,因此水下机器人运动控制系统中,滤波技术显得极为重要。水下机器人运动控制中普遍采用的位置传感器为短基线或长基线水声定位系统,速度传感器为多普勒速度计会影响水声定位系统精度。因素主要包括声速误差、应答器响应时间的丈量误差、应答器位置即间距的校正误差。而影响多普勒速度计精度的因素主要包括声速c、海水中的介质物理化学特性、运载器的颠簸等因此路径规划对水下机器人显得尤为重要。路径规划是水下机器人智能导航基本环节之一。水下机器人在大范围海洋环境下航行时,除考虑避障、能耗问题外,还需考虑海洋环境对水下机器人航行的影响。随时间变化的海流给水下机器人的安全及任务实现带来很大挑战,因此在进行路径规划时,需通过预测的海流要素,使水下机器人尽量利用流场中的能量,规划出能耗少的可行的安全路径。从算法策略角度,目前路径规划算法可分为基于智能计算的路径规划,基于行为、学习心理的路径规划和随机采样路径规划。这些算法目的多是提高解空间搜索效率、加快收敛,或是针对未知环境或动态空间提出的,且目前越来越多的学者开始海流影响下的路径规划的研究。从流函数生成海流场到海流历史统计数据库生成海流场,本专利技术是利用区域海洋模式来预测某地区未来时刻海流场数据和AUV位姿及控制指令,来实时预测海流,使用来做路径规划的海流场更加精确,更具有实时性。申请号为201710538828.6的专利公开了一种基于探测威胁域的无人潜航器路径规划装置及方法,基于探测威胁域的路径规划算法来解决地形障碍环境下UUV的路径规划问题,能满足UUV本身运动学约束、避碰约束以及隐蔽探测约束。在给定初始位置、终点位置、最大曲率约束、路径离散点分辨率、隐蔽安全指标等,规划出从运动起点到终点的路径,且光滑连续可导,满足UUV的航行转弯曲率约束、隐蔽安全指标等,使其以最短时间安全隐蔽到达终点。本专利技术首次将探测威胁理论与航行转弯曲率约束的几何理论应用到UUV的路径规划领域中,能快速实现路径规划,方法简单可靠,易于实现,计算量小,实时性较好,能满足路径规划要求,提高了路径规划的实用性,对今后水下路径规划领域的发展有着积极意义。但该方法应用在水下航行器的路径规划时,存在计算过程过于复杂,实时性不好的问题。
技术实现思路
本专利技术的目的在于公开能耗少,安全性高的一种基于海流预测模型的路径规划方法。本专利技术的目的是这样实现的:一种基于海流预测模型的路径规划方法,包含如下步骤:步骤(1):根据路径关键点确定航行区域,并对航行区域进行栅格化处理;步骤(2):利用区域海洋模式对航行区域进行时间步长为ΔT的海流预测,根据AUV实时位姿变化、控制指令和对应时刻的海流信息,利用bagging算法和BP神经网络进行拟合,计算得到实时的海流信息:将控制指令对应上一时刻AUV位姿和此时刻AUV位姿及海流信息,使用bagging算法,生成T个训练集,T个BP神经网络基于每个采样集训练出T个基学习器,BP神经网络为三层,输入为上一时刻AUV的速度大小与角度、舵和翼及推进器的电压、此时刻AUV的速度大小和角度,输出为海流的经向速度和纬向速度,输入层为7个输入神经元、2个输出神经元,隐层神经元个数取5、8、10、12和15中的一个,通过10折交叉验证法确定隐层个数,并根据误差率按比例求得最终实时海流要素,将此时刻求得的海流要素当做下一时刻的海流要素,得到实时的海流信息。步骤(3):利用电子海图信息,将危及水下机器人安全航行的区域在栅格中标记为禁航区;步骤(4):将不同深度的禁航信息和起点终点位置信息按照不同深度的平面栅格进行存储存储栅格各点的经纬度、是否为禁航区、是否到达终点;步骤(5):计算当前位置到终点的方向并在所有下一步行驶方向中确定可选动作:根据矩形网格结构图,假设矩形网格中间的黑点为水下机器人的当前位置,且当前动作有a1、a2到a16共16种可能,可能的动作为从当前水下机器人位置到其外两层位置的动作,假设执行当前某个动作后所在的位置在禁航区;设ast为当前点位置到目标点位置的动作,动作选择公式如下:上式中,i为整数,且i∈[1,16];选择Ai>0的动作,若障碍物在当前点最近8个格点,则障碍物所在格点对应的动作和相邻动作都舍弃;若障碍物在当前点外一层格点处,则只有存在障碍物的格点对应的动作舍弃。步骤(6):采用重点式学习方式,使用Q学习寻求马尔科夫决策过程规划的最优策略并输出路径。步骤(6.1):初始化值函数Q(s,a)=0,初始化原始策略π(s,a)=argmaxaQ(s,a);步骤(6.2):初始化状态S0为初始位置,确定初始时间t0;步骤(6.3):通过神经网络计算当前位置的实时的海流速度;步骤(6.4):运用重点探索策略选择动作a,产生奖励rt+1,转移到状态St+1:重点探索策略μ(x):上式中,上式中,w1是距离影响的权重系数,w2是海流影响的权重系数;vc是t时刻当前位置所在格点的海流速度,ai是概率为pi的可选动作。步骤(6.5):根据原始策略π,在状态St+1选择并执行动作at+1。步骤(6.6):更新状态动作值函数的函数值:Q(st,at)←Q(st,at)+β[rt+1+γQ(st+1,at+1)-Q(st,at)];上式中,β表示学习速率,取值范围为[0,1];γ表示折扣因子。步骤(6.7):利用贪婪策略更新当前策略步骤(6.8):判断水下机器人是否到达目标位置的状态,若未到达转步骤(6.3),若到达目标状态则转步骤(6.9)。步骤(6.9):判断是否达到迭代次数或是否所有状态动作值函数收敛,若未到达迭代次数或状态动作值函数未均收敛则转步骤(6.2);若到达迭代次数或所有动作值函数都收敛则输出最优策略,得到最优规划路径。本专利技术的有益效果为:本专利技术充分考虑实时的海流对路径规划的影响,通过区域海洋模式预测未来的海洋要素,利用BP神经网络和bagging算法进行拟合,得到实时的海流信息。同时根据马尔科夫决策过程进行规划,使用强化学习来寻求最优解,加快收敛速度,降低运算的复杂度,更好更快地得到规划路径。附图说明图1是一种基于海流预测模型的路径规划方法流程图;图2是矩形网格结构图;图3是动作选择示意图;图4是马尔科夫决策过程规划流程图。具体实施方式下面结合附图来进一步描述本专利技术:实施例1:如图1,一种基于海流预测模型的路径规划方法,包含如下步骤:步骤(1):根据路径关键点确定航行区域,并对航行区域进行栅格化处理;根据水下机器人路径的起点终点确定矩形航行区域;水平方向采用正交曲线本文档来自技高网
...

【技术保护点】
1.一种基于海流预测模型的路径规划方法,其特征在于:包含如下步骤:步骤(1):根据路径关键点确定航行区域,并对航行区域进行栅格化处理;步骤(2):利用区域海洋模式对航行区域进行时间步长为ΔT的海流预测,根据AUV实时位姿变化、控制指令和对应时刻的海流信息,利用bagging算法和BP神经网络进行拟合,计算得到实时的海流信息;步骤(3):利用电子海图信息,将危及水下机器人安全航行的区域在栅格中标记为禁航区;步骤(4):将不同深度的禁航信息和起点终点位置信息按照不同深度的平面栅格进行存储存储栅格各点的经纬度、是否为禁航区、是否到达终点;步骤(5):计算当前位置到终点的方向并在所有下一步行驶方向中确定可选动作;步骤(6):采用重点式学习方式,使用Q学习寻求马尔科夫决策过程规划的最优策略并输出路径。

【技术特征摘要】
1.一种基于海流预测模型的路径规划方法,其特征在于:包含如下步骤:步骤(1):根据路径关键点确定航行区域,并对航行区域进行栅格化处理;步骤(2):利用区域海洋模式对航行区域进行时间步长为ΔT的海流预测,根据AUV实时位姿变化、控制指令和对应时刻的海流信息,利用bagging算法和BP神经网络进行拟合,计算得到实时的海流信息;步骤(3):利用电子海图信息,将危及水下机器人安全航行的区域在栅格中标记为禁航区;步骤(4):将不同深度的禁航信息和起点终点位置信息按照不同深度的平面栅格进行存储存储栅格各点的经纬度、是否为禁航区、是否到达终点;步骤(5):计算当前位置到终点的方向并在所有下一步行驶方向中确定可选动作;步骤(6):采用重点式学习方式,使用Q学习寻求马尔科夫决策过程规划的最优策略并输出路径。2.根据权利要求1所述的一种基于海流预测模型的路径规划方法,其特征在于:所述的步骤(2)具体为:将控制指令对应上一时刻AUV位姿和此时刻AUV位姿及海流信息,使用bagging算法,生成T个训练集,T个BP神经网络基于每个采样集训练出T个基学习器,BP神经网络为三层,输入为上一时刻AUV的速度大小与角度、舵和翼及推进器的电压、此时刻AUV的速度大小和角度,输出为海流的经向速度和纬向速度,输入层为7个输入神经元、2个输出神经元,隐层神经元个数取5、8、10、12和15中的一个,通过10折交叉验证法确定隐层个数,并根据误差率按比例求得最终实时海流要素,将此时刻求得的海流要素当做下一时刻的海流要素,得到实时的海流信息。3.根据权利要求1所述的一种基于海流预测模型的路径规划方法,其特征在于:所述的步骤(5)具体为:根据矩形网格结构图,假设矩形网格中间的黑点为水下机器人的当前位置,且当前动作有a1、a2到a16共16种可能,可能的动作为从当前水下机器人位置到其外两层位置的动作...

【专利技术属性】
技术研发人员:王卓姚淑香冯晓宁隋炎橙胡磊徐沈方张士伟张佩
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:黑龙江,23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1