一种基于LSTM-RNN的UUV动态规划方法技术

技术编号:18444098 阅读:55 留言:0更新日期:2018-07-14 10:03
本发明专利技术公开了一种基于LSTM‑RNN的UUV动态规划方法,属于无人潜航器领域,包括如下步骤:步骤(1):选择几何模型构建障碍环境模型;步骤(2):利用蚁群算法建立用于获取数据集的UUV动态规划器;步骤(3):设计用于动态规划的LSTM‑RNN网络模型;步骤(4):获取数据集:步骤(5):利用数据集中训练集的数据训练LSTM‑RNN网络,得到基于LSTM‑RNN网络的动态规划器;步骤(6):将声纳探测信息及目标点信息输入至基于LSTM‑RNN网络的运动规划器,获得UUV下一时刻的航向及航速。本方法具有强大的学习能力,同时还具有非常强的泛化能力,这使得所实现的动态规划器适用于复杂的环境。同时满足实时性的要求,并且所规划的路径符合UUV的运动特性。

A dynamic programming method of UUV based on LSTM-RNN

The invention discloses a dynamic programming method of UUV based on LSTM RNN, which belongs to the field of unmanned aerial vehicle, including the following steps: step (1): selecting the geometric model to construct an obstacle environment model; step (2): using ant colony algorithm to build a UUV dynamic gage for obtaining data sets; step (3): design the LSTM for dynamic programming. RNN network model; step (4): get the data set: step (5): using data set training set to train the LSTM RNN network, get the dynamic planner based on the LSTM RNN network; step (6): input sonar detection information and target information into the LSTM based RNN network motion planner, obtain the next time of UUV The course and speed of the course. This method has strong learning ability, and also has very strong generalization ability, which makes the dynamic planner implemented in complex environment. At the same time, it meets the requirement of real-time and the planned path accords with the motion characteristics of UUV.

【技术实现步骤摘要】
一种基于LSTM-RNN的UUV动态规划方法
本专利技术属于无人潜航器领域,尤其涉及一种基于LSTM-RNN的UUV动态规划方法。
技术介绍
UUV在未知环境下的动态路径规划能力是体现其智能水平的重要指标之一。传统动态规划方法往往遭受着环境模型精度与规划实时性矛盾的困扰,且在具有大量随机运动障碍的复杂环境中,还需设计辅助策略才能实现理想的规避,这些辅助策略的设计是相当复杂的,而且需要大量的计算时间。因此,探寻一种简单、廉价、高效、易于实现的动态路径规划方法具有重大的理论和实践价值。随着陆地资源消耗日趋枯竭,各国开始大量投入金钱、时间和人力开发水下资源,水下无人潜航器被重点所关注,而各种各样的无人潜航器在达到复杂作业及安全航行时,均要按照相应的航行路径进行操作,才能完成一次水下潜航。为了实施最佳航行计划、保持潜航器能在预定的航向上运行,要保证潜航器的操纵性,潜航器具备很好的操纵性时,能稳定维持行驶航向、深度及航速,又能快速对航向、深度及航速进行改变,正确的执行种种操作。水下无人潜航器路径的控制,也影响着无人潜航器的工作性能,需要对水下潜航器的路径进行有效的控制。路径规划,即找到一条从起点到终点的无碰撞安全路径,并且使特定的规划指标如路径最短、风险最小、任务完成量最多等达到最优。路径规划算法在国内外已有相当多的研究,比较常用的有A*算法、Dijkstra算法、蚁群和遗传等仿生智能算法。然而基于上述传统算法的实时路径规划系统,存在环境模型的精度以及路径的优化程度与规划的实时性相互矛盾的问题。深度学习是目前最具潜力的人工智能算法,其强大的非线性拟合能力可以为UUV提供一套简单、高效、易于实现的运动规划系统。这使得UUV具有了一定的自主学习的能力,从而减少了其对感知设备的依赖,增强了其在避碰过程中的灵活度。运动规划系统的规划能力随着UUV在运动的过程中的不断学习而逐步提高。中国专利CN107368076A公开了一种智能环境下机器人运动路径深度学习控制规划方法,该方法使用深度学习DBN网络解决运载机器人全局路径规划问题。所提深度学习DBN网络包括一层输入层、三层隐藏层以及一层输出层,其中可视层与第一隐藏层构成第一层限制玻尔兹曼机RBM,第一隐藏层与第二隐藏层构成第二层限制玻尔兹曼机RBM,第二隐藏层与第三隐藏层构成BP网络层。该专利采用逐层训练的方法依次对两层限制玻尔兹曼机RBM和BP网络层进行训练。与全局路径规划不同,动态规划器需要根据过去一段时间内的环境信息实时输出规划结果。相较于限制玻尔兹曼机RBM,LSTM-RNN具有处理较长时间序列的能力,且更适用于复杂的规划问题。
技术实现思路
本专利技术的目的在于公开灵活度高,能够适应复杂环境的一种基于LSTM-RNN的UUV动态规划方法。本专利技术的目的是这样实现的:一种基于LSTM-RNN的UUV动态规划方法,包含如下步骤:步骤(1):选择几何模型构建障碍环境模型:对于椭圆形或圆形障碍,存储椭圆形或圆形障碍的两个对角点坐标,利用这两点坐标,计算出椭圆圆心和长短半径,获得椭圆形或圆形障碍的全部信息;对于多边形障碍,存储多边形顶点的坐标,由任意一个顶点开始,按顺时针或者逆时针顺序将多边形顶点依次存储于一个顺序链表中,通过顺序链表获取多边形障碍的全部信息。步骤(2):利用蚁群算法建立用于获取数据集的UUV动态规划器:蚁群算法信息素更新规则为:上式中,i,j是状态点序号,m是蚁群中蚂蚁总数,ρ是挥发系数,Q是常数,Lk是蚂蚁k寻食付出的代价,即路径长度;每一代蚂蚁中排名前四分之一的蚂蚁走过的路径的信息素强化规则为:τij(t+1)=λ×τij(t+1)上式中,D是起点到终点的欧式距离;信息素浓度的限制处理:上式中,τmin是自行设置的信息素浓度上限,τmax是自行设置的信息素浓度下限。蚁群算法的状态转移规则如下:为蚂蚁k处于i点处时下一步转移到i的可视点j的概率,allowi为蚂蚁k允许做状态转移的i点的可视点集合,η是启发式函数,取为i点到目标点距离的倒数,α为信息素的重要程度,β为启发函数的重要程度;步骤(3):设计用于动态规划的LSTM-RNN网络模型:LSTM-RNN网络模型:包括输入层,波束合并层,隐藏层,中间层以及输出层五个部分;输入层:接收样本输入,接收样本有181维,前180维为模拟感知器探测的局部环境信息,最后1维为UUV当前位置与目标点在局部坐标下形成的夹角;波束合并层:波束合并层是对输入层邻近波束求和后取平均;合并领域的大小为2,且不重叠,即该层每个单元对输入层每相邻两个单元的输出值求和取平均后输出;波束合并层共91维,其中前90维为合并后的局部环境特征,最后一维特征不做处理,直接输出;波束合并层的输出和一个偏置项一起作为记忆模块的输入,采用全连接形式;隐藏层:包括10个记忆模块;记忆模块包括输入单元、输出单元、输入门、输出门、遗忘门、Cell;输入单元、输出单元、输入门、输出门、遗忘门、Cell的维度都为46;采用的序列长度为10,按序列展开后有10个记忆模块,上一时刻的模块输出反馈到下一时刻的模块中;假定第一个记忆模块虚拟的前驱模块输出恒为0向量;输入门、输出门、遗忘门的激活函数是sigmoid函数,输入单元、输出单元的激活函数是tanh函数;中间层:第10个记忆模块的输出添加上偏置后以全连接方式输入到中间层,维度为23,激活函数是tanh函数;输出层:中间层加上一个偏置项后以全连接方式输入到输出层,输出层维度为2,激活函数为线性函数,分别输出UUV的航向和航速。步骤(4):获取数据集:在全局坐标系中生成若干组随机地图,采用教师系统进行运动规划,水平覆盖角为360°、包含180个波束的二维仿真声呐在每个路径节点采集环境信息,所采集的信息为训练样本,训练样本构成训练集,将教师系统输出的航向及航速作为训练标签;二维仿真声呐在每个路径节点采集的环境信息为:上式中,为当前时刻第i个波束探测到的距离信息;当第i个波束未探测到障碍时,将t时刻仿真声纳探测到的距离信息做如下处理:将t时刻UUV所在位置与目标点形成的角度表示为则t时刻LSTM-RNN网络的输入向量为:t时刻LSTM-RNN网络的标签:lt=[θt,vt],上式中,θt表示期望的UUV的航向,vt表示期望的UUV的航速步骤(5):利用数据集中训练集的数据训练LSTM-RNN网络,得到基于LSTM-RNN网络的动态规划器:具体的训练步骤为:步骤(5.1):初始化LSTM-RNN网络各层权重,令i=0;步骤(5.2):将训练集中的输入数据[xt-9,L,xt]馈入网络,经过LSTM-RNN网络的前向传播过程得到对应输出yt:步骤(5.3):计算网络输出yt与对应标签lt的误差;步骤(5.4):判断是否训练集中数据均完成计算,若是,执行五,否则t=t+1,并返回步骤(5.2);步骤(5.5):利用标准梯度下降误差反向传播算法更新LSTM-RNN网络权重;步骤(5.6):i=i+1,并判断iMOD500是否为零,若是,执行七,否则返回步骤(5.2);步骤(5.7):在测试集中随机选取50个序列,使用当前网络进行测试,计算平均误差;步骤(5.8):若测试集中均方误差连续10次没有减小,则停止训练,否则返回步本文档来自技高网
...

【技术保护点】
1.一种基于LSTM‑RNN的UUV动态规划方法,其特征在于,包含如下步骤:步骤(1):选择几何模型构建障碍环境模型;步骤(2):利用蚁群算法建立用于获取数据集的UUV动态规划器;步骤(3):设计用于动态规划的LSTM‑RNN网络模型;步骤(4):获取数据集:步骤(5):利用数据集中训练集的数据训练LSTM‑RNN网络,得到基于LSTM‑RNN网络的动态规划器;步骤(6):将声纳探测信息及目标点信息输入至基于LSTM‑RNN网络的运动规划器,获得UUV下一时刻的航向及航速。

【技术特征摘要】
1.一种基于LSTM-RNN的UUV动态规划方法,其特征在于,包含如下步骤:步骤(1):选择几何模型构建障碍环境模型;步骤(2):利用蚁群算法建立用于获取数据集的UUV动态规划器;步骤(3):设计用于动态规划的LSTM-RNN网络模型;步骤(4):获取数据集:步骤(5):利用数据集中训练集的数据训练LSTM-RNN网络,得到基于LSTM-RNN网络的动态规划器;步骤(6):将声纳探测信息及目标点信息输入至基于LSTM-RNN网络的运动规划器,获得UUV下一时刻的航向及航速。2.根据权利要求1所述的一种基于LSTM-RNN的UUV动态规划方法,其特征在于:所述的步骤(1)具体为:对于椭圆形或圆形障碍,存储椭圆形或圆形障碍的两个对角点坐标,利用这两点坐标,计算出椭圆圆心和长短半径,获得椭圆形或圆形障碍的全部信息;对于多边形障碍,存储多边形顶点的坐标,由任意一个顶点开始,按顺时针或者逆时针顺序将多边形顶点依次存储于一个顺序链表中,通过顺序链表获取多边形障碍的全部信息。3.根据权利要求1所述的一种基于LSTM-RNN的UUV动态规划方法,其特征在于:所述的步骤(2)具体为:蚁群算法信息素更新规则为:上式中,i,j是状态点序号,m是蚁群中蚂蚁总数,ρ是挥发系数,Q是常数,Lk是蚂蚁k寻食付出的代价,即路径长度;每一代蚂蚁中排名前四分之一的蚂蚁走过的路径的信息素强化规则为:τij(t+1)=λ×τij(t+1)上式中,D是起点到终点的欧式距离;信息素浓度的限制处理:上式中,τmin是自行设置的信息素浓度上限,τmax是自行设置的信息素浓度下限;蚁群算法的状态转移规则如下:为蚂蚁k处于i点处时下一步转移到i的可视点j的概率,allowi为蚂蚁k允许做状态转移的i点的可视点集合,η是启发式函数,取为i点到目标点距离的倒数,α为信息素的重要程度,β为启发函数的重要程度。4.根据权利要求1所述的一种基于LSTM-RNN的UUV动态规划方法,其特征在于:所述的步骤(3)中的LSTM-RNN网络模型:包括输入层,波束合并层,隐藏层,中间层以及输出层五个部分;输入层:接收样本输入,接收样本有181维,前180维为模拟感知器探测的局部环境信息,最后1维为UUV当前位置与目标点在局部坐标下形成的夹角;波束合并层:波束合并层是对输入层邻近波束求和后取平均;合并领域的大小为2,且不重叠,即该层每个单元对输入层每相邻两个单元的输出值求和取平均后输出;波束合并层共91维,其中前90维为合并后的局部环境特征,最后一维特征不做处理,直接输出;波束合并层的输出和一个偏置项一起作为记忆模块的输入,采用全连接形式;隐藏层:包括10个记忆模块;记忆模块包括输入单元、输出单元、输入门、输出门、遗忘门、Cell;输入单元、输出单元、输入门、输出门、遗忘门、Cell的维度都为46;采用的序列长度为10,按序列展开后有10个记忆模块,上一时刻的模块输出反馈到下一时刻的模块中;假定第一个记忆模块虚拟的前驱模块输出恒为0向量;输入门、输出门、遗忘门的激活函数是sigmoid函数,输入单元、输出单元的激活函数是tanh函数;中间层:第10个记忆模块的输出添加上偏置后以...

【专利技术属性】
技术研发人员:王宏健林常见么洪飞肖瑶张宏瀚张雪莲
申请(专利权)人:哈尔滨工程大学
类型:发明
国别省市:黑龙江,23

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1