一种基于粗粒度特征的可迁移视觉导航设计方法技术

技术编号:24351805 阅读:29 留言:0更新日期:2020-06-03 01:45
本发明专利技术公开了一种基于粗粒度特征的可迁移视觉导航设计方法,涉及自主导航技术领域,其通过在多组不同的虚拟环境中训练独立粗粒度特征模块,确保粗粒度特征模块学习的特征映射适用于不同的导航任务,可迁移性强;在新的导航任务中,直接加载已训练完成的独立粗粒度特征模块,因此仅需训练粗粒度特征模块以外的其余神经网络参数,即可完成新的导航任务,训练的计算量非常小,同时导航神经网络因具有粗粒度模块而具有强大的特征提取能力;独立粗粒度特征模块是独立于特征提取网络的独立模块,可配合使用者自身构建的网络使用,无需重新构建、训练神经网络,只需在深度学习框架中加载已训练模型即可,操作非常简单。

A design method of portable visual navigation based on coarse-grained features

【技术实现步骤摘要】
一种基于粗粒度特征的可迁移视觉导航设计方法
本专利技术涉及自主导航
,具体而言,涉及一种基于粗粒度特征的可迁移视觉导航设计方法。
技术介绍
自主导航是无人驾驶和移动机器人中的重要问题,其目的是智能体在未知场景中移动至指定位置。自主导航在机器人、无人驾驶等领域应用广泛,尤其是无人驾驶中的一个重要研究领域。自主导航保证车辆、机器人在复杂场景中有效移动,是实现车辆与机器人智能化的前提条件。因此,导航是无人驾驶、自主机器人领域中一个极其重要的研究课题,主要包含两类不同的导航方法:基于同步定位与建图(SLAM)的导航算法和基于视觉的深度强化学习导航算法。SLAM导航算法主要用于解决机器人在未知环境运动时的定位与地图构建问题。根据使用传感器的不同,SLAM导航算法又可分为基于激光雷达的Lidar-SLAM和基于视觉的Visual-SLAM。虽然两者使用的传感器不同,就其工作原理的本质上都是利用传感器感知周围环境,通过视觉里程即估计两个时刻的相对运动,后端处理视觉里程计估计结果的累积误差,根据前端与后端得到的运动轨迹来建立虚拟环境地图,最后通过回环检测考虑同一场景不同时刻的图像,提供空间上约束来消除累积误差。SLAM导航算法的有效性极大程度上受限于传感器的精度,而高精度传感器的价格导致该方法硬件成本高,难以推广。此外,复杂动态场景难以建模,同时建图与定位的迭代计算无法避免地会造成定位误差累积,难以通过回环检测完全消除,从而降低了SLAM算法的鲁棒性与可靠性。基于视觉的深度强化学习导航算法利用摄像头获取场景图像信息,通过多层卷积神经网络提取场景特征信息输入多层全连接神经网络,从而实现端到端的控制决策,输出机器人等智能体的动作指令。随着近年国内外学者对深度强化学习研究的深入,长短期记忆网络、外部记忆等模块被加入深度强化学习导航算法的框架中通过自适应地储存以往地状态与动作信息提高导航算法地性能。此外,有的学者融合视觉图像与速度、加速度、场景深度等信息,构造相应代价函数以加速导航算法收敛。相比传统的SLAM导航方法,基于视觉的深度强化学习导航方法主要通过工业相机捕捉场景图像降低制造成本,同时克服传统SLAM方法对复杂多变场景难以建模的技术难点。然而,深度强化学习导航算法通过大量样本数据训练神经网络,主要存在两个方面的缺陷。一、训练成本高。随着神经网络深度增加,网络参数数量急剧上升。目前通过GPU、TPU训练神经网络需几天,甚至几十天。二、模型迁移性差。单一场景训练会导致神经网络过拟合,即已训练模型难以应用于其他环境,而多场景训练时算法难以收敛。在新环境的导航模型只能从头开始训练。
技术实现思路
本专利技术在于提供一种基于粗粒度特征的可迁移视觉导航设计方法,其能够缓解上述问题。为了缓解上述的问题,本专利技术采取的技术方案如下:本专利技术提供了一种基于粗粒度特征的可迁移视觉导航设计方法,包括以下步骤:S100、构建一个独立粗粒度特征模块以及m个包含粗粒度特征模块的导航神经网络Ⅰ,并初始化神经网络参数,m≥2;S200、随机生成m个不同的虚拟导航环境,并在各个虚拟导航环境中均初始化一个虚拟移动机器人Ⅰ,所述导航神经网络Ⅰ与所述虚拟导航环境一一对应,m个虚拟导航环境、m个虚拟移动机器人Ⅰ以及m个导航神经网络Ⅰ构成m个更新条件,每个更新条件由相对应的一个虚拟导航环境、一个虚拟移动机器人Ⅰ以及一个导航神经网络Ⅰ构成;S300、利用各更新条件训练更新所述独立粗粒度特征模块,直至独立粗粒度特征模块收敛,将收敛的独立粗粒度特征模块作为最终独立粗粒度特征模块;S400、构建一个包含有粗粒度特征模块的导航神经网络Ⅱ,并初始化神经网络参数,利用所述最终独立粗粒度特征模块的参数对所述导航神经网络Ⅱ的粗粒度特征模块的参数进行更新,得到导航神经网络Ⅲ;S500、在新导航环境中初始化一个虚拟移动机器人Ⅱ;S600、利用新导航环境和虚拟移动机器人Ⅱ,训练更新所述导航神经网络Ⅲ除粗粒度特征模块以外的其余神经网络参数,得到导航神经网络Ⅳ,完成在新导航环境中的导航设计。本技术方案的技术效果是:通过在多组不同的虚拟环境中训练独立粗粒度特征模块,确保粗粒度特征模块学习的特征映射适用于不同的导航任务,这样的粗粒度特征模块能够提取多环境导航中的共有知识,适用于不同的导航任务,从而具有更强的泛化性能,相比局限于单一环境导航任务的神经网络,可迁移性更强;在新的导航任务中,直接加载已训练完成的独立粗粒度特征模块,因此仅需训练粗粒度特征模块以外的其余神经网络参数,即可完成新的导航任务,训练的计算量非常小,大大降低了时间成本,同时导航神经网络因具有粗粒度模块而具有强大的特征提取能力,尤其在新任务场景变化较大的情况下,本专利技术相比重新训练神经网络可以减少训练时间;独立粗粒度特征模块是独立于特征提取网络的独立模块,可配合使用者自身构建的网络使用,无需重新构建、训练神经网络,只需在深度学习框架中加载已训练模型即可,操作非常简单。可选地,所述环境的构成因子包括墙面纹理、地面纹理、障碍物形状、障碍物尺寸、障碍物纹理、目标物形状、目标物尺寸和目标物纹理。本技术方案的技术效果是:通过设置上述构成因子可以有效确保各个虚拟导航环境不完全相同,从而每个更新条件不尽相同。不同更新条件对独立粗粒度特征模块的更新使得其能够提取到描述不同虚拟导航环境的共同粗粒度特征,由此提高独立粗粒度模块的可迁移性与泛化性能。具体地,所述步骤S300中,每次对所述独立粗粒度特征模块进行训练更新的过程包括以下步骤:S301、令导航神经网络Ⅰ控制虚拟导航环境内的虚拟移动机器人Ⅰ连续导航交互t次,得到包含t个交互样本的交互样本序列Ⅰ;S302、利用交互样本序列Ⅰ根据强化学习算法计算并保存导航神经网络Ⅰ的粗粒度特征模块梯度,更新导航神经网络Ⅰ的参数;S303、利用所保存的导航神经网络Ⅰ的粗粒度特征模块梯度,通过梯度下降法更新独立粗粒度特征模块;S304、利用更新后的独立粗粒度特征模块的神经网络参数再次更新导航神经网络Ⅰ的参数;S305、重复步骤S301至步骤S304,直至导航神经网络Ⅰ收敛,输出收敛的导航神经网络Ⅰ所对应的独立粗粒度特征模块。本技术方案的技术效果是:通过导航神经网络控制虚拟移动机器人与虚拟导航环境连续交互获得交互样本,利用交互样本更新导航神经网络与独立粗粒度特征模块保证该导航神经网络有效学习在对应虚拟环境中的导航能力,最终确保独立粗粒度特征学习到适用于该虚拟环境的特征提取能力。具体地,所述交互样本由机器人完成动作前的感知场景视觉图像、机器人动作、环境反馈奖励以及机器人完成动作后的感知场景视觉图像组成;所述虚拟移动机器人在环境中的导航交互过程为:虚拟移动机器人在动作前获取环境的感知场景视觉图像,通过导航神经网络生成机器人动作,虚拟移动机器按照所生成的机器人动作移动,待其完成机器人动作后,再次获取环境的感知场景视觉图像,并得到环境反馈奖励。...

【技术保护点】
1.一种基于粗粒度特征的可迁移视觉导航设计方法,其特征在于,包括以下步骤:/nS100、构建一个独立粗粒度特征模块以及m个包含粗粒度特征模块的导航神经网络Ⅰ,并初始化神经网络参数,m≥2;/nS200、随机生成m个不同的虚拟导航环境,并在各个虚拟导航环境中均初始化一个虚拟移动机器人Ⅰ,所述导航神经网络Ⅰ与所述虚拟导航环境一一对应,m个虚拟导航环境、m个虚拟移动机器人Ⅰ以及m个导航神经网络Ⅰ构成m个更新条件,每个更新条件由相对应的一个虚拟导航环境、一个虚拟移动机器人Ⅰ以及一个导航神经网络Ⅰ构成;/nS300、利用各更新条件训练更新所述独立粗粒度特征模块,直至独立粗粒度特征模块收敛,将收敛的独立粗粒度特征模块作为最终独立粗粒度特征模块;/nS400、构建一个包含有粗粒度特征模块的导航神经网络Ⅱ,并初始化神经网络参数,利用所述最终独立粗粒度特征模块的参数对所述导航神经网络Ⅱ的粗粒度特征模块的参数进行更新,得到导航神经网络Ⅲ;/nS500、在新导航环境中初始化一个虚拟移动机器人Ⅱ;/nS600、利用新导航环境和虚拟移动机器人Ⅱ,训练更新所述导航神经网络Ⅲ除粗粒度特征模块以外的其余神经网络参数,得到导航神经网络Ⅳ,完成在新导航环境中的导航设计。/n...

【技术特征摘要】
1.一种基于粗粒度特征的可迁移视觉导航设计方法,其特征在于,包括以下步骤:
S100、构建一个独立粗粒度特征模块以及m个包含粗粒度特征模块的导航神经网络Ⅰ,并初始化神经网络参数,m≥2;
S200、随机生成m个不同的虚拟导航环境,并在各个虚拟导航环境中均初始化一个虚拟移动机器人Ⅰ,所述导航神经网络Ⅰ与所述虚拟导航环境一一对应,m个虚拟导航环境、m个虚拟移动机器人Ⅰ以及m个导航神经网络Ⅰ构成m个更新条件,每个更新条件由相对应的一个虚拟导航环境、一个虚拟移动机器人Ⅰ以及一个导航神经网络Ⅰ构成;
S300、利用各更新条件训练更新所述独立粗粒度特征模块,直至独立粗粒度特征模块收敛,将收敛的独立粗粒度特征模块作为最终独立粗粒度特征模块;
S400、构建一个包含有粗粒度特征模块的导航神经网络Ⅱ,并初始化神经网络参数,利用所述最终独立粗粒度特征模块的参数对所述导航神经网络Ⅱ的粗粒度特征模块的参数进行更新,得到导航神经网络Ⅲ;
S500、在新导航环境中初始化一个虚拟移动机器人Ⅱ;
S600、利用新导航环境和虚拟移动机器人Ⅱ,训练更新所述导航神经网络Ⅲ除粗粒度特征模块以外的其余神经网络参数,得到导航神经网络Ⅳ,完成在新导航环境中的导航设计。


2.根据权利要求1所述基于粗粒度特征的可迁移视觉导航设计方法,其特征在于,所述环境的构成因子包括墙面纹理、地面纹理、障碍物形状、障碍物尺寸、障碍物纹理、目标物形状、目标物尺寸和目标物纹理。


3.根据权利要求1所述基于粗粒度特征的可迁移视觉导航设计方法,其特征在于,所述步骤S300中,每次对所述独立粗粒度特征模块进行训练更新的过程包括以下步骤:
S301、令导航神经网络Ⅰ控制虚拟导航环境内的虚拟移动机器人Ⅰ连续导航交互t次,得到包含t个交互样本的交互样本序列Ⅰ;
S302、利用交互样本序列Ⅰ根据强化学习算法计算并保存导航神经网络Ⅰ的粗粒度特征模块梯度,更新导航神经网络Ⅰ的参数;
S303、利用所保存的导航神经网络Ⅰ的粗粒度特征模块梯度,通过梯度下降法更新独立粗粒度特征模块;
S304、利用更新后的独立粗粒度特征模块的神经网络参数再次更新导航神经网络Ⅰ的参数;
S305、重复步骤S301至步骤S304,直至导航神经网络Ⅰ收敛,输...

【专利技术属性】
技术研发人员:汪晨曾凡玉葛树志穆罕默德·阿卜杜拉齐兹·埃尔多索基
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1