一种基于深度学习的端到端视觉里程计及方法技术

技术编号：15335975 阅读：630 留言：0更新日期：2017-05-16 22:14

本发明专利技术公开了一种基于深度学习的端到端视觉里程计及方法，包括级联的光流网络和帧间估计网络，所述光流网络根据数据集中图像序列中的相邻帧，选取输出光流向量和基准数据之间的光流端点误差为损失函数，进行网络训练后，将生成的光流输出，所述帧间估计网络以光流图像作为输入，基于六自由度输出位姿向量与基准数据之间的距离构建损失函数，迭代训练网络，进行帧间估计。本发明专利技术采用不同输入输出数据分别训练光流网络模块和帧间估计网络模块，最后将两者级联构成端到端的视觉里程计模块，再进一步深层次训练，优化参数。该层级化训练方法可以大幅降低训练时间，提高训练效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的端到端视觉里程计及方法
本专利技术涉及一种基于深度学习的端到端视觉里程计及方法。
技术介绍
视觉里程计是机器人利用视觉传感器估计自身运动的方法，是机器人定位、地图构建、避障以及路径规划等高层任务的基础技术。传统的视觉里程计主要基于帧间视觉特征的空间几何关系，估计机器人帧间位姿，因此也称为帧间估计。特征分为稀疏特征和稠密特征两类，分别对应于图像局部信息表示和全局信息表示。传统的特征需要人工选取或计算，造成对图像信息表示具有一定人为性和局限性，同时依赖特征匹配的准确性，在应对图像的光照变化、运动模糊、纹理单一等情形具有较大的局限性，影响了其估计精度。
技术实现思路
本专利技术为了解决上述问题，提出了一种基于深度学习的端到端视觉里程计及方法，本专利技术利用端到端的帧间估计深度神经网络技术，实现了从原始图像到帧间估计的直接输出，相对于传统方法，该技术无需手动提取特征或光流图像、无需构建特征描述子、无需帧间特征匹配，更无需进行复杂的几何运算。为了实现上述目的，本专利技术采用如下技术方案：一种基于深度学习的端到端视觉里程计，包括级联的光流网络和帧间估计网络，所述光流网络根据数据集中图像序列中的相邻帧，选取输出光流向量和基准数据之间的光流端点误差为损失函数，进行网络训练后，将生成的光流图像输出，所述帧间估计网络以光流图像作为输入，基于六自由度输出位姿向量与基准数据之间的距离构建损失函数，迭代训练网络，进行帧间估计。所述光流网络和帧间估计网络均为层次化训练方式。所述光流网络为卷积神经网络训练器。所述光流网络以相邻帧连续图像作为输入，选取输出光流向量和基准数据...
一种基于深度学习的端到端视觉里程计及方法

【技术保护点】
一种基于深度学习的端到端视觉里程计，其特征是：包括级联的光流网络和帧间估计网络，所述光流网络根据数据集中图像序列中的相邻帧，选取输出光流向量和基准数据之间的光流端点误差为损失函数，进行网络训练后，将生成的光流图像输出，所述帧间估计网络以光流图像作为输入，基于六自由度输出位姿向量与基准数据之间的距离构建损失函数，迭代训练网络，进行帧间估计。

【技术特征摘要】
1.一种基于深度学习的端到端视觉里程计，其特征是：包括级联的光流网络和帧间估计网络，所述光流网络根据数据集中图像序列中的相邻帧，选取输出光流向量和基准数据之间的光流端点误差为损失函数，进行网络训练后，将生成的光流图像输出，所述帧间估计网络以光流图像作为输入，基于六自由度输出位姿向量与基准数据之间的距离构建损失函数，迭代训练网络，进行帧间估计。2.如权利要求1所述的一种基于深度学习的端到端视觉里程计，其特征是：所述光流网络和帧间估计网络均为层次化训练方式。3.如权利要求1所述的一种基于深度学习的端到端视觉里程计，其特征是：所述光流网络为卷积神经网络训练器。4.如权利要求1所述的一种基于深度学习的端到端视觉里程计，其特征是：所述光流网络以相邻帧连续图像作为输入，选取输出光流向量和基准数据之间的光流端点误差作为损失函数，进行将输入的连续帧图像生成光流图像的网络训练。5.如权利要求1所述的一种基于深度学习的端到端视觉里程计，其特征是：所述帧...

【专利技术属性】
技术研发人员：刘国良，罗勇，田国会，赵洋，
申请(专利权)人：山东大学，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人