【技术实现步骤摘要】
一种基于图像语义分割的动态三维场景重建方法
[0001]本专利技术涉及计算机视觉中的同步定位与建图领域,针对动态场景尤其是存在运动物体的室内动态场景下的定位与建图。
技术介绍
[0002]同步定位与建图,即SLAM技术。通过机器人在未知环境中的不停运动,以自身携带摄像头来获取场景三维结构并同时更新自己的位姿。SLAM技术在无人驾驶、智能无人机、AR等领域都有着广泛地应用。
[0003]目前经典的三维重建算法都是基于静态环境或是缓慢变化的环境,这样所构建的场景可以由系统逐渐更新。而当相机图像中的出现相对于相机有独立运动的物体(比如行人)时,会造成相机位姿计算的误差增大以及构建的模型不准确等问题。
[0004]此外随着计算机技术的发展,使得机器学习被广泛地应用到SLAM技术中。现有的将机器学习和SLAM相融合的手段有:
[0005](1)使用机器学习来替换SLAM中一个或几个模块,如特征提取、位姿估计等;
[0006](2)在传统SLAM中加入语义信息,如使用语义分割来促进SLAM的定位等; />[0007]随着本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种融合了语义分割网络的改进三维场景重建技术,其特征在于,包括以下步骤:1)使用Deeplabv3+图像语义分割网络对输入图像帧进行像素级的分割选择目前效果顶尖的语义分割网络Deelabv3+,将Deelabv3+与ORB
‑
SLAM2相结合,使用Deelabv3+语义分割网络对图像帧进行语义分割,分割过程如下:对当前图像帧,在编码部分,采用MobileNet轻量深度卷积网络,将图像进行卷积得到两个特征层:一个低级特征,一个高级特征。而后对于高级特征进行一系列额外的操作。在解码部分,将编码部分获得的低级特征调整通道数后与高级特征上采样处理后的结果合并,再进行数次操作采样处理得到最后的分割结果。2)通过分割结果对动态目标的特征点和静态目标的特征点人为加以区分用于语义分割网络训练的数据集选择MS COCO,其中包含80类物体类别和91类填充类别。将总计171种分类类别人为先验地分为静态和动态两类。在分割结果中...
【专利技术属性】
技术研发人员:贾海涛,袁丁,张博阳,刘博文,陈璐,孙靖哲,许文波,
申请(专利权)人:电子科技大学长三角研究院湖州,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。