当前位置: 首页 > 专利查询>武汉大学专利>正文

一种基于卷积循环编码-解码结构的多视影像三维重建方法技术

技术编号:24095999 阅读:54 留言:0更新日期:2020-05-09 10:22
本发明专利技术公开了一种基于卷积循环编码‑解码结构的多视影像三维重建方法,包括如下步骤:构建用于训练网络的多视航空影像数据库,数据库中包括多视航空影像、影像对应的内外方位元素,以及每张影像对应的真实深度图;构建多视密集匹配网络RED‑Net,利用步骤1构建的训练数据库训练网络,学习影像匹配中的底层特征;利用训练完成后的网络对多视航空影像进行预测,得到参考影像视角下的预测深度图;根据提供的相机的内参和位置姿态参数,结合预测的深度图,将影像中的每个像素点反投影至三维物方空间,得到点云构成的三维模型。本发明专利技术具有如下优点:可用于从多视影像到深度图的端到端的密集匹配;可用于大尺度影像的匹配;可迁移性强、精度好、效率高。

A 3D reconstruction method of multi view image based on convolutional cyclic coding decoding structure

【技术实现步骤摘要】
一种基于卷积循环编码-解码结构的多视影像三维重建方法
本专利技术涉及一种用于多视航空遥感影像的多视密集匹配的深度学习方法,可实现基于遥感影像的地形地物三维重建。
技术介绍
从立体或多视航空航天遥感影像重建地面三维场景一直是摄影测量与遥感中的核心问题。从遥感影像中获取高精度的三维地形信息的一个核心关键问题是影像的密集匹配。密集匹配是一种由计算机代替人眼进行立体观察,自动获取影像中同名像点的视差值或深度值的过程。是由二维图像到三维场景转换过程中不可或缺的一部分。传统的多视密集匹配方法多是基于影像间的几何关系,通过复杂的几何运算得到,计算量大。例如基于面片的全局匹配算法是在全局范围内执行最优化,其计算量大,运行所需时间过长,对资源的消耗多,不适合实时的匹配操作。目前由多视航空影像进行大尺度、高精度的地表三维重建主要通过商用软件SURE、Smart3D等完成,这些软件均基于传统的密集匹配方法。近年来逐渐发展并应用在各个方面的深度学习方法,节省了大量的时间消耗和人工特征提取的工作,引起了广泛的研究。一些基于深度学习的密集匹配方法如LSM、Deep本文档来自技高网...

【技术保护点】
1.一种基于卷积循环编码-解码结构的多视影像三维重建方法,其特征在于,包括如下步骤:/n步骤1,构建用于训练网络的多视航空影像数据库,数据库中包括多视航空影像、影像对应的内外方位元素,以及每张影像对应的真实深度图;/n步骤2,构建多视密集匹配网络RED-Net,利用步骤1构建的数据库训练网络,学习影像匹配中的底层特征;/n所述多视密集匹配网络RED-Net包括:特征检测部分,构建代价图部分,循环编码-解码规则化部分,计算损失函数值部分共四个部分;其中特征检测部分用于利用卷积神经网络分支提取遥感影像二维层面的特征,获得特征图;代价图构建部分用于将特征图投影至三维空间的特定深度平面上,将不同视角下...

【技术特征摘要】
1.一种基于卷积循环编码-解码结构的多视影像三维重建方法,其特征在于,包括如下步骤:
步骤1,构建用于训练网络的多视航空影像数据库,数据库中包括多视航空影像、影像对应的内外方位元素,以及每张影像对应的真实深度图;
步骤2,构建多视密集匹配网络RED-Net,利用步骤1构建的数据库训练网络,学习影像匹配中的底层特征;
所述多视密集匹配网络RED-Net包括:特征检测部分,构建代价图部分,循环编码-解码规则化部分,计算损失函数值部分共四个部分;其中特征检测部分用于利用卷积神经网络分支提取遥感影像二维层面的特征,获得特征图;代价图构建部分用于将特征图投影至三维空间的特定深度平面上,将不同视角下的特征图融合为代价图;循环编码-解码规则化部分由循环编码-解码结构组成,包括4个卷积层和4个上卷积层,以及4个门控循环单元,用于对代价图进行规则化处理;计算损失函数值部分采用交叉熵损失值,当交叉熵损失值收敛时,网络模型训练完成;
步骤3,利用训练好的网络模型对真实的多视航空影像进行预测,得到参考影像视角下的预测深度图;
步骤4,根据提供的相机的内参和位置姿态参数,结合预测的深度图,利用已有的共线条件方程将影像中的每个像素点反投影至三维物方空间,得到点云构成的三维模型。


2.如权利要求1所述的一种基于卷积循环编码-解码结构的多视影像三维重建方法,其特征在于:步骤1的具体实现包括如下子步骤,
步骤1.1,选取多视影像数据;以一张航空影像为参考影像,与其航向相邻与旁向相邻的上下左右四张影像为源影像,这样的五张影像和对应的真实深度图以及空三解算后的相机参数、位姿参数作为一组五视数据单元,真实深度图由激光扫描获得,或利用高精度的地表三维模型通过虚拟投影的方式生成虚拟影像和对应的深度图;
步骤1.2,训练样本分割;在一组五视数据单元影像所共有的重叠区域内,将五张影像分别裁剪为M*N的样本数据,并用同样的方式将对应的深度图裁剪为同样大小的样本作为训练真值;
步骤1.3,构建训练样本库;选取一组裁剪为M*N像素大小的五视数据切片,与对应的五视切片深度图和相机参数文件构成一组五视训练样本,将多组多视航空影像数据分别裁剪为多组数据切片,构成训练样本库。


3.如权利要求1所述的一种基于卷积循环编码-解码结构的多视影像三维重建方法,其特征在于:所述特征检测部分对于N张输入影像设置了N个2D卷积神经元网络分支,每一分支包括5个卷积层,通道数分别为8,8,16,16,16;其中前四层均由卷积层和修正线性单元ReLU构成,第五层仅由卷积层构成;前两层的卷积核大小为3×3,卷积步长为1.第三层的卷积核大小为5×5,卷积步长为2,后两层的卷积核大小为3×3,步长为1,每个网络分支之间共享权重,最终特征检测部分对每一张...

【专利技术属性】
技术研发人员:季顺平刘瑾
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1