基于实例分割的三维重建方法、系统、存储介质及终端技术方案

技术编号：28785338 阅读：22 留言：0更新日期：2021-06-09 11:20

本发明专利技术公开了基于实例分割的三维重建方法、系统、存储介质及终端，方法包括提取目标图像的特征信息；获取目标图像的掩膜特征；将目标图像的特征信息、掩膜特征进行拼接得到目标图像的对应区域特征并进行聚合处理，生成目标图像的三维网格模型。本发明专利技术将目标图像的特征信息、掩膜特征进行拼接得到目标图像的对应区域特征，使目标图像的三维网格模型生成过程中仅关注图片中包含目标对象的那一小块区域特征，目标对象不会受到图片中复杂背景的影响，即实现了图像中前景目标与背景对象的精准分割，对目标图像的对应区域特征进行聚合处理，即可实现低成本、快速地从单张真实室内场景图像中生成目标对象的三维网格模型，适用范围广，实用性强。实用性强。实用性强。

全部详细技术资料下载

【技术实现步骤摘要】
基于实例分割的三维重建方法、系统、存储介质及终端

[0001]本专利技术涉及图像三维重建
，尤其涉及一种基于实例分割的单幅图片中目标对象的三维重建方法、系统、存储介质及终端。

技术介绍

[0002]对室内场景中的家具对象进行三维重建是3D游戏开发、AR/VR内容生成、家装、租房、VR看房等领域的重要部分，其效率和成本都是相关从业人员非常重视的问题。传统方法对真实室内场景中的家具对象进行三维重建需要专业人员先从包含家具对象的图片中找出需要建模的家具对象，再通过专业的3D建模引擎进行设计、建模、渲染等步骤才能得到精细的三维模型，这类方法往往需要大量的人力成本和时间成本。此外，使用基于Alice视觉摄影测量计算机视觉框架的三维重建软件MeshRoom，可以从一组无序的照片或视频中推断出家具的几何结构，这类方法需要专门学习如何操作该软件，并且需要非常强大的GPU资源来进行建模和渲染。
[0003]为减少人力成本和时间成本，相关研究人员开始尝试使用深度学习来进行三维重建，此类方法主要针对于无背景的RGB图片，即图片中只有需要建模的家具对象，不能受到复杂背景的干扰。然而，包含家具对象的图片基本都是真实室内场景，包含大量的背景对象，在复杂背景的干扰下，此类方法不能明确需要建模的家具对象，无法实现快速三维建模。此外，为解决背景对象对前景目标即家具的干扰问题，可通过人工从真实图片的复杂背景中分割出需要三维重建的家具对象，该方法耗时费力，显然不符合当下对三维重建的效率要求。

技术实现思路

[0004]本专利...

【技术保护点】

【技术特征摘要】
1.一种基于实例分割的三维重建方法，其特征在于：所述方法包括：提取目标图像的特征信息；根据目标图像的特征信息获取目标图像的掩膜特征；将目标图像的特征信息、掩膜特征进行拼接得到目标图像的对应区域特征，并对目标图像的对应区域特征进行聚合处理进而生成目标图像的三维网格模型。2.根据权利要求1所述基于实例分割的三维重建方法，其特征在于：所述获取目标图像的掩膜特征具体包括：对目标图像的特征信息依次进行卷积、反卷积、卷积处理，进而得到目标图像的掩膜特征。3.根据权利要求1所述基于实例分割的三维重建方法，其特征在于：所述将目标图像的特征信息、掩膜特征进行拼接得到目标图像的对应区域特征具体包括：对目标图像的特征信息、掩膜特征进行拼接并依次进行卷积、最大池化处理，进而得到目标图像的对应区域特征。4.根据权利要求1所述基于实例分割的三维重建方法，其特征在于：所述生成目标图像的三维网格模型过程中采用一个固定的椭球根据目标图像的对应区域特征形变为目标三维模型，并通过损失函数约束初始椭球面形变成目标三维模型，损失函数的计算公式具体为：L
total
＝L
cls
+L
box
+L
mask
+λ
cd
·
L
cd
+λ
norm
·
L
norm
+λ
edge
·
L
edge
其中，L
cls
、L
box
、L
mask
分别是获取目标图像的掩膜特征的实例分割网络的分类损失函数、边界框回归损失函数、掩码预测损失函数；L
cd
、L
norm
、L
edge
分别是用于约束生成目标图像的三维网格模型的三维重建网络的倒角距离损失函数、绝对法线距离损失函数、以及边损失函数；λcd、λnorm、λedge是三维重建网络损失函数的权重，其值分别设定为λcd＝1、λnorm＝0.1、...

【专利技术属性】
技术研发人员：匡平，李熙，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人