深度图像生成方法和深度图像生成模型的训练方法技术

技术编号：46569148 阅读：2 留言：0更新日期：2025-10-10 21:16

本公开提出一种深度图像生成方法和深度图像生成模型的训练方法，其中，深度图像生成方法包括：对目标图像进行语义特征提取，确定目标图像的语义特征；根据语义特征和目标图像，对噪声图像进行处理，确定目标图像对应的深度图像。由此，通过引入图像的语义特征，在生成目标图像对应的深度图像时不仅能够更精准地理解目标图像的整体结构，还显著提升了对目标图像的局部细节的感知能力，从而能够兼顾全局结构与语义的一致性，以及局部细节的精细度，避免了仅基于目标图像和噪声图像直接生成深度图像时可能出现的边缘区域易产生“飞点”伪影、边界模糊、结构断裂等问题，进而显著提升深度图像转换为点云后的几何精度和边界保真度。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及人工智能技术，可应用在车辆领域，具体涉及一种深度图像生成方法和深度图像生成模型的训练方法。

技术介绍

1、mde(monocular depth estimation，单目深度估计)是计算机视觉与三维视觉领域的核心任务，其目标是从单张2d(two-dimensional，二维)图像中推断出场景中每个像素点的深度信息(即物体到相机的距离)。然而，相关技术中的单目深度估计方法，深度图像存在边缘区域易产生“飞点”(flying pixels)伪影、边界模糊、结构断裂等问题，导致生成的三维点云的几何精度和边界保真度不高。

技术实现思路

1、本公开旨在至少在一定程度上解决相关技术中的技术问题之一。

2、为此，本公开提出一种深度图像生成方法和深度图像生成模型的训练方法，以通过引入图像的语义特征，避免仅基于目标图像和噪声图像直接生成深度图像时可能出现的边缘区域易产生“飞点”伪影、边界模糊、结构断裂等问题，提升深度图像转换为点云后的几何精度和边界保真度。

3、本公开第一方...

【技术保护点】

1.一种深度图像生成方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述语义特征和所述目标图像，对噪声图像进行处理，确定所述目标图像对应的深度图像，包括：

3.根据权利要求2所述的方法，其特征在于，所述将所述目标图像和所述噪声图像输入至深度图像生成模型中的第一扩散模块，以基于所述目标图像对所述噪声图像进行处理和特征提取，确定所述目标图像对应的图像特征，包括：

4.根据权利要求2所述的方法，其特征在于，所述将所述图像特征与所述语义特征输入至所述深度图像生成模型中的第二扩散模块，以基于所述语义特征对所述图像特征进行调整，确定所述...

【技术特征摘要】

1.一种深度图像生成方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述根据所述语义特征和所述目标图像，对噪声图像进行处理，确定所述目标图像对应的深度图像，包括：

4.根据权利要求2所述的方法，其特征在于，所述将所述图像特征与所述语义特征输入至所述深度图像生成模型中的第二扩散模块，以基于所述语义特征对所述图像特征进行调整，确定所述深度图像，包括：

5.一种深度图像生成模型的训练方法，其特征在于，包括：

6.根据权利要求5所述的方法，其特征在于，所述将所述训练图像、所述深度图像、所述语义特征以及噪声图像输入至深度图像生成模型，确定所述训练图像对应的预测深度图像，包括：

7.根据权利要求6所述的方法，其特征在于，所述将所述训练图像和所述目标深度图像输入至所述深度图像生成模型中的第一扩散模块，以基于所述训练图像对所述目标深度图像进行处理和特征提...

【专利技术属性】
技术研发人员：王兵，叶航军，许刚伟，
申请(专利权)人：小米汽车科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人