【技术实现步骤摘要】
本公开涉及人工智能技术,可应用在车辆领域,具体涉及一种深度图像生成方法和深度图像生成模型的训练方法。
技术介绍
1、mde(monocular depth estimation,单目深度估计)是计算机视觉与三维视觉领域的核心任务,其目标是从单张2d(two-dimensional,二维)图像中推断出场景中每个像素点的深度信息(即物体到相机的距离)。然而,相关技术中的单目深度估计方法,深度图像存在边缘区域易产生“飞点”(flying pixels)伪影、边界模糊、结构断裂等问题,导致生成的三维点云的几何精度和边界保真度不高。
技术实现思路
1、本公开旨在至少在一定程度上解决相关技术中的技术问题之一。
2、为此,本公开提出一种深度图像生成方法和深度图像生成模型的训练方法,以通过引入图像的语义特征,避免仅基于目标图像和噪声图像直接生成深度图像时可能出现的边缘区域易产生“飞点”伪影、边界模糊、结构断裂等问题,提升深度图像转换为点云后的几何精度和边界保真度。
3、本公开第一方
...【技术保护点】
1.一种深度图像生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述语义特征和所述目标图像,对噪声图像进行处理,确定所述目标图像对应的深度图像,包括:
3.根据权利要求2所述的方法,其特征在于,所述将所述目标图像和所述噪声图像输入至深度图像生成模型中的第一扩散模块,以基于所述目标图像对所述噪声图像进行处理和特征提取,确定所述目标图像对应的图像特征,包括:
4.根据权利要求2所述的方法,其特征在于,所述将所述图像特征与所述语义特征输入至所述深度图像生成模型中的第二扩散模块,以基于所述语义特征对所述图像特
...【技术特征摘要】
1.一种深度图像生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述根据所述语义特征和所述目标图像,对噪声图像进行处理,确定所述目标图像对应的深度图像,包括:
3.根据权利要求2所述的方法,其特征在于,所述将所述目标图像和所述噪声图像输入至深度图像生成模型中的第一扩散模块,以基于所述目标图像对所述噪声图像进行处理和特征提取,确定所述目标图像对应的图像特征,包括:
4.根据权利要求2所述的方法,其特征在于,所述将所述图像特征与所述语义特征输入至所述深度图像生成模型中的第二扩散模块,以基于所述语义特征对所述图像特征进行调整,确定所述深度图像,包括:
5.一种深度图像生成模型的训练方法,其特征在于,包括:
6.根据权利要求5所述的方法,其特征在于,所述将所述训练图像、所述深度图像、所述语义特征以及噪声图像输入至深度图像生成模型,确定所述训练图像对应的预测深度图像,包括:
7.根据权利要求6所述的方法,其特征在于,所述将所述训练图像和所述目标深度图像输入至所述深度图像生成模型中的第一扩散模块,以基于所述训练图像对所述目标深度图像进行处理和特征提...
【专利技术属性】
技术研发人员:王兵,叶航军,许刚伟,
申请(专利权)人:小米汽车科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。