图像生成方法、图像处理模型的训练方法、图像处理方法技术

技术编号：32127322 阅读：13 留言：0更新日期：2022-01-29 19:18

本公开提供了一种图像生成方法，涉及人工智能领域，尤其涉及计算机视觉和深度学习技术领域。具体实现方案为：沿第一方向，对三维图像执行切片操作，得到多个第一切片图像，第一切片图像包括多个第一区域，每个第一区域对应一个类别；针对多个第一切片图像，根据每个第一切片图像中像素的位置信息，对每个第一切片图像执行转换操作，得到多个第一切片图像的深度图像；根据多个第一切片图像的深度图像，得到三维图像的深度图像。本公开还提供了一种图像处理模型的训练方法、图像处理方法、装置、电子设备和存储介质。设备和存储介质。设备和存储介质。

全部详细技术资料下载

【技术实现步骤摘要】
图像生成方法、图像处理模型的训练方法、图像处理方法

[0001]本公开涉及人工智能
，尤其涉及计算机视觉和深度学习技术。更具体地，本公开提供了一种图像生成方法、图像处理模型的训练方法、图像处理方法、装置、电子设备和存储介质。

技术介绍

[0002]相关技术中，可以利用三维图像处理模型对三维图像进行处理，以提取三维图像的特征。也可以先将三维图像转换多张二维图像，利用二维图像处理模型对每张二维图像的特征，得到多张二维图像的特征，再利用多张二维图像的特征，得到三维图像的特征。

技术实现思路

[0003]本公开提供了一种图像处理模型的训练方法、图像处理方法、装置、设备以及存储介质。
[0004]根据第一方面，提供了一种图像生成方法，该方法包括：沿第一方向，对三维图像执行切片操作，得到多个第一切片图像，第一切片图像包括多个第一区域，每个第一区域对应一个类别；针对多个第一切片图像，根据每个第一切片图像中像素的位置信息，对每个第一切片图像执行转换操作，得到多个第一切片图像的深度图像；以及根据多个第一切片图像的深度图像，得到三维图像的深度图像。
[0005]根据第二方面，提供了一种图像处理模型的训练方法，包括：沿第二方向，对三维样本图像执行切片操作，得到多个第二切片图像；将上述多个第二切片图像输入上述图像处理模型，得到多个预测图像；将多个预测图像输入深度估计模型，得到多个预测图像的深度图像；以及利用上述多个预测图像的深度图像和标签图像的深度图像，训练上述图像处理模型；其中，上述标签图像的深度图像...

【技术保护点】

【技术特征摘要】
1.一种图像生成方法，包括：沿第一方向，对三维图像执行切片操作，得到多个第一切片图像，所述第一切片图像包括多个第一区域，每个第一区域对应一个类别；针对所述多个第一切片图像，根据每个第一切片图像中像素的位置信息，对每个第一切片图像执行转换操作，得到多个第一切片图像的深度图像；以及根据所述多个第一切片图像的深度图像，得到所述三维图像的深度图像。2.根据权利要求1所述的方法，其中，所述第一切片图像包括多个第一像素，所述第一像素位于所述第一区域，所述针对所述多个第一切片图像，根据每个第一切片图像中像素的位置信息，对每个第一切片图像执行转换操作，得到多个第一切片图像的深度图像包括：针对每个第一切片图像，根据该第一切片图像中第一像素的位置信息，将每个第一像素的像素值转换为该第一像素到该第一像素所处第一区域的边界之间的距离，得到多个深度像素；根据所述多个深度像素，得到该第一切片图像的深度图像。3.根据权利要求2所述的方法，其中，通过以下公式对每个第一切片图像执行转换操作：其中，G
x，y
为第一切片图像中的像素，x为所述像素G
x，y
所在的行的行号，y为所述像素所在列的列号，z为第z个第一区域，z＝1，......Z，z
′
为第一切片图像上的第二区域；在图像的第y列上，S
z
(y)为处于所述第z个第一区域的一个边界上的第一像素所在行的行号，E
z
(y)为处于所述第z个第一区域的另一个边界上的第一像素所在行的行号，P
x，y
为深度图像中的像素的像素值。4.一种图像处理模型的训练方法，包括：沿第二方向，对三维样本图像执行切片操作，得到多个第二切片图像；将所述多个第二切片图像输入所述图像处理模型，得到多个预测图像；将多个预测图像输入深度估计模型，得到多个预测图像的深度图像；以及利用所述多个预测图像的深度图像和标签图像的深度图像，训练所述图像处理模型；其中，所述标签图像为所述三维样本图像的标签，所述标签图像的深度图像是将所述标签图像作为三维图像根据权利要求1至3任一项所述的方法得到。5.根据权利要求4所述的方法，其中，所述利用所述多个预测图像的深度图像和标签图像的深度图像，训练所述图像处理模型包括：根据所述预测图像的深度图像和标签图像的深度图像，计算第一损失值；根据所述第一损失值，训练所述图像处理模型。6.根据权利要求5所述的方法，其中，所述根据所述预测图像的深度图像和标签图像的深度图像，计算第一损失值包括：针对K个预测图像的深度图像，根据第k个预测图像的深度图像和第k个第三切片图像，
计算第k个第一子损失值，k＝1，......K，所述第三切片图像是沿所述第二方向对所述标签图像的深度图像执行切片操作得到的，所述第三切片图像为K个；根据所述第k个第一子损失值，计算所述第一损失值。7.根据权利要求6所述的方法，其中，所述根据所述第k个第一子损失值，计算所述第一损失值包括：通过以下公式计算第一损失值：其中，L
mse
为第一损失值，为第k个第三切片图像，为第k个预测图像的深度图像。8.根据权利要求5所述的方法，所述根据所述第一损失值，训练所述图像处理模型包括：根据所述预测图像和所述标签图像，计算第二损失值；根据所述第一损失值和所述第二损失值，训练所述图像处理模型。9.一种图像处理方法，包括：将待处理图像输入图像处理模型，得到掩码图像；其中，所述图像处理模型是根据权利要求4至8任一项所述的方法训练得到的。10.一种图像生成装置，包括：第一切片模块，用于沿第一方向，对三维图像执行切片操作，得到多个第一切片图像，所述第一切片图像包括多个第一区域，每个第一区域对应一个类别；转换模块，用于针对所述多个第一切片图像，根据每个第一切片图像中像素的位置信息，对每个第一切片...

【专利技术属性】
技术研发人员：尚方信，杨叶辉，黄海峰，王磊，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人