用于高质量图像处理的机器学习制造技术

技术编号：36900074 阅读：12 留言：0更新日期：2023-03-18 09:20

能够通过使用机器学习和真实值数据训练来帮助用于修复的系统或方法。通过使用真实值图像数据来训练机器学习修复模型可以增加图像修复领域的效率和精度。此外，机器学习修复模型能够帮助各种数据类型的非确定性预测，并且能够适用于各种数据类型的移除和/或替换。由于通过训练调整的校准参数，使得经训练的模型能够在没有真实值保证的情况下进行预测。型能够在没有真实值保证的情况下进行预测。型能够在没有真实值保证的情况下进行预测。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于高质量图像处理的机器学习

[0001]本公开总体上涉及处理图像数据。更具体地，本公开涉及一种用于能够借助于真实值数据来训练的高质量图像修复的机器学习的模型。

技术介绍

[0002]图像(例如，照片)和其他形式的数据通常包括不想要的数据。作为一个示例，不想要的数据可以与由处理图像以减少图像中的噪声而产生的伪像相对应。作为另一示例，不想要的数据可以与风景前景中的人类或家庭照片背景中的未知人相对应。作为另一示例，不想要的数据可以与另外情况下的原始背景中的难看对象相对应。
[0003]因此，不想要的数据能够与遮挡或模糊图像的其他部分——诸如所描绘的场景——的对象相对应。然而，利用替换数据(例如，描绘被不想要的数据遮挡的图像的被遮挡部分的替换图像数据，也被称为“修复”的过程)替换不想要的数据是本质上非确定性的具有挑战性的问题。换句话说，可以从相同图像确定多个可能的解决方案，从而导致困难的问题。

技术实现思路

[0004]本公开的实施例的方面和优点将在以下描述中部分地阐述，或者能够从描述中学习，或者能够通过实施例的实践来学习。
[0005]本公开提供了用于基于数据特性和真实值训练技术利用替换数据替换不想要的数据的系统和方法。根据本公开的计算系统能够被配置为接收给定的增强数据集合、掩码和真实值数据集合；对所述增强数据和掩码进行编码；对所述真实值数据进行编码；对从两个编码接收的数据都进行编译；对所述编码进行解码；将输出与真实值数据进行比较；以及修改系统参数。通过使用真实值编码，可以进一步帮助计算系...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于训练条件变分自编码器以执行图像处理的计算机实现的方法，所述方法包括：由一个或多个计算设备获得训练示例，所述训练示例包括真实值图像数据、从将不想要的图像数据添加到所述真实值图像数据导出的增强图像数据以及指示所述不想要的图像数据在所述增强图像数据内的一个或多个位置的掩码；由所述一个或多个计算设备利用所述条件变分自编码器的第一编码器模型来处理所述增强图像数据和所述掩码，以生成用于所述图像数据的嵌入；由所述一个或多个计算设备利用第二编码器模型处理所述真实值图像数据和所述掩码以生成一个或多个分布值；由所述一个或多个计算设备利用所述条件变分自编码器的解码器模型来处理所述嵌入和所述一个或多个分布值，以生成预测图像数据，所述预测图像数据包括由所述掩码指示的所述一个或多个位置处的替换图像数据，其中，所述替换图像数据替换所述不想要的图像数据；由所述一个或多个计算设备基于所述预测图像数据与所述真实值图像数据的比较来评估一个或多个损失函数；以及由所述一个或多个计算设备至少部分地基于所述一个或多个损失函数修改所述条件变分自编码器的一个或多个参数值。2.根据权利要求1所述的计算机实现的方法，其中，所述真实值图像数据包括二维照片。3.根据前述权利要求中的任一项所述的计算机实现的方法，其中，所述真实值图像数据包括真实值三维点云，所述增强图像数据包括添加到所述真实值三维点云的一个或多个不想要的点，并且所述掩码标识所述一个或多个不想要的点。4.根据前述权利要求中的任一项所述的计算机实现的方法，其中，评估所述一个或多个损失函数包括评估所述预测图像数据与所述真实值图像数据之间的L1损失。5.根据前述权利要求中的任一项所述的计算机实现的方法，其中，评估所述一个或多个损失函数包括评估基于判别器输出生成的对抗损失，所述判别器输出由判别器模型基于所述预测图像数据和所述真实值图像数据生成。6.根据权利要求5所述的计算机实现的方法，其中，所述判别器模型包括：第一纹理级网络，所述第一纹理级网络处理所述真实值图像数据的在由所述掩码标识的所述一个或多个位置处的部分，以生成第一纹理判别器输出；第二纹理级网络，所述第二纹理级网络处理所述预测图像数据的在由所述掩码标识的所述一个或多个位置处的部分，以生成第二纹理判别器输出；以及语义级网络，所述语义级网络包括共享网络，所述共享网络处理已从其中移除了所述不想要的数据的所述真实值图像数据，以生成语义判别器输出；其中，所述语义级网络基于所述第一纹理判别器输出、所述第二纹理判别器输出和所述语义判别器输出来生成所述判别器输出。7.根据前述权利要求中的任一项所述的计算机实现的方法，其中，所述分布值包括平均值和标准偏差值。8.根据权利要求7所述的计算机实现的方法，其中，所述分布值由KL散度损失函数惩
罚。9.根据前述权利要求中的任一项所述的计算机实现的方法，进一步包括：将所述分布值乘以随机值以生成修改的分布值，其中，所述判别器模型处理所述修改的分布值以生成所述预测图像数据。10.根据前述权利要求中的任一项所述的计算机实现的方法，其中，获得所述增强图像数据包括：标识不想要的数据的集合；确定所述不想要的数据遮挡所述真实值数据的位置；利用所述不想要的数据的集合替换所述位置处的所述真实值数据的一部分。11.根据前述权利要求中的任一项所述的计算机实现的方法，其中：所述真实值图像数据描绘场景；所述不想要的图像数据包括遮挡对象；以及所述替换图像数据描绘由被遮挡对象遮挡的场景的一个或多个部分。12.根据权利要求11所述的计算机实现的方法，...

【专利技术属性】
技术研发人员：金沢伦次，
申请(专利权)人：谷歌有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人