使用机器学习的图像着色制造技术

技术编号:32084824 阅读:48 留言:0更新日期:2022-01-29 18:05
这里描述的实施方式涉及要训练和使用机器学习模型来对描绘人的灰度图像进行着色的方法、系统和计算机可读介质。在一些实施方式中,计算机实现的方法包括接收灰度图像。该方法进一步包括通过提供灰度图像作为对经训练的卷积神经网络(CNN)的输入,基于灰度图像生成着色图像作为经训练的CNN的输出。在一些实施方式中,经训练的CNN执行部位分割以检测人的一个或多个部位并对灰度图像进行着色。的一个或多个部位并对灰度图像进行着色。的一个或多个部位并对灰度图像进行着色。

【技术实现步骤摘要】
【国外来华专利技术】使用机器学习的图像着色

技术介绍

[0001]自从相机首次变成可用以来,用户已经捕获照片以保存记忆。例如,由于相机技术的限制、由于捕获彩色照片的成本高等,摄影早期捕获的照片是黑白图像。随后,随着彩色照片变成可用和更加便宜,用户拍摄和存储彩色照片。
[0002]现代图像应用允许用户存储、查看和编辑照片。许多用户已经扫描了他们图书馆中旧黑白照片的副本以及最近捕获的彩色照片。如果将旧黑白照片渲染为彩色照片,用户可能喜欢它们。
[0003]虽然包括基于机器学习的技术的图像着色技术可以被用于对黑白图像进行着色,但是当将此类技术应用于旧黑白照片时,尤其是描绘一个或者多个人的照片,很难得到良好的输出彩色图像。例如,诸如皮肤区域与皮肤色调颜色不一致的错误;一个皮肤区域,例如,面部得到颜色,而另一个区域,例如,手没有得到颜色;等等使照片着色不理想。
[0004]此外,当前的图像着色技术没有考虑旧黑白照片中描绘的人通常穿着与较新的彩色照片中的人不同的服装风格的事实。当向描绘一个或多个人的黑白照片添加颜色时,当前的图像着色技术无法解决这种差异。这是域适应问题。
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种对描绘人的灰度图像进行着色的计算机实施方法,所述方法包括:接收所述灰度图像;以及通过提供所述灰度图像作为经训练的卷积神经网络CNN的输入,基于所述灰度图像生成着色图像作为所述经训练的CNN的输出,其中,所述经训练的CNN执行部位分割以检测所述人的一个或多个部位并对所述灰度图像进行着色。2.根据权利要求1所述的计算机实现的方法,其中,生成所述着色图像包括:获得中间着色图像作为所述经训练的CNN的潜在层的输出;获得网络输出图像作为所述经训练的CNN的输出层的输出;以及组合所述中间着色图像和所述网络输出图像以获得所述着色图像。3.根据权利要求2所述的计算机实现的方法,其中,所述中间着色图像具有比所述网络输出图像低的分辨率,所述方法进一步包括,在所述组合之前,将所述中间着色图像上采样到与所述网络输出图像相同的分辨率。4.根据权利要求1所述的计算机实现的方法,进一步包括,在将所述灰度图像作为输入提供给所述经训练的CNN之前对所述灰度图像进行下采样。5.根据权利要求1所述的计算机实现的方法,其中,所述着色图像具有比所述灰度图像低的分辨率,所述方法进一步包括:将所述着色图像上采样到与所述灰度图像相同的分辨率;以及将所述着色图像与所述灰度图像组合以获得输出图像。6.根据权利要求1所述的计算机实现的方法,其中,所述着色图像是sRGB图像。7.一种训练卷积神经网络以对灰度图像着色的计算机实现的方法,所述方法包括:提供训练数据,所述训练数据包括各自描绘一个或多个人的多个训练彩色图像、对应的灰度训练图像以及用于每个训练彩色图像中的一个或多个人的部位注释;以及对于每个灰度训练图像,基于所述灰度训练图像和用于所述灰度训练图像中的所述一个或多个人的部位注释,获得描述着色图像的输出特征向量作为所述卷积神经网络的输出;基于由像素鉴别器对所述着色图像是原始彩色图像还是预测彩色图像的标签预测,从所述像素鉴别器获得感知损失值;以及基于所述感知损失值修改所述卷积神经网络的参数。8.根据权利要求7所述的计算机实现的方法,进一步包括:对于每个灰度训练图像:基于所述灰度训练图像和用于所述灰度训练图像中的所述一个或多个人的中间部位注释,从所述卷积神经网络的潜在层获得描述中间着色图像的中间特征向量;以及基于由特征鉴别器对是否存在与所述中间着色图像对应的地面实况彩色图像的预测,从所述特征鉴别器获得特征损失值,其中,所述中间特征向量被提供作为对所述特征鉴别器的输入;并且其中,修改所述卷积神经网络的所述参数进一步基于所述特征损失值。9.根据权利要求8所述的计算机实现的方法,进一步包括:将所述中间着色图像改变大小;从所述卷积神经网络的输出层获得网络输出图像;以及
将所述中间着色图像和所述网络输出图像组合以获得所述着色图像。10.根据权利要求7所述的计算机实现的方法,进一步包括,对于每个灰度训练图像,从饱和度增强器获得饱和度损失,并且其中,修改所述卷积神经网络的所述参数进一步基于所述饱和度损失。11.根据权利要求10所述的计算机实现的方法,其中...

【专利技术属性】
技术研发人员:诺里
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1