【技术实现步骤摘要】
模型训练方法、图像生成方法和装置
[0001]本公开的实施例涉及计算机
和互联网
,具体涉及人工智能
和图像处理
,尤其涉及模型训练方法、图像生成方法和装置。
技术介绍
[0002]随着深度神经网络的不断发展和广泛应用,人工智能在计算机视觉领域迅猛发展,其中,基于人工智能技术进行图像编辑不仅可以让没有修图技术基础的大众方便快捷地编辑照片,还能高效地形成一些有趣的特效,比如生成异性照片、不同年龄阶段的照片、以及卡通脸等。现在常用的技术手段是一种基于生成网络逆映射的图像转译框架,将图像的语义分割图或草绘图作为输入,映射到生成网络的隐变量,用隐变量生成的图像去拟合语义分割图或草绘图所对应的原图。
[0003]然而上述训练方式训练复杂且训练时间长,并且网络对数据的依赖性较强;基于生成网络逆映射的图像编辑虽然可以实现对真实图像的语义编辑,但是编辑过程需要对生成网络的隐空间进行细致的分析和处理,比较繁琐,无法方便地进行控制等等。
技术实现思路
[0004]本公开的实施例提出了一种模型训练方 ...
【技术保护点】
【技术特征摘要】
1.一种模型训练方法,所述方法包括:获取训练样本集,其中,所述训练样本集包括样本输入图像、样本参考图像和期望图像;构建初始模型,其中,所述初始模型包括第一初始编码器、第二初始编码器和基于层级架构的多层级生成器;利用机器学习方法,将所述样本输入图像作为所述第一初始编码器的输入,所述样本参考图像作为所述第二初始编码器的输入,并将所述第一初始编码器和所述第二初始编码器的输出作为所述多层级生成器的输入,所述期望图像作为期望输出,对所述初始模型进行训练,得到图像生成模型。2.根据权利要求1所述的方法,其中,所述多层级生成器中每层生成器基于预训练的多层级生成网络构建得到,所述每层生成器包括预训练的、用于处理第一空间中的特征向量的第一模块;以及,所述利用机器学习方法,将所述样本输入图像作为所述第一初始编码器的输入,所述样本参考图像作为所述第二初始编码器的输入,并将所述第一初始编码器和所述第二初始编码器的输出作为所述多层级生成器的输入,所述期望图像作为期望输出,对所述初始模型进行训练,得到图像生成模型,包括:将所述样本输入图像作为所述第一初始编码器的输入,所述样本参考图像作为所述第二初始编码器的输入;将所述第一初始编码器和所述第二初始编码器的输出结果输入至每层生成器中的第一模块,所述期望图像作为期望输出,利用机器学习方法对所述第一初始编码器和所述第二初始编码器进行训练,得到第一编码器和第二编码器;将所述第一编码器、所述第二编码器和包括所述第一模块的多层级生成器确定为所述图像生成模型。3.根据权利要求2所述的方法,其中,所述多层级生成器中预设层生成器还包括用于处理第二空间中的特征向量的第二初始模块;以及,所述方法还包括:获取所述样本参考图像对应的样本特征金字塔,其中,所述样本特征金字塔包括多个尺度的样本特征图;将所述样本输入图像作为所述第一编码器的输入,所述样本参考图像作为所述第二编码器的输入;将所述第一编码器和所述第二编码器的输出结果输入至每层生成器中的第一模块;将所述预设层生成器的上一层生成器的输出结果和所述样本特征金字塔输入至所述第二初始模块,所述期望图像作为期望输出,利用机器学习方法对所述第二初始模块进行训练,得到第二模块;以及所述将所述第一编码器、所述第二编码器和包括所述第一模块的多层级生成器确定为所述图像生成模型,包括:将所述第一编码器、所述第二编码器、包括所述第一模块和所述第二模块的多层级生成器确定为所述图像生成模型。4.根据权利要求3所述的方法,其中,所述第二初始模块包括特征选择层、特征融合层和Transformer;以及
所述将所述预设层生成器的上一层生成器的输出结果和所述样本特征金字塔输入至所述第二初始模块,所述期望图像作为期望输出,利用机器学习方法对所述第二初始模块进行训练,得到第二模块,包括:将所述样本参考图像对应的样本特征金字塔作为所述特征融合层的输入,所述预设层生成器的上一层生成器的输出结果和所述样本输入图像对应的输入特征作为所述特征选择层的输入,并将所述特征融合层和所述特征选择层的输出作为所述Transformer的输入;将所述Transformer的输出和所述第一编码器和所述第二编码器的输出结果输入至所述预设层生成器中的第一模块;将所述期望图像作为期望输出,利用机器学习方法对所述预设层生成器中的第二初始模块进行训练,得到所述第二模块。5.根据权利要求1所述的方法,其中,所述利用机器学习方法,将所述样本输入图像作为所述第一初始编码器的输入,所述样本参考图像作为所述第二初始编码器的输入,并将所述第一初始编码器和所述第二初始编码器的输出作为所述多层级生成器的输入,所述期望图像作为期望输出,对所述初始模型进行训练,得到图像生成模型,包括:将所述样本输入图像作为所述第一初始编码器的输入,所述样本参考图像作为所述第二初始编码器的输入,并将所述第一初始编码器和所述第二初始编码器的输出作为所述多层级生成器的输入,得到所述多层级生成器的生成图像;基于所述生成图像和所述期望图像,确定表征图像像素特征的第一损失函数;基于所述第一损失函数调整所述初始模型,得到所述图像生成模型。6.根据权利要求5所述的方法,其中,所述方法还包括:基于所述生成图像和所述期望图像,确定第二损失函数,其中,所述第二损失函数包括以下至少一项:表征图像感知特征的感知损失函数、表征图像标识特征的损失函数和正则化损失函数;以及所述基于所述第一损失函数调整所述初始模型,得到所述图像生成模型,包括:基于所述第一损失函数和所述第二损失函数调整所述初始模型,得到所述图像生成模型。7.一种图像生成方法,所述方法包括:响应于获取到输入图像和参考图像,将所述输入图像和参考图像输入至图像生成模型,其中,所述图像生成模型包括第一编码器、第二编码器和基于层级架构的多层级生成器;通过所述第一编码器对所述输入图像...
【专利技术属性】
技术研发人员:沈力,郑贺亮,陶大程,
申请(专利权)人:京东科技信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。