图像生成模型的训练方法、图像处理方法及装置制造方法及图纸

技术编号:28624492 阅读:26 留言:0更新日期:2021-05-28 16:20
本公开关于图像生成模型的训练方法、图像处理方法及装置,涉及图像处理技术领域。通过根据特征图的通道数对所述特征图的特征层进行分组,得到包含目标数目个特征层分组的目标特征图,根据输入模型的随机向量、特征图的通道数和目标数目设置预设归一化转化函数的可学习参数,得到目标归一化转化函数,根据所述目标归一化转化函数对所述特征图进行归一化处理,从而完成图像生成模型的训练。在归一化操作过程中既考虑了图像生成模型的输入,又考虑了归一化操作对象的特征,使得归一化操作过程中的参数相互关联,保证差异性不因归一化过程而消失,提高了用于图像生成的模型的训练效果,提高了生成图像的质量,缩短了模型的训练时间。

【技术实现步骤摘要】
图像生成模型的训练方法、图像处理方法及装置
本公开涉及图像处理
,尤其涉及图像生成模型的训练方法、图像处理方法及装置。
技术介绍
随着技术的发展,深度学习应用范围越来越广,深度学习是学习样本数据的内在规律和表示层次,使得网络模型能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据,在深度学习网络模型的训练过程中,一般会将深度学习网络模型中网络层处理后的特征图进行归一化处理,得到归一化的特征,使得特征图的数据变为均值为0,标准差为1的分布或者范围在0~1范围的分布,这样可以达到缩短模型收敛时间、提高模型训练效果,其中,目前的训练方法使用标准化分数方法,这种方法根据原始数据的均值和标准差进行标准化,使得经过处理后的数据符合标准正态分布,即均值为0,标准差为1,即使用公式为进行归一化操作,其中,x为原始数据,E(x)为x的均值,Var(x)为x的方差,y(x)为归一化处理结果,γ与β为可学习参数,其中γ与β是随着模型训练过程中的损失反向传播过程独立优化的、不与模型输入量以及模型产生联系的独立数值,这样会导致差异性因归一化过程而消本文档来自技高网...

【技术保护点】
1.一种图像生成模型的训练方法,其特征在于,包括:/n获取随机向量,所述随机向量为预设维度的向量;/n将所述随机向量输入到待训练的图像生成模型中进行处理,得到包括多个通道的特征图;/n对所述特征图的特征层进行分组,得到包含目标数目个特征层分组的目标特征图,其中,所述目标数目为所述特征图的通道数的约数;/n根据所述随机向量、所述特征图的通道数和所述目标数目设置预设归一化转化函数的可学习参数,得到目标归一化转化函数;/n根据所述目标归一化转化函数对所述特征图进行归一化处理,得到中间特征图;/n利用所述待训练的图像生成模型对所述中间特征图进行处理,得到预测图像;/n基于所述预测图像和样本图像,对所述...

【技术特征摘要】
1.一种图像生成模型的训练方法,其特征在于,包括:
获取随机向量,所述随机向量为预设维度的向量;
将所述随机向量输入到待训练的图像生成模型中进行处理,得到包括多个通道的特征图;
对所述特征图的特征层进行分组,得到包含目标数目个特征层分组的目标特征图,其中,所述目标数目为所述特征图的通道数的约数;
根据所述随机向量、所述特征图的通道数和所述目标数目设置预设归一化转化函数的可学习参数,得到目标归一化转化函数;
根据所述目标归一化转化函数对所述特征图进行归一化处理,得到中间特征图;
利用所述待训练的图像生成模型对所述中间特征图进行处理,得到预测图像;
基于所述预测图像和样本图像,对所述待训练的图像生成模型的参数进行调整,得到训练好的图像生成模型,所述样本图像为具有指定脸部特征的图像。


2.根据权利要求1所述的方法,其特征在于,所述图像生成模型为生成式对抗网络或变分自编码器。


3.根据权利要求1或2所述的方法,其特征在于,所述根据所述随机向量、所述特征图的通道数和所述目标数目设置预设归一化转化函数的可学习参数,得到目标归一化转化函数,包括:
根据所述随机向量,所述特征图的通道数和所述目标数目分别生成第一矩阵和第二矩阵,其中,所述第一矩阵的列数、所述第二矩阵的列数与所述随机向量的维度相同,根据所述特征图的通道数和所述目标数目分别生成第一向量和第二向量,所述第一矩阵的行数、所述第二矩阵的行数、所述第一向量的行数和所述第二向量的行数相同;
根据所述第一矩阵,所述随机向量和所述第一向量,所述第二矩阵和所述第二向量设置预设归一化转化函数的可学习参数,得到目标归一化转化函数。


4.根据权利要求3所述的方法,其特征在于,所述预设归一化转化函数为其中,x为目标特征图,E(x)为x的均值,Var(x)为x的方差,y(x)为所述中间特征图,γ与β为可学习参数。


5.根据权利要求4所述的方法,其特征在于,所述目标归一化转化函数为:



其中,Z表示所述随机向量,Aγ表示所述第一矩阵,Bγ表示所述第一向量,Aβ表示所述第二矩阵,Bβ表示所述第二向量,其中Z为m维列向量,Aγ和Aβ均为g×m个数组成的g行m列的矩阵,Bγ和Bβ均为g维列向...

【专利技术属性】
技术研发人员:黄星
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1