模型训练的方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:31490900 阅读:42 留言:0更新日期:2021-12-18 12:27
本申请实施例公开了一种模型训练的方法、装置、计算机设备及存储介质。可以利用同一文字形态且不同风格的至少两个文字作为样本文字,并且利用文字风格与一个指定文字的文字风格相同的文字作为样本文字,基于样本文字对具有形态编码器和风格编码器的待训练的生成网络进行训练,使得训练完成的生成网络可以通过一个或极少量的目标文字,将其他与目标文字的文字风格不同的源文字,准确地转换为与目标文字的文字风格相同的文字。字的文字风格相同的文字。字的文字风格相同的文字。

【技术实现步骤摘要】
模型训练的方法、装置、计算机设备及存储介质


[0001]本申请涉及计算机
,具体涉及一种模型训练的方法、装置、计算机设备及存储介质。

技术介绍

[0002]汉字是古老而珍贵的文化遗产,自古以来,无数优秀的书法家留下了宝贵的书法作品,成为人类文明的辉煌成就。在悠久的历史中,许多珍贵的书法作品丢失了,不同的书法家都有自己的书写风格和笔触细节,对于书法初学者来说,模仿大师的杰作将会对于书法学习非常有帮助。因此可以利用神经网格的技术,对文字的风格转换进行建模,然而,现有的模型根据一个或极少量的参考文字,准确地生成多个与该参考文字风格一致但是形态不同的文字十分困难。

技术实现思路

[0003]本申请实施例提供一种文字生成方法、装置、计算机设备及存储介质,可以利用指定文字和随机文字组成的样本文字对生成网络进行训练,使得训练完成的生成网络可以通过一个或极少量的目标文字,将其他与目标文字的文字风格不同的源文字,准确地转换为与目标文字的文字风格相同的文字。
[0004]本申请实施例提供一种模型训练的方法,包括:<br/>[0005]本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种模型训练的方法,其特征在于,包括:获取待训练的生成网络的样本文字,所述样本文字包括至少两个指定文字和至少一个随机文字,所述至少两个指定文字为同一文字形态的不同风格的字体,所述随机文字的文字风格与一个所述指定文字的文字风格相同;基于所述待训练的生成网络的形态编码器,分别提取所述指定文字的文字形态,生成形态特征向量;基于所述待训练的生成网络的风格编码器,分别提取所述指定文字和所述随机文字的文字风格,生成风格特征向量;通过所述待训练的生成网络的解码器,基于所述形态特征向量和所述风格特征向量,生成至少一个预测文字;基于所述预测文字、所述指定文字和所述随机文字,调整所述待训练的生成网络的参数,得到所述训练完成的生成网络。2.根据权利要求1所述的方法,其特征在于,所述获取待训练的生成网络的样本文字,包括:从预设的第一数据集中获取第一文字和第三文字,所述预设的第一数据集中包含具有第一风格的多个文字;从预设的第二数据集中获取第二文字和第四文字,所述预设的第二数据集中包含具有多种风格的多个文字,其中,所述第二文字和所述第四文字具有第二风格,且所述第二文字与所述第一文字具有相同的文字形态;将所述第一文字和所述第二文字确定为所述指定文字,将所述第三文字和所述第四文字确定为所述随机文字,基于所述指定文字和所述随机文字获取所述待训练的生成网络的样本文字。3.根据权利要求2所述的方法,其特征在于,所述通过所述待训练的生成网络的解码器,基于所述形态特征向量和所述风格特征向量,生成至少一个预测文字,包括:通过所述待训练的生成网络的解码器,基于所述第一文字的形态特征向量和风格特征向量,或者基于所述第一文字的风格特征向量和所述第二文字的形态特征向量,或者基于所述第二文字的形态特征向量和所述第三文字的风格特征向量,或者基于所述第一文字的形态特征向量和所述第三文字的风格特征向量,生成所述第一文字对应的第一预测文字;通过所述待训练的生成网络的解码器,基于所述第二文字的形态特征向量和风格特征向量,或者基于所述第一文字的形态特征向量和所述第二文字的风格特征向量,或者基于所述第二文字的形态特征向量和所述第四文字的风格特征向量,或者基于所述第一文字的形态特征向量和所述第四文字的风格特征向量,生成所述第二文字对应的第二预测文字;将所述第一预测文字和/或所述第二预测文字作为所述预测文字。4.根据权利要求1所述的方法,其特征在于,所述基于所述预测文字、所述指定文字和所述随机文字,调整所述待训练的生成网络的参数,得到所述训练完成的生成网络,包括:基于所述预测文字、所述指定文字和所述随机文字生成对抗损失和/或对齐损失;和/或基于所述形态特征向量和所述风格特征向量,生成一致损失;基于所述对抗损失、和/或所述对齐损失,和/或所述一致损失,调整所述待训练的生成
网络的参数,得到所述训练完成的生成网络。5.根据权利要求2所述的方法,其特征在于,所述文字形态包括形态组成结构,所述从预设的第一数据集中获取第三文字,包括:确定所述第一文字的形态组成结构,作为第一形态组成结构,在所述第一数据集中除所述第一文字外的其他文字中确定...

【专利技术属性】
技术研发人员:温琦袁燚范长杰胡志鹏
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1