一种模型训练及字库建立方法、装置、设备和存储介质制造方法及图纸

技术编号:31376501 阅读:22 留言:0更新日期:2021-12-15 11:13
本公开提供了一种模型训练及字库建立方法、装置、设备和存储介质,涉及人工智能技术领域,具体涉及计算机视觉和深度学习技术领域,可应用于OCR光学字符识别等场景。具体的进行模型训练的实现方案为:将源域样本字和源域样本字的目标域关联字输入到字体生成模型的字体生成网络,得到目标域生成字;将目标域样本字和目标域关联字中的至少一项,以及目标域生成字输入到字体生成模型的损失分析网络,得到第一损失,并根据第一损失调整字体生成模型的参数;将源域样本字和随机向量输入到字体生成网络,得到随机域生成字;将随机域生成字和随机域样本字输入到损失分析网络,得到第二损失,并根据第二损失再次调整字体生成模型的参数。提高模型的准确性。提高模型的准确性。提高模型的准确性。

【技术实现步骤摘要】
一种模型训练及字库建立方法、装置、设备和存储介质


[0001]本公开涉及人工智能
,具体涉及计算机视觉和深度学习
,可应用于OCR光学字符识别等场景。

技术介绍

[0002]随着互联网的发展,以及人们个性化需求的增加,自定义风格字体的生成逐渐兴起。
[0003]字体生成的过程实质是图像风格迁移的过程,即将一张图像在保持内容不变的情况下,转换成另一种风格,例如,将标准楷体风格的“你”字转换成用户手写体风格的“你”。

技术实现思路

[0004]本公开提供了一种模型训练及字库建立方法、装置、设备和存储介质。
[0005]根据本公开的一方面,提供了一种字体生成模型的训练方法,包括:
[0006]将源域样本字和源域样本字的目标域关联字输入到字体生成模型的字体生成网络,得到目标域生成字;
[0007]将目标域样本字和目标域关联字中的至少一项,以及目标域生成字输入到字体生成模型的损失分析网络,得到第一损失,并根据第一损失调整字体生成模型的参数;
[0008]将源域样本字和随机向量输入到字体生本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种字体生成模型的训练方法,包括:将源域样本字和所述源域样本字的目标域关联字输入到字体生成模型的字体生成网络,得到目标域生成字;将目标域样本字和所述目标域关联字中的至少一项,以及所述目标域生成字输入到所述字体生成模型的损失分析网络,得到第一损失,并根据所述第一损失调整所述字体生成模型的参数;将所述源域样本字和随机向量输入到所述字体生成网络,得到随机域生成字;将所述随机域生成字和随机域样本字输入到所述损失分析网络,得到第二损失,并根据所述第二损失再次调整所述字体生成模型的参数。2.根据权利要求1所述的方法,其中,所述字体生成网络包括:内容编码器网络、随机风格编码器网络、目标风格编码器网络和解码器网络。3.根据权利要求2所述的方法,其中,所述将所述源域样本字和随机向量输入到所述字体生成网络,得到随机域生成字,包括:将所述源域样本字输入到所述内容编码器网络,得到样本字内容特征;将所述随机向量输入到所述随机风格编码器网络,得到随机域风格特征;将所述随机域风格特征和所述样本字内容特征输入到所述解码器网络,得到随机域生成字。4.根据权利要求2所述的方法,其中,所述将源域样本字和所述源域样本字的目标域关联字输入到字体生成模型的字体生成网络,得到目标域生成字,包括:将源域样本字输入到所述内容编码器网络,得到样本字内容特征;将所述源域样本字的目标域关联字输入到所述目标风格编码器网络,得到目标域风格特征;将所述目标域风格特征和所述样本字内容特征输入到所述解码器网络,得到目标域生成字。5.根据权利要求1所述的方法,其中,所述损失分析网络包括:组件分类器网络、字符判别器网络、风格判别器网络和字符分类器网络中的至少一个;所述第一损失包括:组件分类损失、第一字符分类损失、风格分类损失和第一错字损失中的至少一个;所述第二损失包括:第二字符分类损失和/或第二错字损失。6.根据权利要求5所述的方法,其中,所述将目标域样本字和所述目标域关联字中的至少一项,以及所述目标域生成字输入到所述字体生成模型的损失分析网络,得到第一损失,并根据所述第一损失调整所述字体生成模型的参数,包括:将目标域样本字和所述目标域生成字输入到所述字符判别器网络,得到第一字符分类损失的第一字符损失值,并基于所述第一字符损失值,调整所述字符判别器网络的参数;将所述目标域生成字输入到调整后的字符判别器网络,得到第一字符分类损失的第二字符损失值,并基于所述第二字符损失值,调整所述字体生成网络的参数;将目标域样本字和基于调整后的字体生成网络更新的目标域生成字输入到调整后的字符判别器网络,更新所述第一字符损失值,并基于更新后的第一字符损失值,再次调整字符判别器网络的参数。7.根据权利要求6所述的方法,其中,所述将目标域样本字和所述目标域生成字输入到
所述字符判别器网络,得到第一字符分类损失的第一字符损失值,包括:将目标域样本字和所述目标域生成字输入到所述字符判别器网络,得到目标域生成字的字符分类头位置和目标域样本字的字符分类头位置;根据目标域生成字的字符分类头位置和目标域样本字的字符分类头位置,确定第一字符分类损失的第一字符损失值。8.根据权利要求6所述的方法,其中,所述将所述目标域生成字输入到调整后的字符判别器网络,得到第一字符分类损失的第二字符损失值,包括:将所述目标域生成字输入到调整后的字符判别器网络,更新目标域生成字的字符分类头位置;根据更新后的字符分类头位置,确定第一字符分类损失的第二字符损失值。9.根据权利要求5所述的方法,其中,所述将目标域样本字和所述目标域关联字中的至少一项,以及所述目标域生成字输入到所述字体生成模型的损失分析网络,得到第一损失,并根据所述第一损失调整所述字体生成模型的参数,包括:将目标域样本字和所述目标域生成字输入到所述风格判别器网络,得到风格分类损失的第一风格损失值,并基于所述第一风格损失值,调整所述风格判别器网络的参数;将所述目标域生成字输入到调整后的风格判别器网络,得到风格分类损失的第二风格损失值,并基于所述第二风格损失值,调整所述字体生成网络的参数;将目标域样本字和基于调整后的字体生成网络更新的目标域生成字输入到调整后的风格判别器网络,更新所述第一风格损失值,并基于更新后的第一风格损失值,再次调整风格判别器网络的参数。10.根据权利要求9所述的方法,其中,所述将目标域样本字和所述目标域生成字输入到所述风格判别器网络,得到风格分类损失的第一风格损失值,包括:将目标域样本字和所述目标域生成字输入到所述风格判别器网络,得到目标域生成字的风格分类头位置和目标域样本字的风格分类头位置;根据目标域生成字的风格分类头位置和目标域样...

【专利技术属性】
技术研发人员:刘家铭唐礼承
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1