一种汉字字体生成方法,包括构建目标字体数据集、构建源字体数据集、构建训练数据集、构建字体风格迁移网络模型、训练字体风格迁移网络模型、汉字字体自动生成,本发明专利技术的字体风格迁移网络模型中的骨架提取模块,利用字体骨架信息指导汉字字体的生成,使生成的汉字字形更加完整,本发明专利技术极大程度上优化因注意力机制叠加带来的参数爆炸以及训练难度增大等问题,改善了已有方法生成的字体笔画粘连、细节丢失,甚至缺少笔画等问题,同时减少了训练网络的时间,提高了汉字字体的生成的质量;本发明专利技术输入字体风格迁移网络模型的也可以是手写字体等其他字体,为汉字书法的生成和多元化发展提供便捷。便捷。便捷。
【技术实现步骤摘要】
一种汉字字体生成方法
[0001]本专利技术属于计算机处理
,具体涉及到一种汉字字体生成方法。
技术介绍
[0002]书法艺术是一种承载在汉字上,表现在笔力、体势和章法上的艺术。中国书法艺术是一种拥有三千多年历史的艺术,在世界艺术史上具有重要的地位,集中体现了中国人的思维方式和审美情趣。历代书法作品是中华民族文化中最具代表性的标志之一,不仅在内容上记录了历史文化、历史事件、历史环境,在书写形式上,也具有鲜明的历史特色和个人特色,例如苏轼的《赤壁赋》、欧阳询的《仲尼梦奠帖》、王羲之的《兰亭集序》。如今传统书法学习的目的不仅仅是个人学习的需要,更是对中国传统文化的一种传承和发扬。由于传统书法作品多存在于石头、绢丝、竹简或纸张上,经受长期历史沧桑,存在受潮霉变、污渍严重、老化破损、长期风化等问题,导致书法作品难以保存、流传和发展。传统的书法家字体创作方法主要是通过现代书法家手工绘制字模,然后经过数字化处理存贮在电脑中,但是手工创作一整套字体需要大量的时间和人力。
[0003]随着科学技术的发展,书法艺术的数字化发展迎来了新的机会。目前,典型的汉字字体生成方法可以分为两类:基于笔划提取的方法和基于图像到图像的转换方法。前者将汉字字体生成分为笔划提取和笔划重组两个阶段。然而,由于笔划结构的复杂性和笔迹风格的多样性,使得笔划提取算法产生不合理的笔划提取结果或错误的笔划结构。后者将汉字字体生成视为一个图像到图像的转换问题,利用卷积神经网络,如生成对抗网络(generative adversarial networks,GAN)和图网络,来实现更逼真、更高质量的汉字合成。然而,由于中文字体生成不是一个容错任务,因此它是一个不受控制和不可预测的过程,任何模糊或重影、伪影都可能导致生成字体的失败和导致合成字体结果质量变差。
[0004]目前,大多数商业字体的生成都集中在专业的字体设计上,这是一项费时费力的工作。由于以下三方面的原因,对普通人来说,具有书法家笔迹字体的生成仍然是一项具有挑战性的任务:1)汉字的结构和字体风格复杂,不同的人有不同的笔迹风格和笔划形状。2)汉字的词汇量非常大,人们很难用如此庞大的词汇量正确书写出风格一致的汉字。3)电子设备上的手写字体是手工操作,主要由专业字体设计师设计。其性能很大程度上依赖于对每个字形的精细调整,复杂而灵活的汉字结构对于普通客户来说不可能完美的提取笔画或字形,因此,快速构建适合普通人的个性化汉字手写字体是不可行的。
技术实现思路
[0005]本专利技术所要解决的技术问题在于克服现有字体生成技术的缺陷,提供一种分辨率高、效果良好,笔画清晰、字体真实的汉字字体生成方法。
[0006]解决上述技术问题所采用的技术方案是一种汉字字体生成方法,由下述步骤组成:
[0007]S1.构建目标字体数据集
[0008]基于待生成的目标字体,从互联网获取目标字体的书法作品图片,将每张书法作品图片按字分割成多张单字图片,单字图片的尺寸统一为p
×
p、格式为.png,对单字图片进行灰度处理,得到目标字体数据集;
[0009]S2.构建源字体数据集
[0010]选择一种字体作为源字体,将该字体的ttf字体文件通过解包得到源字体图片,将源字体图片的尺寸、格式处理的和步骤S2中单字图片的一致,得到源字体数据集;
[0011]S3.构建训练数据集
[0012]对步骤S2得到的目标字体数据集通过旋转、添加噪点的方式进行数据增强和扩充,得到用于训练模型的训练数据集;
[0013]S4.构建字体风格迁移网络模型
[0014]字体风格迁移网络模型由生成器和判别器构成,所述生成器用于对输入的源字体图片的字体骨架信息和特征信息的提取并生成字体图片,所述判别器用于判别所生成字体图片的字体真实度;
[0015]所述生成器由骨架提取模块、编码器、解码器、注意力模块构成,所述骨架提取模块的输出端接解码器,用于提取输入的源字体图片的字体骨架信息,所述编码器通过注意力模块与解码器相连,所述编码器用于提取输入的源字体图片的字体特征信息和类别信息,所述解码器用于将字体骨架信息、字体特征信息和类别信息融合解码生成字体图片;
[0016]所述注意力模块由多个W
‑
attention模块和SW
‑
attention模块交替连接组成,所述W
‑
attention模块用于对特征图进行窗口划分,在不同窗口内进行局部注意力运算,降低参数量,所述SW
‑
attention模块用于窗口间进行信息交换;
[0017]S5.训练字体风格迁移网络模型
[0018]将源字体数据集和训练数据集进行按字配对,使用源字体数据集和训练数据集中成对的字体图片对字体风格迁移网络模型进行训练,将源字体数据集中的源字体图片输入到生成器中得到假的目标字体图片,同时将假的目标字体图片和训练数据集图片输入到判别器中,通过判别器损失函数反向传递更新网络模型参数,循环训练,直到达到设定的迭代次数上限或损失小于等于预先设定的最小值,即完成字体风格迁移网络模型的训练;
[0019]S6.汉字字体自动生成
[0020]将任意字体图片输入到字体风格迁移网络模型中即可得到该字体风格的汉字字体。
[0021]作为一种优选的技术方案,所述步骤S4中骨架提取模块是基于侧输出残差网络SRN,提取编码器每一层的侧输出,采用非直接组合式的残差学习方式,通过跨层短连接方式逐步向上融合编码器每一层的特征图,使底层没能学习到的特征由浅层进行补充提高有限深度的网络的学习能力。
[0022]作为一种优选的技术方案,所述步骤S4中的编码器由4~10个依次通过残差连接的下采样模块构成,所述下采样模块由4
×
4卷积块C4、4
×
4膨胀卷积DC、1
×
1卷积块C1组成,膨胀率r为2,4
×
4卷积块C4的输出连接4
×
4膨胀卷积DC的输入,4
×
4卷积块C4的输出与4
×
4膨胀卷积DC的输出融合后连接1
×
1卷积块C1的输入,卷积块C1的输出通过注意力模块与解码器的输入连接。
[0023]作为一种优选的技术方案,所述步骤S4中解码器由4~10个依次相连的上采样模
块构成,所述上采样模块由反卷积块构成。
[0024]作为一种优选的技术方案,所述步骤S5中判别器损失函数L为,
[0025][0026]式中,L
cGAN
(G,D)为对抗损失函数,L
L1
为L1损失函数,L
r
为重构损失函数,G为生成器,D为判别器,λ1为L1损失函数的权重系数,λ2为重构损失函数的权重系数;
[0027]所述对抗损失函数L
cGAN
(G,D)用于同时提升判别器判断能力和生成器生成字体的真实度,公式本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种汉字字体生成方法,其特征在于由下述步骤组成:S1.构建目标字体数据集基于待生成的目标字体,从互联网获取目标字体的书法作品图片,将每张书法作品图片按字分割成多张单字图片,单字图片的尺寸统一为p
×
p、格式为.png,对单字图片进行灰度处理,得到目标字体数据集;S2.构建源字体数据集选择一种字体作为源字体,将该字体的ttf字体文件通过解包得到源字体图片,将源字体图片的尺寸、格式处理的和步骤S2中单字图片的一致,得到源字体数据集;S3.构建训练数据集对步骤S2得到的目标字体数据集通过旋转、添加噪点的方式进行数据增强和扩充,得到用于训练模型的训练数据集;S4.构建字体风格迁移网络模型字体风格迁移网络模型由生成器和判别器构成,所述生成器用于对输入的源字体图片的字体骨架信息和特征信息的提取并生成字体图片,所述判别器用于判别所生成字体图片的字体真实度;所述生成器由骨架提取模块、编码器、解码器、注意力模块构成,所述骨架提取模块的输出端接解码器,用于提取输入的源字体图片的字体骨架信息,所述编码器通过注意力模块与解码器相连,所述编码器用于提取输入的源字体图片的字体特征信息和类别信息,所述解码器用于将字体骨架信息、字体特征信息和类别信息融合解码生成字体图片;所述注意力模块由多个W
‑
attention模块和SW
‑
attention模块交替连接组成,所述W
‑
attention模块用于对特征图进行窗口划分,在不同窗口内进行局部注意力运算,降低参数量,所述SW
‑
attention模块用于窗口间进行信息交换;S5.训练字体风格迁移网络模型将源字体数据集和训练数据集进行按字配对,使用源字体数据集和训练数据集中成对的字体图片对字体风格迁移网络模型进行训练,将源字体数据集中的源字体图片输入到生成器中得到假的目标字体图片,同时将假的目标字体图片和训练数据集图片输入到判别器中,通过判别器损失函数反向传递更新网络模型参数,循环训练,直到达到设定的迭代次数上限或损失小于等于预先设定的最小值,即完成字体风格迁移网络模型的训练;S6.汉字字体自动生成将任意字体图片输入到字体风格迁移网络模型中即可得到该字体风格的汉字字体。2.根据权利要求1所述汉字字体生成方法,其特征在于,所述步骤S4中骨架提取模块是基于侧输出残差网络SRN,提取编码器每一层的侧输出,采用非直接组合式的残差学习方式,通过跨层短连接方式逐步向上融合编码器每一层的特征图,使底层没能学习到的特征由浅层进行补充提高有限深度的网络的学习能力。3.根据权利要求1所述汉字字体生成方法,其特征在于,所述步骤S4中的编码器由4~10个依次通...
【专利技术属性】
技术研发人员:张世龙,吴晓军,
申请(专利权)人:陕西师范大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。