一种基于汉字字形扰动的字体风格迁移方法技术

技术编号:36570137 阅读:19 留言:0更新日期:2023-02-04 17:27
本发明专利技术公开了一种基于汉字字形扰动的字体风格迁移方法,本发明专利技术设计风格迁移网络,使用注意力增强卷积替换普通卷积,弥补普通卷积在图像处理时只关注局部信息的不足,先编码提取汉字骨架特征,再解码生成目标字体风格的汉字变体。同时设计风格提取网络辅助风格迁移网络,将多次卷积输出的特征进行拼接送入风格迁移网络,提高网络学习汉字特征的能力。最后,将生成的和真实的汉字图像送入判别器完成真伪二分类。与现有方法相比,本发明专利技术能够捕捉到汉字的结构和风格特征,在汉字字形扰动的前提下,生成的汉字笔画清晰、结构完整、笔画风格明显,具有较高的可识别性和真实性。具有较高的可识别性和真实性。具有较高的可识别性和真实性。

【技术实现步骤摘要】
一种基于汉字字形扰动的字体风格迁移方法


[0001]本专利技术属于信息安全
,具体涉及一种基于汉字字形扰动的字体风格迁移方法。

技术介绍

[0002]字形扰动通过调整字符的结构和笔画,使肉眼无法察觉,达到传递秘密信息的目的。对于英文字符来说,受笔画数量和结构的限制,字形扰动对其可利用的冗余较少。相对而言,中文汉字在数据量和多样性方面有其优势。对于汉字来说,通过移动笔画进行字形扰动,产生多个被赋予特殊含义的汉字变体,以此来实现秘密信息的传递,应用于信息隐藏。
[0003]然而,汉字的数据集规模和字体风格限制了字形扰动和汉字变体的生成。一般来说,汉字由一个或多个笔画或偏旁部首组成,传统的汉字生成工作依赖于人工设计的偏旁部首,经过变形、组合处理产生完整的汉字,汉字生成是一项耗时耗力的工作。因此,如何有效地处理和设计新的汉字字体风格,成为汉字生成工作中急需解决的问题。基于深度学习的字体风格迁移方法引起了学者的关注,该方法在保持汉字语义内容不变的前提下,改变汉字的笔画风格,提高了汉字生成工作效率。目前,关于汉字字形扰动的字体风格迁移相关研究较少。

技术实现思路

[0004]本专利技术针对中文汉字数据集规模大、字体风格多样的特点为字形扰动增加难度的问题,提出一种基于汉字字形扰动的字体风格迁移方法,有效地提升了汉字的生成效率,使用构建的小型汉字字形扰动数据集即可实现汉字字形变体的字体风格迁移。
[0005]为了实现上述目的,本专利技术所采用以下技术方案:
[0006]一种基于汉字字形扰动的字体风格迁移方法,包括如下步骤:
[0007]步骤1,按照汉字部首检字表收集简体汉字,对于收集的简体汉字,选取笔画进行平移,产生的多个汉字变体以图像的形式存储,构建小型的汉字字形扰动数据集。
[0008]步骤2,使用风格迁移网络提取汉字字形扰动数据集的骨架特征,同时通过风格提取网络提取汉字字形扰动数据集中目标字体汉字变体的风格特征,辅助风格迁移网络生成目标字体汉字变体图像。
[0009]步骤3,使用判别器鉴别汉字字形扰动数据集中的目标字体汉字变体图像和风格迁移网络生成的目标字体汉字变体图像,经过对抗训练,得到能够正确区分图像真伪的二分类判别器。
[0010]步骤4,使用普通卷积替换风格迁移网络中的注意力增强卷积,验证注意力增强卷积在捕捉汉字图像特征上发挥的积极作用。改变风格提取网络得到的风格特征送入风格迁移网络的方式,使用直接送入风格迁移网络中间层的方式替换送入风格迁移网络转置卷积块,验证将风格提取网络得到的风格特征送入风格迁移网络转置卷积块的方式可以强化风格迁移网络的学习能力。
[0011]进一步地,所述步骤1包括:
[0012]步骤1.1,根据实际情况,按照汉字部首检字表收集一定数量(每个部首随机选择若干个)的简体汉字,在满足笔画移动功能的字体软件中,分别使用图像和字体文件的方式导入汉字骨架和目标字体汉字。
[0013]步骤1.2,使用满足笔画移动功能的字体软件,对于导入的简体汉字(包括汉字骨架和目标字体汉字),将其作为第一个汉字变体,并选取其中的两个笔画,根据汉字结构,随机选取以下任意一种操作方式进行字形扰动,共得到四个汉字变体。具体操作方式有:

向上或向下平移第一个笔画,产生第二个汉字变体;在此基础上,向上或向下平移另一个笔画,得到第三个汉字变体;最后,将第一个笔画向其移动方向的反方向移动进行归位,得到第四个汉字变体。

向上或向下平移第一个笔画,产生第二个汉字变体;在此基础上,向左或向右平移另一个笔画,得到第三个汉字变体;最后,将第一个笔画向其移动方向的反方向移动进行归位,得到第四个汉字变体。

向左或向右平移第一个笔画,产生第二个汉字变体;在此基础上,向左或向右平移另一个笔画,得到第三个汉字变体;最后,将第一个笔画向其移动方向的反方向移动进行归位,得到第四个汉字变体。

向左或向右平移第一个笔画,产生第二个汉字变体;在此基础上,向上或向下平移另一个笔画,得到第三个汉字变体;最后,将第一个笔画向其移动方向的反方向移动进行归位,得到第四个汉字变体。
[0014]步骤1.3,将步骤1.2得到的汉字变体按照生成顺序进行编码,列出汉字变体编码清单。同时按照不同的字体风格,以字体文件的形式存储,得到汉字骨架的字体文件和目标字体汉字的字体文件。
[0015]步骤1.4,根据汉字变体编码清单,分别读取汉字骨架的字体文件和目标字体汉字的字体文件,以图像的形式存储,归一化图像分辨率和字体大小,按生成顺序进行编号命名,得到的汉字骨架变体图像和目标字体汉字变体图像共同构成汉字字形扰动数据集。
[0016]进一步地,所述步骤2包括:
[0017]步骤2.1,将步骤1.4构建的汉字字形扰动数据集中的汉字骨架变体图像作为风格迁移网络的输入,同时汉字字形扰动数据集中的目标字体汉字变体图像作为风格提取网络的输入。
[0018]步骤2.2,风格迁移网络对输入的汉字骨架变体图像进行编码和解码操作,编码得到汉字的骨架特征,根据汉字骨架特征和风格提取网络提取的风格特征,解码生成目标字体汉字变体图像。
[0019]步骤2.3,风格提取网络对输入的目标字体汉字变体图像进行编码操作,逐行读取每次卷积输出的风格特征,取最大值以代表对应的风格特征,汇总送入风格迁移网络。
[0020]进一步地,所述步骤3包括:
[0021]步骤3.1,将步骤2.2风格迁移网络生成的目标字体汉字变体图像和汉字字形扰动数据集中对应的目标字体汉字变体图像分别与汉字字形扰动数据集中对应的汉字骨架变体图像进行配对,得到两组真假汉字。
[0022]步骤3.2,判别器对真假汉字集中的每组汉字进行真伪鉴别,依据编码操作得到的汉字特征进行真伪二分类。经过对抗训练,判别器能正确区分风格迁移网络生成的目标字体汉字变体图像和汉字字形扰动数据集中对应的目标字体汉字变体图像。
[0023]进一步地,所述步骤4包括:
[0024]步骤4.1,使用普通卷积替换风格迁移网络中的注意力增强卷积,再次执行步骤2和步骤3,根据风格迁移网络生成的目标字体汉字变体图像质量,验证注意力增强卷积在捕捉汉字图像特征上发挥的积极作用。
[0025]步骤4.2,在使用注意力增强卷积的前提下,改变风格提取网络得到的风格特征送入风格迁移网络的方式,使用直接送入风格迁移网络中间层的方式替换送入风格迁移网络转置卷积块,再次执行步骤2和步骤3,根据风格迁移网络生成的目标字体汉字变体图像质量,验证将风格提取网络提取的风格特征送入风格迁移网络转置卷积块的方式可以强化风格迁移网络的学习能力。
[0026]步骤4.3,在使用普通卷积的前提下,改变风格提取网络得到的风格特征送入风格迁移网络的方式,使用直接送入风格迁移网络中间层的方式替换送入风格迁移网络转置卷积块,再次执行步骤2和步骤3,根据风格迁移网络生成的目标字体汉字变体图像质量,验证将风格本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于汉字字形扰动的字体风格迁移方法,其特征在于,包括如下步骤:步骤1,按照汉字部首检字表收集简体汉字,对于收集的简体汉字,选取笔画进行平移,产生的多个汉字变体以图像的形式存储,构建小型的汉字字形扰动数据集;步骤2,使用风格迁移网络提取汉字字形扰动数据集的骨架特征,同时通过风格提取网络提取汉字字形扰动数据集中目标字体汉字变体的风格特征,辅助风格迁移网络生成目标字体汉字变体图像;步骤3,使用判别器鉴别汉字字形扰动数据集中的目标字体汉字变体图像和风格迁移网络生成的目标字体汉字变体图像,经过对抗训练,得到能够正确区分图像真伪的二分类判别器;步骤4,使用普通卷积替换风格迁移网络中的注意力增强卷积,验证注意力增强卷积在捕捉汉字图像特征上发挥的积极作用;改变风格提取网络得到的风格特征送入风格迁移网络的方式,使用直接送入风格迁移网络中间层的方式替换送入风格迁移网络转置卷积块,验证将风格提取网络得到的风格特征送入风格迁移网络转置卷积块的方式可以强化风格迁移网络的学习能力。2.根据权利要求1所述的一种基于汉字字形扰动的字体风格迁移方法,其特征在于,所述步骤1具体步骤包括:步骤1.1,根据实际情况,按照汉字部首检字表收集一定数量的简体汉字,在满足笔画移动功能的字体软件中,分别使用图像和字体文件的方式导入汉字骨架和目标字体汉字;步骤1.2,使用满足笔画移动功能的字体软件,对于导入的简体汉字,将其作为第一个汉字变体,并选取其中的两个笔画,根据汉字结构,随机选取任意操作方式进行字形扰动,共得到四个汉字变体;步骤1.3,将步骤1.2得到的汉字变体按照生成顺序进行编码,列出汉字变体编码清单;同时按照不同的字体风格,以字体文件的形式存储,得到汉字骨架的字体文件和目标字体汉字的字体文件;步骤1.4,根据汉字变体编码清单,分别读取汉字骨架的字体文件和目标字体汉字的字体文件,以图像的形式存储,归一化图像分辨率和字体大小,按生成顺序进行编号命名,得到的汉字骨架变体图像和目标字体汉字变体图像共同构成汉字字形扰动数据集。3.根据权利要求2所述的一种基于汉字字形扰动的字体风格迁移方法,其特征在于,所述步骤2具体步骤包括:步骤2.1,将步骤1.4构建的汉字字形扰动数据集中的汉字骨架变体图像作为风格迁移网络的输入,同时汉字字形扰动数据集中的目标字体汉字变体图像作为风格提取网络的输入;步骤2.2,风格迁移网络对输入的汉字骨架变体图像进行编码和解码操作,编码得到汉字的骨架特征,根据汉字骨架特征和风格提取网络提取的风格特征,解码生成目标字体汉字变体图像;步骤2.3,风格提取网络对输入的目标字体汉字变体图像进行编码操作,逐行读取每次卷积输出的风格特征,取最大值以代表对应的风格特征,汇总送入风格迁移网络。4.根据权利要求3所述的一种基于汉字字形扰动的字体风格迁移方法,其特征在于,所述步骤3具体步骤包括:
步骤3.1,...

【专利技术属性】
技术研发人员:姚晔高旭东王晨张祯王秋华任一支陈临强吴国华
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1