一种基于多任务生成对抗网络的字体风格迁移方法和系统技术方案

技术编号：30141657 阅读：17 留言：0更新日期：2021-09-23 15:05

本发明专利技术提供了一种基于多任务生成对抗网络的字体风格迁移方法和系统，其原理在于：将跨领域的迁移条件附加为生成器的输入，同时输入多种字体样本，实现支持来自不同字体风格之间的转换，解决了一对一字体风格迁移的问题，从而实现多个字体风格之间的迁移；且在本发明专利技术中，在构建生成对抗网络模型时，在生成对抗网络的生成器中加入了特征注意力模块，提高对抗网络中生成器特征学习能力，通过提高对字体图片局部细节特征的捕捉能力，从而提高图像生成质量。质量。质量。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多任务生成对抗网络的字体风格迁移方法和系统

[0001]本专利技术属于计算机视觉和图像处理领域，特别涉及一种基于多任务和特征注意力机制的生成对抗网络的字体风格迁移方法和系统。

技术介绍

[0002]字体风格的设计是一项极其困难的工作，现在仍然被认为是专业设计师的特权，现有的软件系统不具备专业设计师的创造力。然而，大多数商业字体产品实际上都是按照对某些字形属性的特定要求手工设计的，如斜体、衬线、草书、宽度、角度等。
[0003]而中文字体风格设计尤为困难。据统计，中文汉字里，1000个常用汉字能覆盖约92％的书面资料，2000个汉字可覆盖98％以上，3000字时已到99％，因此，至少需要完成约2800左右的单个中文字的设计，才能满足实际使用的需求。中文字体设计艺术家对中文字体已经设计了如楷体，宋体，方正仿宋，黑体等多种字体。但由于中文字符的类别繁多、偏旁构造复杂，长短不一。设计时每个字由许多部首和笔画组成，先通过几何建模，之后人为操作来完成，所以设计过程需耗费大量的人力资源。
[0004]字体风格迁移属于图像风格迁移的一个具体应用背景，在一些字体设计开发的应用中有较大的研究意义和商业价值。目前现有的技术路线方案主要分为两条：
[0005]1、采用基于CNN深度学习网络，思路是采取图像分类方向下的基准网络用于提取字体特征，使用均方误差或绝对误差损失用于优化网络，其缺点仅仅完成单一字体的迁移功能，即仅支持单一风格的风格变换，如宋体转楷体，迁移后的字体的边缘细节比较模糊，优点是技术简单方便，效...

【技术保护点】

【技术特征摘要】
1.一种基于多任务生成对抗网络的字体风格迁移方法，其特征在于，包括下面步骤：获取包含多种字体的样本集，并对每种字体风格迁移条件进行标注；构建生成对抗网络模型；将所述样本集和所述字体风格迁移条件输入所述生成对抗网络模型，对所述生成对抗网络模型进行训练，并根据训练结果对所述生成对抗网络模型进行参数优化直至网络收敛稳定；获取所述生成对抗网络模型训练后得到的生成器。2.根据权利要求1所述的基于多任务生成对抗网络的字体风格迁移方法，其特征在于，所述的构建生成对抗网络模型包括步骤：构建生成对抗网络的生成器，在所述生成器中加入特征注意力模块，所述特征注意力模块用于将卷积特征图转换为注意力特征图。3.根据权利要求2所述的基于多任务生成对抗网络的字体风格迁移方法，其特征在于，所述的将卷积特征图转换为注意力特征图的步骤为：将卷积特征图X输入所述特征注意力模块；卷积特征图X∈R
C
×
H
×
W
经1
×
1卷积得到F、G、M三个特征空间；F、G、M对应的通道数量分别为C/8、C/8和C，C代表卷积特征图的通道数；H代表卷积特征图的宽度，W代表卷积特征图的高度；将特征空间F转置后与特征空间G进行矩阵乘法操作，得到特征注意力层；采用Softmax得到所述特征注意力层的参数：其中，P
j,i
表示第i个位置的特征对第j个位置的特征的影响权重值，i和j的范围为1～H
×
W；F
i
表示:F特征空间第i个像素位置上所有通道的值的行向量，G
j
表示：G特征空间第j个像素位置上所有通道的值的列向量；两个位置的特征相似性同它们之间的相关性成正相关；将所述特征注意力层转置后与特征空间M进行矩阵乘法操作，得到所述特征注意力模块输出的注意力特征图P：P＝(P1,P2,
…
,P
(HxW)
)，P∈R
C
×
H
×
W
；其中，M
i
...

【专利技术属性】
技术研发人员：田辉，刘其开，
申请(专利权)人：合肥高维数据技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人