手写汉字数据生成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:39432667 阅读:8 留言:0更新日期:2023-11-19 16:16
本发明专利技术提供的手写汉字数据生成方法、装置、计算机设备及存储介质,所述方法包括:根据不同风格的手写字体文件,生成不同风格的目标字体图像;对所述目标字体图像进行字体骨架提取,生成骨架结构图像;对所述风格融合模型进行训练,得到目标风格融合模型;将包括字体骨架结构的汉字图像输入所述目标风格融合模型,得到输入字符骨架风格与当前模型对应字体字形风格的风格融合字符图。本发明专利技术通过训练得到的风格融合模型对数据集的中文字符骨架结构和字体字形信息进行风格融合,以解决现有手写数据集样本较少、样本风格不能充分体现真实场景下不同书写习惯以及不同数据集的样本格式不统一问题。不统一问题。不统一问题。

【技术实现步骤摘要】
手写汉字数据生成方法、装置、计算机设备及存储介质


[0001]本专利技术涉及数据生成
,具体涉及一种手写汉字数据生成方法、装置、计算机设备及存储介质。

技术介绍

[0002]在人工智能领域中,中文字符识别始终是研究的热点与难点。其研究过程涉及较多的学科领域,如人工智能技术、图像处理、模式识别技术、数字信号处理、统计数、模糊数学、决策论等等。中文字符识别的研究不仅能够在一定程度上促进各相关学科的快速发展,而且相关学科的发展同时也可以为中文字符识别过程提供相关的研究工具,所以对于中文字符识别技术的研究来说,其具有非常重要的研究价值。
[0003]中文字符识别根据识别的对象不同可以分为印刷体识别与手写体识别两大类。与手写体汉字识别相比,印刷体汉字识别因其字体结构和风格较为统一,同时印刷体汉字的识别对汉字背景、格式都有着非常严格的要求,其识别的过程较为简单,也是这一特性使得印刷体汉字的识别技术能够达到成熟产品化的需求。手写体汉字的识别则是完全根据图像的数据信息进行处理的,其书写后的汉字可采用的有效特征与信息都比较少,由于现有的手写汉字数据库仍然无法有效覆盖各种真实环境中的书写情况,从而导致手写汉字识别的泛化能力与抗干扰能力较差。同时,现有的手写汉字数据库制作方法大多依赖于人工经验和设计,自动化程度很低,需要花费大量的人力成本和时间周期;可见,现有技术中存在手写汉字数据样本少的问题。

技术实现思路

[0004]针对现有技术中所存在的不足,本专利技术提供的手写汉字数据生成方法、装置、计算机设备及存储介质,其解决了现有技术中存在手写汉字数据样本少的问题,通过训练得到的风格融合模型对数据集的中文字符骨架结构和字体字形信息进行风格融合,以解决现有手写数据集样本较少、样本风格不能充分体现真实场景下不同书写习惯以及不同数据集的样本格式不统一问题,同时大幅减少了不同风格字体在人工书写和采集过程中的时间和人力。
[0005]第一方面,本专利技术提供一种手写汉字数据生成方法,所述方法包括:根据不同风格的手写字体文件,生成不同风格的目标字体图像;对所述目标字体图像进行字体骨架提取,生成骨架结构图像;构建字体风格融合模型,将所述骨架结构图像作为所述字体风格融合模型的输入,将所述目标字体图像作为所述字体风格融合模型的输出,对所述风格融合模型进行训练,得到目标风格融合模型;将包括字体骨架结构的汉字图像输入所述目标风格融合模型,得到输入字符骨架风格与当前模型对应字体字形风格的风格融合字符图。
[0006]可选地,对所述目标字体图像进行字体骨架提取,生成骨架结构图像,包括:提取所述目标字体图像的字形轮廓数据;对所述字形轮廓数据进行离散处理,得到由若干小线段组成的字符离散轮廓;对所述字符离散轮廓进行中心骨架线提取,得到所述骨架结构图
像。
[0007]可选地,对所述字符离散轮廓进行中心骨架线提取,包括:在所述字符离散轮廓中每个小线段上取中点,计算出中点的法线;基于每个中点的法线作内切圆,并根据所述字符离散轮廓上所有的离散点到圆心的距离,获取每个小线段对应的最小内切圆的目标圆心;将所有目标圆心依次连接得到对应字符的中心骨架线。
[0008]可选地,基于每个中点的法线作内切圆,并根据所述字符离散轮廓上所有的离散点到圆心的距离,获取每个小线段对应的最小内切圆的目标圆心,包括:根据当前中点的法线作内切圆,使内切圆的圆心在所述法线上且与当前中点对应的线段相切于所述中点;遍历字符轮廓上所有的离散点到圆心的距离,当距离小于圆半径时将该离散点存储在队列列表内;若遍历完所有离散点后队列列表为空,则增大圆半径继续计算所有离散点到新圆心的距离;若队列列表不为空,则减小圆半径继续计算队列列表内的离散点到所述新圆心的距离,直到找到离散点到新圆心的距离等于当前圆半径时,将当前圆作为当前线段的最小内切圆,当前圆心作为最小内切圆的目标圆心。
[0009]可选地,构建字体风格融合模型包括:将所述字体风格融合模型定义由编码器、瓶颈层、解码器和跳跃连接组成的基于Transformer的U型对称编码器

解码器结构,所述编码器、瓶颈层和解码器均是基于连续的两个Swin Transformer Block层构造;所述连续的两个Swin Transformer Block由级联的LN层、W

MSA模块、LN层、MLP层、LN层、SW

MSA模块、LN层和MLP层构成;所述编码器由输入层、Patch Partition、Linear Embeding层、3组各包含两个连续的Swin Transformer Block层和3个Patch Merging层连接组成。其中,每组Swin Transformer Block层和Patch Merging层交替相连;所述解码器由4个Patch Expanding层、3组各包含两个连续的Swin Transformer Block层、Linear Projection层、输出层连接组成,解码器的第一个Patch Expanding层与瓶颈层的第二个Swin Transformer Block层连接;所述字体风格融合模型使用二进制交叉熵损失函数作为损失函数,以度量模型生成的风格融合字体图像与目标字体图像的相似程度。
[0010]可选地,连续的两个Swin Transformer Block可表示为:
[0011][0012][0013][0014][0015]可选地,将所述骨架结构图像作为所述字体风格融合模型的输入,将所述目标字体图像作为所述字体风格融合模型的输出,对所述风格融合模型进行训练,得到目标风格融合模型,包括:将同一种字体的骨架结构图像和目标字体图像进行按字配对,并将骨架结构图像输入到模型中得到生成的风格融合字体图像;对生成的风格融合字体图像与目标字体图像通过损失函数计算损失并反向传递更新网络模型参数,循环训练,直到模型超过设定的迭代次数上限或损失小于等于预先设定的最小值,得到目标风格融合模型。
[0016]第二方面,本专利技术提供一种手写汉字数据生成装置,所述装置包括:目标字体图像生成模块,用于根据不同风格的手写字体文件,生成不同风格的目标字体图像;字体骨架提取模块,用于对所述目标字体图像进行字体骨架提取,生成骨架结构图像;融合模型训练模
块,用于构建字体风格融合模型,将所述骨架结构图像作为所述字体风格融合模型的输入,将所述目标字体图像作为所述字体风格融合模型的输出,对所述风格融合模型进行训练,得到目标风格融合模型;融合字符图像生成模块,用将包括字体骨架结构的汉字图像输入所述目标风格融合模型,得到输入字符骨架风格与当前模型对应字体字形风格的风格融合字符图。
[0017]第三方面,本专利技术提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:根据不同风格的手写字体文件,生成不同风格的目标字体图像;对所述目标字体图像进行字体骨架提取,生成骨架结构图像;构建字体风本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种手写汉字数据生成方法,其特征在于,所述方法包括:根据不同风格的手写字体文件,生成不同风格的目标字体图像;对所述目标字体图像进行字体骨架提取,生成骨架结构图像;构建字体风格融合模型,将所述骨架结构图像作为所述字体风格融合模型的输入,将所述目标字体图像作为所述字体风格融合模型的输出,对所述风格融合模型进行训练,得到目标风格融合模型;将包括字体骨架结构的汉字图像输入所述目标风格融合模型,得到输入字符骨架风格与当前模型对应字体字形风格的风格融合字符图。2.如权利要求1所述的手写汉字数据生成方法,其特征在于,对所述目标字体图像进行字体骨架提取,生成骨架结构图像,包括:提取所述目标字体图像的字形轮廓数据;对所述字形轮廓数据进行离散处理,得到由若干小线段组成的字符离散轮廓;对所述字符离散轮廓进行中心骨架线提取,得到所述骨架结构图像。3.如权利要求2所述的手写汉字数据生成方法,其特征在于,对所述字符离散轮廓进行中心骨架线提取,包括:在所述字符离散轮廓中每个小线段上取中点,计算出中点的法线;基于每个中点的法线作内切圆,并根据所述字符离散轮廓上所有的离散点到圆心的距离,获取每个小线段对应的最小内切圆的目标圆心;将所有目标圆心依次连接得到对应字符的中心骨架线。4.如权利要求3所述的手写汉字数据生成方法,其特征在于,基于每个中点的法线作内切圆,并根据所述字符离散轮廓上所有的离散点到圆心的距离,获取每个小线段对应的最小内切圆的目标圆心,包括:根据当前中点的法线作内切圆,使内切圆的圆心在所述法线上且与当前中点对应的线段相切于所述中点;遍历字符轮廓上所有的离散点到圆心的距离,当距离小于圆半径时将该离散点存储在队列列表内;若遍历完所有离散点后队列列表为空,则增大圆半径继续计算所有离散点到新圆心的距离;若队列列表不为空,则减小圆半径继续计算队列列表内的离散点到所述新圆心的距离,直到找到离散点到新圆心的距离等于当前圆半径时,将当前圆作为当前线段的最小内切圆,当前圆心作为最小内切圆的目标圆心。5.如权利要求1所述的手写汉字数据生成方法,其特征在于,构建字体风格融合模型包括:将所述字体风格融合模型定义由编码器、瓶颈层、解码器和跳跃连接组成的基于Transformer的U型对称编码器

解码器结构,所述编码器、瓶颈层和解码器均是基于连续的两个Swin Transformer Block层构造;所述连续的两个Swin Transformer Block由级联的LN层、W

MSA模块、LN层、MLP层、LN层、SW

MSA模块、LN层和MLP层构成;所述编...

【专利技术属性】
技术研发人员:吴洋张攀段崇禧林明建李翔
申请(专利权)人:重庆市通信产业服务有限公司中冉信息分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1