生成字体数据库的方法、神经网络模型的训练方法和装置制造方法及图纸

技术编号:29226749 阅读:20 留言:0更新日期:2021-07-10 01:12
本公开公开了一种用于生成字体数据库的方法、神经网络模型的训练方法和装置,涉及人工智能领域,具体为计算机视觉和深度学习技术。所述用于生成字体数据库的方法包括:利用经训练相似度比较模型,确定多个基础字体数据库中,与目标用户的手写字体数据最相似的基础字体数据库,作为候选字体数据库;以及利用用于生成所述候选字体数据库的经训练基础字体数据库模型,来调整所述目标用户的手写字体数据,得到针对所述目标用户的目标字体数据库。得到针对所述目标用户的目标字体数据库。得到针对所述目标用户的目标字体数据库。

【技术实现步骤摘要】
生成字体数据库的方法、神经网络模型的训练方法和装置


[0001]本公开涉及人工智能领域,具体为计算机视觉和深度学习技术,尤其涉及一种生成字体数据库的方法、神经网络模型的训练方法和装置。

技术介绍

[0002]字体生成一直是国内外许多研究者着重研究的课题,在字体设计行业有着广泛的应用价值。目前主流的技术方案包括基于深度学习的字体生成方案和将字体进行拆分再组合的字体生成方案。
[0003]对于基于深度学习的字体生成方案,尤其是基于生成式对抗网络(GAN)的字体生成方案,需要大量数据进行训练。数据质量和数量会极大影响最终的输出效果,因此对训练数据获取和数据质量有很高的要求。而对于字体进行拆分再组合的字体生成方案,其所需数据量虽然相比GAN虽然小,但是很难复现用户字体的连笔特征,导致缺乏用户字体的美观度和多样性。

技术实现思路

[0004]本公开提供了一种用于生成字体数据库的方法、神经网络模型的训练方法、装置、设备以及存储介质。
[0005]根据第一方面,提供了一种用于生成字体数据库的方法,包括:
[0006]利用经训练相似度比较模型,确定多个基础字体数据库中,与目标用户的手写字体数据最相似的基础字体数据库,作为候选字体数据库;以及
[0007]利用用于生成所述候选字体数据库的经训练基础字体数据库模型,来调整所述目标用户的手写字体数据,得到针对所述目标用户的目标字体数据库。
[0008]根据第二方面,提供了一种神经网络模型的训练方法,所述神经网络模型包括基础字体数据库模型和相似度比较模型,所述方法包括:
[0009]利用多个用户的手写字体数据训练所述基础字体数据库模型,使得所述多个用户的每个用户分别具有与其相对应的基础字体数据库模型和基础字体数据库;以及
[0010]利用所述多个用户的多个基础字体数据库训练相似度比较模型。
[0011]根据第三方面,提供了一种用于生成字体数据库的装置,包括:
[0012]确定模块,利用经训练相似度比较模型,将目标用户的手写字体数据与多个基础字体数据库分别进行比较,来确定所述多个基础字体数据库中与目标用户的手写字体数据最相似的基础字体数据库,作为候选字体数据库;以及
[0013]调整模块,利用用于生成所述候选字体数据库的经训练基础字体数据库模型,来调整所述目标用户的手写字体数据,得到针对所述目标用户的目标字体数据库。
[0014]根据第四方面,提供了一种神经网络模型的训练装置,所述神经网络模型包括基础字体数据库模型和相似度比较模型,所述训练装置包括:
[0015]基础字体数据库模型训练模块,利用多个用户的手写字体数据训练所述基础字体
数据库模型,使得所述多个用户的每个用户分别具有与其相对应的基础字体数据库模型和基础字体数据库;以及
[0016]相似度比较模型训练模块,利用所述多个用户的多个基础字体数据库训练相似度比较模型。
[0017]根据第五方面,提供了一种电子设备,包括:
[0018]至少一个处理器;以及
[0019]与所述至少一个处理器通信连接的存储器;其中,
[0020]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述方法。
[0021]根据第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述方法。
[0022]根据第七方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述方法。
[0023]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0024]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0025]图1示出了根据本公开实施例的用于生成字体数据库的方法的流程图;
[0026]图2示出了根据本公开实施例的使用一致性点集漂移(CPD)匹配算法对用户的手写字进行分割的效果;
[0027]图3示出了根据本公开另一实施例的用于生成字体数据库的方法的流程图;
[0028]图4示出了根据本公开实施例的调整偏旁图像数据的重心位置的示意图;
[0029]图5示出了根据本公开实施例的神经网络模型的训练方法的流程图;
[0030]图6示出了根据本公开实施例的基础字体数据库模型的模型结构的示意图;
[0031]图7示出了根据本公开实施例的训练相似度比较模型的方法的流程图;
[0032]图8示出了根据本公开实施例的相似度比较模型的模型结构的示意图;
[0033]图9示出了根据本公开实施例的生成字体数据库的效果的示意图;
[0034]图10是根据本公开实施例的用于生成字体数据库的装置的框图;
[0035]图11是根据本公开实施例的神经网络模型的训练装置的框图;
[0036]图12示出了可以用来实施本公开实施例的电子设备的框图。
具体实施方式
[0037]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0038]图1示出了根据本公开实施例的用于生成字体数据库的方法100的流程图。
[0039]在步骤S110,利用经训练相似度比较模型,确定多个基础字体数据库中,与目标用
户的手写字体数据最相似的基础字体数据库,作为候选字体数据库。
[0040]在一些实施例中,可以确定目标用户的手写字体数据与多个基础字体数据库中的每个基础字体数据库中的相应字体数据之间的相似度,并将多个基础字体数据库中具有最大相似度的基础字体数据库作为候选字体数据库。
[0041]在一些实施例中,相似度包括目标用户的多个手写字体数据与多个基础字体数据库中的每个基础字体数据库中的多个相应字体数据之间的相似度之和。
[0042]例如,在预先利用N(N为大于1的自然数)个基础字体数据库训练了相似度比较模型的情况下,如果目标用户(例如,新用户)输入100个手写字,则将这100个手写字的字体数据分别与每个基础字体数据库中的100个相应字体数据输入经训练相似度比较模型,该相似度比较模型输出要比较的字体数据与每个基础字体数据库中的相应字体数据相似的概率p
ij
(i=1,2,...,N;j=1,2,...,100)。下文中,将字体之间相似的概率称为相似度。在一些实施例中,可以通过计算目标用户输入的100个手写字的字体数据与基础字体数据库中的相应字体数据之间的相似度之和,得到与目标用户最为相似的基础字体数据库为:<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于生成字体数据库的方法,包括:利用经训练相似度比较模型,确定多个基础字体数据库中,与目标用户的手写字体数据最相似的基础字体数据库,作为候选字体数据库;以及利用用于生成所述候选字体数据库的经训练基础字体数据库模型,来调整所述目标用户的手写字体数据,得到针对所述目标用户的目标字体数据库。2.根据权利要求1所述的方法,其中,确定多个基础字体数据库中与目标用户的手写字体数据最相似的基础字体数据库包括:利用经训练相似度比较模型,确定所述目标用户的手写字体数据与所述多个基础字体数据库中的每个基础字体数据库中的相应字体数据之间的相似度;以及将所述多个基础字体数据库中具有最大相似度的基础字体数据库作为所述候选字体数据库。3.根据权利要求2所述的方法,其中,所述相似度包括所述目标用户的多个手写字体数据与所述多个基础字体数据库中的每个基础字体数据库中的多个相应字体数据之间的相似度之和。4.根据权利要求1所述的方法,还包括:利用所述目标用户的手写字体数据的偏旁数据替换所述目标字体数据库中的对应偏旁数据。5.根据权利要求4所述的方法,其中利用所述目标用户的手写字体数据的偏旁数据替换所述目标字体数据库中的对应偏旁数据包括:计算替换后的偏旁图像数据的重心位置与替换前的偏旁图像数据的重心位置之间的差值;基于所述差值调整替换后的偏旁图像数据的位置。6.根据权利要求1所述的方法,其中,利用用于生成所述候选字体数据库的经训练基础字体数据库模型,来调整所述目标用户的手写字体数据包括:利用用于生成所述候选字体数据库的经训练基础字体数据库模型,以标准字体的基础笔画作为输入,以所述目标用户的手写字体的基础笔画作为输出。7.根据权利要求6所述的方法,其中所述目标用户的手写字体的基础笔画是通过使用一致性点集漂移CPD匹配算法对所述目标用户的手写字进行分割而得到的。8.根据权利要求7所述的方法,还包括对使用所述CPD匹配算法匹配的结果进行过滤,以滤除被确定为不正确的结果。9.一种神经网络模型的训练方法,所述神经网络模型包括基础字体数据库模型和相似度比较模型,所述方法包括:利用多个用户的手写字体数据训练所述基础字体数据库模型,使得所述多个用户的每个用户分别具有与其相对应的基础字体数据库模型和基础字体数据库;以及利用所述多个用户的多个基础字体数据库训练相似度比较模型。10.根据权利要求9所述的方法,其中,所述基础字体数据包括字体的图像数据,并且利用所述多个用户的多个基础字体数据库训练相似度比较模型包括:在所述多个基础字体数据库中的N个基础字体数据库中随机选择两个图像数据组成图像对,其中所述N个基础字体数据库由数组{X
i
},(i=1,2,...,N)表示,N为大于1的自然数;针对所述图像数据对添加标记label,其中如果确定所述图像数据对来自同一个基础
字体数据库,则label值为1,否...

【专利技术属性】
技术研发人员:唐礼承刘家铭
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1