【技术实现步骤摘要】
生成字体数据库的方法、神经网络模型的训练方法和装置
[0001]本公开涉及人工智能领域,具体为计算机视觉和深度学习技术,尤其涉及一种生成字体数据库的方法、神经网络模型的训练方法和装置。
技术介绍
[0002]字体生成一直是国内外许多研究者着重研究的课题,在字体设计行业有着广泛的应用价值。目前主流的技术方案包括基于深度学习的字体生成方案和将字体进行拆分再组合的字体生成方案。
[0003]对于基于深度学习的字体生成方案,尤其是基于生成式对抗网络(GAN)的字体生成方案,需要大量数据进行训练。数据质量和数量会极大影响最终的输出效果,因此对训练数据获取和数据质量有很高的要求。而对于字体进行拆分再组合的字体生成方案,其所需数据量虽然相比GAN虽然小,但是很难复现用户字体的连笔特征,导致缺乏用户字体的美观度和多样性。
技术实现思路
[0004]本公开提供了一种用于生成字体数据库的方法、神经网络模型的训练方法、装置、设备以及存储介质。
[0005]根据第一方面,提供了一种用于生成字体数据库的方法,包括:
[0006]利用经训练相似度比较模型,确定多个基础字体数据库中,与目标用户的手写字体数据最相似的基础字体数据库,作为候选字体数据库;以及
[0007]利用用于生成所述候选字体数据库的经训练基础字体数据库模型,来调整所述目标用户的手写字体数据,得到针对所述目标用户的目标字体数据库。
[0008]根据第二方面,提供了一种神经网络模型的训练方法,所述神经网络模型包括基础字体数据库模 ...
【技术保护点】
【技术特征摘要】
1.一种用于生成字体数据库的方法,包括:利用经训练相似度比较模型,确定多个基础字体数据库中,与目标用户的手写字体数据最相似的基础字体数据库,作为候选字体数据库;以及利用用于生成所述候选字体数据库的经训练基础字体数据库模型,来调整所述目标用户的手写字体数据,得到针对所述目标用户的目标字体数据库。2.根据权利要求1所述的方法,其中,确定多个基础字体数据库中与目标用户的手写字体数据最相似的基础字体数据库包括:利用经训练相似度比较模型,确定所述目标用户的手写字体数据与所述多个基础字体数据库中的每个基础字体数据库中的相应字体数据之间的相似度;以及将所述多个基础字体数据库中具有最大相似度的基础字体数据库作为所述候选字体数据库。3.根据权利要求2所述的方法,其中,所述相似度包括所述目标用户的多个手写字体数据与所述多个基础字体数据库中的每个基础字体数据库中的多个相应字体数据之间的相似度之和。4.根据权利要求1所述的方法,还包括:利用所述目标用户的手写字体数据的偏旁数据替换所述目标字体数据库中的对应偏旁数据。5.根据权利要求4所述的方法,其中利用所述目标用户的手写字体数据的偏旁数据替换所述目标字体数据库中的对应偏旁数据包括:计算替换后的偏旁图像数据的重心位置与替换前的偏旁图像数据的重心位置之间的差值;基于所述差值调整替换后的偏旁图像数据的位置。6.根据权利要求1所述的方法,其中,利用用于生成所述候选字体数据库的经训练基础字体数据库模型,来调整所述目标用户的手写字体数据包括:利用用于生成所述候选字体数据库的经训练基础字体数据库模型,以标准字体的基础笔画作为输入,以所述目标用户的手写字体的基础笔画作为输出。7.根据权利要求6所述的方法,其中所述目标用户的手写字体的基础笔画是通过使用一致性点集漂移CPD匹配算法对所述目标用户的手写字进行分割而得到的。8.根据权利要求7所述的方法,还包括对使用所述CPD匹配算法匹配的结果进行过滤,以滤除被确定为不正确的结果。9.一种神经网络模型的训练方法,所述神经网络模型包括基础字体数据库模型和相似度比较模型,所述方法包括:利用多个用户的手写字体数据训练所述基础字体数据库模型,使得所述多个用户的每个用户分别具有与其相对应的基础字体数据库模型和基础字体数据库;以及利用所述多个用户的多个基础字体数据库训练相似度比较模型。10.根据权利要求9所述的方法,其中,所述基础字体数据包括字体的图像数据,并且利用所述多个用户的多个基础字体数据库训练相似度比较模型包括:在所述多个基础字体数据库中的N个基础字体数据库中随机选择两个图像数据组成图像对,其中所述N个基础字体数据库由数组{X
i
},(i=1,2,...,N)表示,N为大于1的自然数;针对所述图像数据对添加标记label,其中如果确定所述图像数据对来自同一个基础
字体数据库,则label值为1,否...
【专利技术属性】
技术研发人员:唐礼承,刘家铭,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。