文字处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:39311775 阅读:9 留言:0更新日期:2023-11-12 15:57
本公开实施例提供了一种文字处理方法、装置、电子设备及存储介质,该方法包括:获取包括待处理文字的第一图像;结合空间注意力机制和通道注意力机制训练目标笔画顺序确定模型;将所述第一图像输入至预先训练好的目标笔画顺序确定模型中,得到与所述待处理文字相对应的目标笔画顺序。本公开实施例的技术方案,可以准确得到文字各笔画的位置和顺序,大大降低了所生成的文字中出现笔画断裂,笔画边缘不平整,笔画丢失或冗余的情况发生,提高了所生成文字的准确率。文字的准确率。文字的准确率。

【技术实现步骤摘要】
文字处理方法、装置、电子设备及存储介质


[0001]本公开实施例涉及人工智能
,尤其涉及一种文字处理方法、装置、电子设备及存储介质。

技术介绍

[0002]目前,利用人工智能(Artificial Intelligence,AI)生成字体的相关研究已经逐步展开,通过这种方式,不仅满足了用户对多种字体的需求,也提高了设计师的生产效率。
[0003]在实际利用相关模型生成文字时,现有的风格迁移或图片翻译技术擅长修改图片的纹理,却不擅长修改图片的结构信息,然而,在文字生成领域内,间架结构恰恰是各字体之间的重要区分点。因此,基于现有技术得到的字体中往往存在较多的问题,如,笔画断裂,笔画边缘不平整,笔画丢失或冗余等,这不仅使自动生成的文字与用户期望的文字存在差异,还存在较高的错误率。

技术实现思路

[0004]本公开提供一种文字处理方法、装置、电子设备及存储介质,可以准确得到文字各笔画的位置和顺序,大大降低了所生成的文字中出现笔画断裂,笔画边缘不平整,笔画丢失或冗余的情况发生,提高了所生成文字的准确率。
[0005]第一方面,本公开实施例提供了一种文字处理方法,包括:
[0006]获取包括待处理文字的第一图像;
[0007]结合空间注意力机制和通道注意力机制训练目标笔画顺序确定模型;
[0008]将所述第一图像输入至预先训练好的目标笔画顺序确定模型中,得到与所述待处理文字相对应的目标笔画顺序。
[0009]第二方面,本公开实施例还提供了一种文字处理装置,包括
[0010]第一图像获取模块,用于获取包括待处理文字的第一图像;
[0011]笔画顺序确定模型训练模块,用于结合空间注意力机制和通道注意力机制训练目标笔画顺序确定模型;
[0012]目标笔画顺序确定模块,用于将所述第一图像输入至预先训练好的目标笔画顺序确定模型中,得到与所述待处理文字相对应的目标笔画顺序。
[0013]第三方面,本公开实施例还提供了一种电子设备,所述电子设备包括:
[0014]一个或多个处理器;
[0015]存储装置,用于存储一个或多个程序,
[0016]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开实施例任一所述的文字处理方法。
[0017]第四方面,本公开实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本公开实施例任一所述的文字处理方法。
[0018]本公开实施例的技术方案,先获取包括待处理文字的第一图像,再将第一图像输入至预先训练好的、包括空间注意力机制以及通道注意力机制的目标笔画顺序确定模型中,从而得到与待处理文字相对应的目标笔画顺序,通过在笔画顺序确定模型中引入上述两种机制,可以准确得到文字各笔画的位置和顺序,从而大大降低了所生成的文字中出现笔画断裂,笔画边缘不平整,笔画丢失或冗余的情况发生,提高了所生成文字的准确率。
附图说明
[0019]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
[0020]图1为本公开实施例所提供的一种文字处理方法流程示意图;
[0021]图2为本公开实施例所提供的笔画顺序确定模型的示意图;
[0022]图3为本公开实施例所提供的一种文字处理方法流程示意图;
[0023]图4为本公开实施例所提供的风格特征融合模型的示意图;
[0024]图5为本公开实施例所提供的目标文字风格的示意图;
[0025]图6为本公开实施例所提供的一种文字处理装置结构示意图;
[0026]图7为本公开实施例所提供的一种电子设备的结构示意图。
具体实施方式
[0027]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0028]应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
[0029]本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
[0030]需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
[0031]本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
[0032]在介绍本技术方案之前,可以先对应用场景进行示例性说明。该技术方案可以应用在基于神经网络以较高的准确度确定出文字笔画顺序的场景中,例如,当利用人工智能相关算法生成某种字体的文字时,可能在所生成的文字中出现笔画断裂,笔画边缘不平整,
笔画丢失或冗余等问题,此时,基于本实施例的方案,即可准确地确定出该文字的笔画顺序以及各笔画的位置,从而避免上述问题的发生。
[0033]图1为本公开实施例所提供的一种文字处理方法流程示意图,本公开实施例适用于以较高的准确度确定出文字的笔画顺序的情形,该方法可以由文字处理装置来执行,该装置可以通过软件和/或硬件的形式实现,可选的,通过电子设备来实现,该电子设备可以是移动终端、PC端或服务器等。
[0034]如图1所示,所述方法包括:
[0035]S110、获取包括待处理文字的第一图像。
[0036]其中,第一图像可以是服务端或客户端接受的、由用户通过摄像装置实时拍摄得到的图像,也可以是服务端或客户端从相关数据库中调取的已存储的图像,同时,在图像中至少包括一个或多个文字,可以理解,图像中的文字即是待处理文字,基于本公开实施例的神经网络模型,至少需要确定出待处理文字的笔画顺序。
[0037]示例性的,当用户对一幅包含有一个汉字的书法作品进行拍摄,并将拍摄得到的图像上传至服务端或客户端后,该图像即是第一图像,同时,服务端或客户端可以基于相关算法对图像进行识别,从而确定出图像中的汉字为待处理文字。当然,在实际应用过程中,第一图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文字处理方法,其特征在于,包括:获取包括待处理文字的第一图像;结合空间注意力机制和通道注意力机制训练目标笔画顺序确定模型;将所述第一图像输入至预先训练好的目标笔画顺序确定模型中,得到与所述待处理文字相对应的目标笔画顺序。2.根据权利要求1所述的方法,其特征在于,还包括:获取至少一个第一训练样本;其中,所述第一训练样本中包括样本文字图像和所述样本文字图像所对应的理论文字笔顺;针对各第一训练样本,将当前第一训练样本中的样本文字图像输入至待训练笔画顺序确定模型中,得到预测笔顺;基于所述预测笔顺和所述当前第一训练样本中的理论文字笔顺,确定损失值,并基于所述损失值对所述待训练笔画顺序的模型参数进行修正;将所述待训练笔画顺序确定模型中的损失函数收敛作为训练目标,得到所述目标笔画顺序确定模型。3.根据权利要求2所述的方法,其特征在于,所述将当前第一训练样本中的样本文字图像输入至待训练笔画顺序确定模型中,得到预测笔顺,包括:将所述样本文字图像输入至卷积层中,得到第一待处理特征;通过所述通道注意力机制和空间注意力机制对所述第一待处理特征进行特征提取,得到第二待处理特征;将所述第二待处理特征分别至循环神经网络单元中,得到与每个笔顺位置相对应的特征序列;基于分类器对各特征序列进行处理,得到预测笔顺。4.根据权利要求1所述的方法,其特征在于,还包括:将所述目标笔画顺序确定模型,作为待训练风格特征融合模型的损失模型,以训练得到目标风格特征融合模型;其中,所述目标风格特征融合模型,用于融合至少两种字体风格。5.根据权利要求4所述的方法,其特征在于,训练得到所述目标风格特征融合模型,包括:确定至少一个训练样本;其中,所述训练样本中包括待训练文字图像和参考文字图像;针对各训练样本,将当前训练样本中的待处理文字图像和参考文字图像,输入至待训练风格特征融合模型中,得到与所述待处理文字图像相对应的实际输出文字图像;基于所述目标笔画顺序确定模型对所述实际输出文字图像和所述待处理文字图像进行笔画损失处理,得到第一损失值;基于重建损失函数确定所述实际输出文字图像和所述待训练文字图像,确定重建损失;基于风格编码损失函数确定所述实际输出文字图像与融合文字图像的风格损失值;其中,所述融合...

【专利技术属性】
技术研发人员:刘玮刘方越
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1