文字处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：39311775 阅读：9 留言：0更新日期：2023-11-12 15:57

本公开实施例提供了一种文字处理方法、装置、电子设备及存储介质，该方法包括：获取包括待处理文字的第一图像；结合空间注意力机制和通道注意力机制训练目标笔画顺序确定模型；将所述第一图像输入至预先训练好的目标笔画顺序确定模型中，得到与所述待处理文字相对应的目标笔画顺序。本公开实施例的技术方案，可以准确得到文字各笔画的位置和顺序，大大降低了所生成的文字中出现笔画断裂，笔画边缘不平整，笔画丢失或冗余的情况发生，提高了所生成文字的准确率。文字的准确率。文字的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
文字处理方法、装置、电子设备及存储介质

[0001]本公开实施例涉及人工智能
，尤其涉及一种文字处理方法、装置、电子设备及存储介质。

技术介绍

[0002]目前，利用人工智能(Artificial Intelligence，AI)生成字体的相关研究已经逐步展开，通过这种方式，不仅满足了用户对多种字体的需求，也提高了设计师的生产效率。
[0003]在实际利用相关模型生成文字时，现有的风格迁移或图片翻译技术擅长修改图片的纹理，却不擅长修改图片的结构信息，然而，在文字生成领域内，间架结构恰恰是各字体之间的重要区分点。因此，基于现有技术得到的字体中往往存在较多的问题，如，笔画断裂，笔画边缘不平整，笔画丢失或冗余等，这不仅使自动生成的文字与用户期望的文字存在差异，还存在较高的错误率。

技术实现思路

[0004]本公开提供一种文字处理方法、装置、电子设备及存储介质，可以准确得到文字各笔画的位置和顺序，大大降低了所生成的文字中出现笔画断裂，笔画边缘不平整，笔画丢失或冗余的情况发生，提高了所生成文字的准确率。
[0005]第一方面，本公开实施例提供了一种文字处理方法，包括：
[0006]获取包括待处理文字的第一图像；
[0007]结合空间注意力机制和通道注意力机制训练目标笔画顺序确定模型；
[0008]将所述第一图像输入至预先训练好的目标笔画顺序确定模型中，得到与所述待处理文字相对应的目标笔画顺序。
[0009]第二方面，本公开实施例还提供了一种文字处理装置，包括...

【技术保护点】

【技术特征摘要】
1.一种文字处理方法，其特征在于，包括：获取包括待处理文字的第一图像；结合空间注意力机制和通道注意力机制训练目标笔画顺序确定模型；将所述第一图像输入至预先训练好的目标笔画顺序确定模型中，得到与所述待处理文字相对应的目标笔画顺序。2.根据权利要求1所述的方法，其特征在于，还包括：获取至少一个第一训练样本；其中，所述第一训练样本中包括样本文字图像和所述样本文字图像所对应的理论文字笔顺；针对各第一训练样本，将当前第一训练样本中的样本文字图像输入至待训练笔画顺序确定模型中，得到预测笔顺；基于所述预测笔顺和所述当前第一训练样本中的理论文字笔顺，确定损失值，并基于所述损失值对所述待训练笔画顺序的模型参数进行修正；将所述待训练笔画顺序确定模型中的损失函数收敛作为训练目标，得到所述目标笔画顺序确定模型。3.根据权利要求2所述的方法，其特征在于，所述将当前第一训练样本中的样本文字图像输入至待训练笔画顺序确定模型中，得到预测笔顺，包括：将所述样本文字图像输入至卷积层中，得到第一待处理特征；通过所述通道注意力机制和空间注意力机制对所述第一待处理特征进行特征提取，得到第二待处理特征；将所述第二待处理特征分别至循环神经网络单元中，得到与每个笔顺位置相对应的特征序列；基于分类器对各特征序列进行处理，得到预测笔顺。4.根据权利要求1所述的方法，其特征在于，还包括：将所述目标笔画顺序确定模型，作为待训练风格特征融合模型的损失模型，以训练得到目标风格特征融合模型；其中，所述目标风格特征融合模型，用于融合至少两种字体风格。5.根据权利要求4所述的方法，其特征在于，训练得到所述目标风格特征融合模型，包括：确定至少一个训练样本；其中，所述训练样本中包括待训练文字图像和参考文字图像；针对各训练样本，将当前训练样本中的待处理文字图像和参考文字图像，输入至待训练风格特征融合模型中，得到与所述待处理文字图像相对应的实际输出文字图像；基于所述目标笔画顺序确定模型对所述实际输出文字图像和所述待处理文字图像进行笔画损失处理，得到第一损失值；基于重建损失函数确定所述实际输出文字图像和所述待训练文字图像，确定重建损失；基于风格编码损失函数确定所述实际输出文字图像与融合文字图像的风格损失值；其中，所述融合...

【专利技术属性】
技术研发人员：刘玮，刘方越，
申请(专利权)人：北京字跳网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人