文本图像生成、训练、文本图像处理方法以及电子设备技术

技术编号：34987461 阅读：12 留言：0更新日期：2022-09-21 14:32

本发明专利技术提供了一种文本图像生成、训练、文本图像处理方法以及电子设备，涉及人工智能技术领域。具体实现方案为：根据样本文本图像集的样本文本输出结果集和样本标签集，将样本文本图像集划分为至少一个样本文本图像子集；根据待裁剪样本文本图像集的样本文本输出结果集，确定待裁剪样本文本图像集的目标裁剪位置集；基于目标裁剪位置集对待裁剪样本文本图像集进行裁剪，得到至少一个裁剪样本文本图像子集；根据至少一个裁剪样本文本图像子集和至少一个样本文本图像子集，得到目标样本文本图像集。能够有效保证目标裁剪位置的准确性，有效避免字符信息被破坏，并且提高了目标样本文本图像集中样本文本图像的图像背景复杂度和图像多样性。像多样性。像多样性。

全部详细技术资料下载

【技术实现步骤摘要】
文本图像生成、训练、文本图像处理方法以及电子设备

[0001]本专利技术涉及人工智能
，尤其涉及计算机视觉和深度学习
，可应用于光学字符识别场景。具体地，涉及一种文本图像生成、训练、文本图像处理方法以及电子设备。

技术介绍

[0002]随着计算机技术的发展，人工智能技术也得以发展。人工智能技术可以包括计算机视觉技术、语音识别技术、自然语言处理技术、机器学习、深度学习、大数据处理技术和知识图谱技术等。
[0003]人工智能技术在各种领域得到了广泛应用。例如，可以利用人工智能技术生成用于训练深度学习模型的文本图像。

技术实现思路

[0004]本专利技术提供了一种文本图像生成、训练、文本图像处理方法以及电子设备。
[0005]根据本专利技术的一方面，提供了一种文本图像生成方法，包括：根据样本文本图像集的样本文本输出结果集和样本标签集，将上述样本文本图像集划分为至少一个样本文本图像子集，其中，上述至少一个样本文本图像子集包括第一样本文本图像子集，上述第一样本文本图像子集包括样本文本输出结果正确的样本文本图像；根据待裁剪样本文本图像集的样本文本输出结果集，确定上述待裁剪样本文本图像集的目标裁剪位置集，其中，上述待裁剪样本文本图像集是根据上述第一样本文本图像子集确定的；基于上述目标裁剪位置集对上述待裁剪样本文本图像集进行裁剪，得到至少一个裁剪样本文本图像子集；以及，根据上述至少一个裁剪样本文本图像子集和上述至少一个样本文本图像子集，得到目标样本文本图像集。
[0006]根据本专...

【技术保护点】

【技术特征摘要】
1.一种文本图像生成方法，包括：根据样本文本图像集的样本文本输出结果集和样本标签集，将所述样本文本图像集划分为至少一个样本文本图像子集，其中，所述至少一个样本文本图像子集包括第一样本文本图像子集，所述第一样本文本图像子集包括样本文本输出结果正确的样本文本图像；根据待裁剪样本文本图像集的样本文本输出结果集，确定所述待裁剪样本文本图像集的目标裁剪位置集，其中，所述待裁剪样本文本图像集是根据所述第一样本文本图像子集确定的；基于所述目标裁剪位置集对所述待裁剪样本文本图像集进行裁剪，得到至少一个裁剪样本文本图像子集；以及根据所述至少一个裁剪样本文本图像子集和所述至少一个样本文本图像子集，得到目标样本文本图像集。2.根据权利要求1所述的方法，其中，所述根据样本文本图像集的样本文本输出结果集和样本标签集，将所述样本文本图像集划分为至少一个样本文本图像子集，包括：将所述样本文本图像集的样本文本输出结果集和样本标签集进行比较，得到比较结果；以及根据所述比较结果，将所述样本文本图像集划分为所述至少一个样本文本图像子集。3.根据权利要求2所述的方法，其中，所述样本文本图像集包括多个样本文本图像，所述至少一个样本文本图像子集还包括第二样本文本图像子集；其中，所述根据所述比较结果，将所述样本文本图像集划分为所述至少一个样本文本图像子集，包括：针对所述多个样本文本图像中的样本文本图像，在确定所述样本文本图像的样本文本输出结果和样本标签之间的关系满足预定匹配条件的情况下，将所述样本文本图像确定为所述第一样本文本图像子集中的样本文本图像；以及在确定所述样本文本图像的样本文本输出结果和样本标签之间的关系不满足所述预定匹配条件的情况下，将所述样本文本图像确定为所述第二样本文本图像子集中的样本文本图像。4.根据权利要求1~3中任一项所述的方法，其中，所述待裁剪样本文本图像集包括多个待裁剪样本文本图像；其中，所述根据待裁剪样本文本图像集的样本文本输出结果集，确定所述待裁剪样本文本图像集的目标裁剪位置集，包括：针对所述待裁剪样本文本图像集中的待裁剪样本文本图像，根据所述待裁剪样本文本图像的样本文本输出结果，从多个候选裁剪位置中确定至少一个所述目标裁剪位置。5.根据权利要求4所述的方法，其中，所述样本文本输出结果包括以下至少之一：样本文本识别输出结果和样本文本语义输出结果。6.根据权利要求5所述的方法，其中，所述样本文本图像集包括多个样本文本图像；其中，所述样本文本识别输出结果是对所述样本文本图像的全局样本特征序列进行序列解码得到的，所述全局样本特征序列是对所述样本文本图像的第一局部样本特征图进行
全局特征提取得到的，所述第一局部样本特征图是对所述样本文本图像进行第一局部特征提取得到的；其中，所述样本文本语义输出结果是对所述样本文本图像的第二局部样本特征图进行语义理解得到的，所述第二局部样本特征图是对所述样本文本图像进行第二局部特征提取得到的。7.根据权利要求5所述的方法，其中，在所述样本文本输出结果包括所述样本文本识别结果和所述样本文本语义输出结果的情况下，所述根据所述待裁剪样本文本图像的样本文本输出结果，从多个候选裁剪位置中确定至少一个所述目标裁剪位置，包括：根据所述待裁剪样本文本图像的样本文本识别输出结果，确定所述多个候选裁剪位置；以及根据所述待裁剪样本文本图像的样本文本语义输出结果，从所述多个候选裁剪位置中确定至少一个所述目标裁剪位置。8.根据权利要求1~3中任一项所述的方法，其中，所述基于所述目标裁剪位置集对所述待裁剪样本文本图像集进行裁剪，得到至少一个裁剪样本文本图像子集，包括：基于所述目标裁剪位置集对所述待裁剪样本文本图像集进行裁剪，得到第一裁剪样本文本图像子集和第二裁剪样本文本图像子集。9.根据权利要求1~3中任一项所述的方法，其中，所述根据所述至少一个裁剪样本文本图像子集和所述至少一个样本文本图像子集，得到目标样本文本图像集，包括：根据所述至少一个裁剪样本文本图像子集，得到第三样本文本图像子集；以及根据所述至少一个样本文本图像子集和所述第三样本文本图像子集，得到所述目标样本文本图像集。10.根据权利要求9所述的方法，其中，所述根据所述至少一个裁剪样本文本图像子集，得到第三样本文本图像子集，包括：基于预定组合策略，将所述至少一个裁剪样本文本图像子集中的裁剪样本文本图像进行组合，得到所述第三样本文本图像子集。11.根据权利要求1~3中任一项所述的方法，其中，所述第一样本文本图像集包括多个第一样本文本图像；其中，所述待裁剪样本文本图像集是通过以下方式确定的：针对所述多个第一样本文本图像中的第一样本文本图像，在确定所述第一样本文本图像的预定概率值小于或等于预定概率阈值的情况下，将所述第一样本文本图像确定为所述待裁剪样本文本图像集中的待裁剪样本文本图像。12.根据权利要求1~3中任一项所述的方法，还包括：对原始样本文本图像集进行数据增强处理，得到中间样本文本图像集；以及根据所述原始样本文本图像集和所述中间样本文本图像集，得到所述样本文本图像集。13.根据权利要求1~3中任一项所述的方法，其中，所述样本文本图像集是文本视觉任务的文本图像集。14.一种深度学习模型的训练方法，包括：获取目标样本文本图像集；以及
利用所述目标样本文本图像集训练所述深度学习模型，得到文本图像处理模型，其中，所述目标样本文本图像集是利用根据权利要求1~13中任一项所述的方法得到的。15.一种文本图像处理方法，包括：获取待处理文本图像；以及将所述待处理文本图像输入文本图像处理模型，得到文本图像处理结果，其中，所述文本图像处理模型是利用根据权利要求14所述的方法训练得到的。16.一种文本图像生成装置，包括：划分模块，用于根据样本文本图像集的样本文本输出结果集和样本标签集，将所述样本文本图像集划分为至少一个样本文本...

【专利技术属性】
技术研发人员：郭若愚，杜宇宁，赖宝华，马艳军，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人