包含文本的图像合成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：36402804 阅读：16 留言：0更新日期：2023-01-18 10:10

本申请实施例提供了一种包含文本的图像合成方法、装置、计算机设备和存储介质，基于模板图像的文本标注信息，预测模板图像的文本填充参数，文本标注信息用于指示模板图像包括的至少一个字段的原始文本和第一属性信息，文本填充参数用于指示模板图像中各字段的内容填充格式；生成模板图像中各字段分别对应的合成文本；根据第一属性信息和文本填充参数，在模板图像中依次采用各字段的合成文本替换对应的原始文本，得到多张合成图像。在该方法中，只需对模板图像进行简单标注，即可预测模板图像的文本填充参数，减少了人工标注量。其次，通过合成文本替换原始文本生成与模板图像属于同类型的多张合成图像，提高了包含文本的图像合成效率。成效率。成效率。

全部详细技术资料下载

【技术实现步骤摘要】
包含文本的图像合成方法、装置、计算机设备和存储介质

[0001]本申请涉及图像处理
，尤其涉及一种包含文本的图像合成方法、装置、计算机设备和存储介质。

技术介绍

[0002]在涉及图像的文本检测、内容识别和内容分析等场景，通过训练好的文本检测算法可以对图像中的文本内容进行有效识别，节省人力物力。
[0003]为保证识别精度，前期需要采用大量的样本图像对文本检测算法进行训练，且需要每个字符在样本图像中都出现一定的数量，否则可能导致该文本检测算法在实际上线后存在文本检测精度较低的问题。
[0004]基于此，亟需一种可以模拟生成包含文本的图像素材的方法，以生成大量的样本图像，以满足包含文本的图像的文本检测算法的训练需求。

技术实现思路

[0005]本申请实施例提供了一种包含文本的图像合成方法、装置、计算机设备和存储介质，能够基于模板图像的文本标注信息和文本填充参数，快速生成与模板图像同类型的多张合成图像。
[0006]第一方面，本申请提供了一种包含文本的图像合成方法，该方法包括：
[0007]基于模板图像的文本标注信息，预测模板图像的文本填充参数；文本标注信息用于指示模板图像包括的至少一个字段的原始文本和第一属性信息，文本填充参数用于指示模板图像中各字段的内容填充格式；
[0008]生成模板图像中各字段分别对应的合成文本；
[0009]根据第一属性信息和文本填充参数，在模板图像中依次采用各字段的合成文本替换对应的原始文本，得到多张合成图像。
[0...

【技术保护点】

【技术特征摘要】
1.一种包含文本的图像合成方法，其特征在于，包括：基于模板图像的文本标注信息，预测所述模板图像的文本填充参数；所述文本标注信息用于指示所述模板图像包括的至少一个字段的原始文本和第一属性信息，所述文本填充参数用于指示所述模板图像中各所述字段的内容填充格式；生成所述模板图像中各所述字段分别对应的合成文本；根据所述第一属性信息和所述文本填充参数，在所述模板图像中依次采用各所述字段的合成文本替换对应的原始文本，得到多张合成图像。2.根据权利要求1所述的方法，其特征在于，所述基于模板图像的文本标注信息，预测所述模板图像的文本填充参数，包括：生成所述模板图像对应的初始种群；所述初始种群包括多个初始个体，且每个所述初始个体对应所述模板图像的一个填充参数解，每个所述填充参数解包括所述模板图像中各所述字段分别对应的字段参数解；从所述多个初始个体包含的字段参数解中，获取所述模板图像中各所述字段分别对应的最优字段解；根据所述模板图像中各所述字段分别对应的最优字段解，确定所述模板图像的文本填充参数。3.根据权利要求2所述的方法，其特征在于，所述从所述多个初始个体包含的字段参数解中，获取所述模板图像中各所述字段分别对应的最优字段解，包括：生成目标字段在所述多个初始个体中分别对应的字段参数解的目标图像；所述目标字段为所述模板图像中的任一个字段，所述目标字段在一个所述初始个体中对应一个字段参数解；从所述模板图像中获取所述目标字段的标准字段图像；基于所述标准字段图像与各所述字段参数解的目标图像之间的重叠像素累加量，确定所述目标字段与对应的多个字段参数解之间的字段相似度；根据各所述字段对应的多个字段相似度，从各所述字段在所述多个初始个体对应的字段参数解中获取各所述字段的候选字段解；基于各所述字段的候选字段解，对所述多个初始个体进行变异处理，直至个体变异处理结果满足预设的种群进化结束条件，得到多个目标个体；基于所述目标个体，确定所述模板图像中各所述字段分别对应的最优字段解。4.根据权利要求3所述的方法，其特征在于，所述字段参数解包括字体参数、字号参数和偏移量参数；所述生成目标字段在所述多个初始个体中分别对应的字段参数解的目标图像，包括：根据所述目标字段在所述模板图像中的文本填充区域，生成各所述字段参数解对应的初始图像；根据各所述字段参数解中的字体参数和字号参数，在对应的初始图像上添加所述目标字段的原始文本，得到各所述字段参数解对应的中间图像；所述原始文本在所述初始图像和所述中间图像中的像素值不同；根据各所述字段参数解中的偏移量参数，对对应的中间图像进行投影变换，得到各所述字段参数解对应的目标图像。
5.根据权利要求1所述的方法，其特征在于，所述根据所述第一属性信息和所述文本填充参数，在所述模板图像中依次采用各所述字段的合成文本替换对应的原始文本，包括：根据各所述字段的文本填充区域，生成各所述字段对应的第一字段图像；根据各所述字段的字体颜色、字体类型和字体大小，在对应的第一字段图像中添加所述字段的合成文本，得到各所述字段对应的第二字段图像；根据各所述字段的区域偏移量，对各所述字段对应的第二字段图像进行投影变换，得到各所述字段对应的第三字段图像；将各所述字段对应的第三字段图像中的字符像素值，填充至所述模板图像中各所述字段的文本填充区域中。6.根据权利要求1至5任一项所述的方法，其特征在于，所述生成所述模板图像中各所述字段分别对应的合成文本，包括：在所述模板图像中确定各所述字段的第二属性信息；根据各所述字段的第二属性信息，获取各所述字段分别对应的文本合成策略；所述文本合成策略包括字段的文本内容和内容合成方式；按照各所述字段文本合成策略，生成所述模板图像中各所述字段分别对应的合成文本。7.一种包含文本的图像合成装置，其特征在于，包括：参数预测模块，用于基于模板图像的文本标注信息，预测所述模板图像的文本填充参数；所述文本标注信息用于指示所述模板图像包括的至少一个字段的原始文本和第一属性信息，所述文...

【专利技术属性】
技术研发人员：邱明，项超奇，
申请(专利权)人：杭州海康威视系统技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人