包含文本的图像合成方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:36402804 阅读:16 留言:0更新日期:2023-01-18 10:10
本申请实施例提供了一种包含文本的图像合成方法、装置、计算机设备和存储介质,基于模板图像的文本标注信息,预测模板图像的文本填充参数,文本标注信息用于指示模板图像包括的至少一个字段的原始文本和第一属性信息,文本填充参数用于指示模板图像中各字段的内容填充格式;生成模板图像中各字段分别对应的合成文本;根据第一属性信息和文本填充参数,在模板图像中依次采用各字段的合成文本替换对应的原始文本,得到多张合成图像。在该方法中,只需对模板图像进行简单标注,即可预测模板图像的文本填充参数,减少了人工标注量。其次,通过合成文本替换原始文本生成与模板图像属于同类型的多张合成图像,提高了包含文本的图像合成效率。成效率。成效率。

【技术实现步骤摘要】
包含文本的图像合成方法、装置、计算机设备和存储介质


[0001]本申请涉及图像处理
,尤其涉及一种包含文本的图像合成方法、装置、计算机设备和存储介质。

技术介绍

[0002]在涉及图像的文本检测、内容识别和内容分析等场景,通过训练好的文本检测算法可以对图像中的文本内容进行有效识别,节省人力物力。
[0003]为保证识别精度,前期需要采用大量的样本图像对文本检测算法进行训练,且需要每个字符在样本图像中都出现一定的数量,否则可能导致该文本检测算法在实际上线后存在文本检测精度较低的问题。
[0004]基于此,亟需一种可以模拟生成包含文本的图像素材的方法,以生成大量的样本图像,以满足包含文本的图像的文本检测算法的训练需求。

技术实现思路

[0005]本申请实施例提供了一种包含文本的图像合成方法、装置、计算机设备和存储介质,能够基于模板图像的文本标注信息和文本填充参数,快速生成与模板图像同类型的多张合成图像。
[0006]第一方面,本申请提供了一种包含文本的图像合成方法,该方法包括:
[0007]基于模板图像的文本标注信息,预测模板图像的文本填充参数;文本标注信息用于指示模板图像包括的至少一个字段的原始文本和第一属性信息,文本填充参数用于指示模板图像中各字段的内容填充格式;
[0008]生成模板图像中各字段分别对应的合成文本;
[0009]根据第一属性信息和文本填充参数,在模板图像中依次采用各字段的合成文本替换对应的原始文本,得到多张合成图像。
[0010]第二方面,本申请提供了一种包含文本的图像合成装置,该装置包括:
[0011]参数预测模块,用于基于模板图像的文本标注信息,预测模板图像的文本填充参数;文本标注信息用于指示模板图像包括的至少一个字段的原始文本和第一属性信息,文本填充参数用于指示模板图像中各字段的内容填充格式;
[0012]文本生成模块,用于生成模板图像中各字段分别对应的合成文本;
[0013]内容替换模块,用于根据第一属性信息和文本填充参数,在模板图像中依次采用各字段的合成文本替换对应的原始文本,得到多张合成图像。
[0014]第三方面,本申请提供了一种计算机设备,该设备包括存储器和处理器,存储器存储有计算机程序,处理器执行该计算机程序时实现上述第一方面所示的包含文本的图像合成方法的步骤。
[0015]第四方面,本申请提供了一种计算机存储介质,该计算机存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述第一方面所示的包含文本的图像合成方法
的步骤。
[0016]第五方面,本申请提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现上述第一方面所示的包含文本的图像合成方法的步骤。
[0017]本申请实施例提供的技术方案至少可以达到以下有益效果:
[0018]本申请提供的包含文本的图像合成方法、装置、计算机设备和存储介质,基于模板图像的文本标注信息,预测模板图像的文本填充参数,以及生成模板图像中各字段分别对应的合成文本。其中,文本标注信息用于指示模板图像包括的至少一个字段的原始文本和第一属性信息,文本填充参数用于指示模板图像中各字段的内容填充格式。进而根据第一属性信息和文本填充参数,在模板图像中依次采用各字段的合成文本替换对应的原始文本,得到多张合成图像。在该方法中,首先,考虑到图像中的文本参数较为复杂,人工标注依赖于经验,且标注精度低,因此,对于任一模板图像,本申请只需对模板图像中的原始文本和第一属性信息进行简单标注,即可根据文本标注信息预测模板图像的文本填充参数。如此,通过预测模板图像的文本填充参数,而非人工在模板图像中标注文本填充参数,不仅可以提高文本填充参数的精度,还可以减少人工标注量,节省了大量的人力物力。其次,在确定模板图像的相关参数/信息后,通过各字段的合成文本替换模板图像中各字段的原始文本,即可生成与模板图像属于同类型的多张合成图像,提高了包含文本的图像合成效率,以在短时间内生成尽可能多的合成图像,满足算法训练的样本量需求。进一步地,由于多张图像均是基于模板图像的格式,通过替换文本内容得到的,因此,多张合成图像和模板图像所包含的字段数目相同,且除文本内容以外,多张合成图像和模板图像的第一属性信息和文本填充参数均相同。如此,合成图像与真实的模板图像之间的文本内容和格式等更加相似,从而提高了合成图像的真实性。
附图说明
[0019]图1是本申请一示例性实施例示出的一种包含文本的图像合成方法的流程示意图;
[0020]图2是本申请一示例性实施例示出的一种文本填充区域的区域偏移量示意图;
[0021]图3是本申请一示例性实施例示出的一种预测文本填充参数的流程示意图;
[0022]图4是本申请一示例性实施例示出的一种获取最优字段解的流程示意图;
[0023]图5是本申请一示例性实施例示出的一种字段相似度的计算流程示意图;
[0024]图6是本申请一示例性实施例示出的一种字段相似度的计算流程示意图;
[0025]图7是本申请一示例性实施例示出的一种个体变异处理流程示意图;
[0026]图8是本申请一示例性实施例示出的一种包含文本的图像合成装置的结构示意图;
[0027]图9是本申请一示例性实施例示出的一种计算机设备的结构示意图。
具体实施方式
[0028]为使本申请的目的、技术方案及优点更加清楚明白,下面将结合附图及实施例,对本申请的技术方案做进一步详细说明。
[0029]在对本申请实施例提供的包含文本的图像合成方法进行解释说明之前,先对本申请实施例的应用场景进行介绍。
[0030]针对图像进行文本检测时,为提高检测精度和检测速率,通常采用预先训练好的文本检测算法,或者具备文本检测功能的神经网络模型等,代替人工进行图像识别,从而获取图像中的文本信息。
[0031]然而,对于文本检测算法,其在上线应用前,需要采用大量的样本图像进行训练,以提高算法检测精度。
[0032]基于此,本申请提供了一种包含文本的图像合成方法,基于很小数目的真实图像,通过预先标注的模板图像的文本标注信息,预测模板图像的文本填充参数,进而针对模板图像,采用文本替换的方式,生成多张与模板图像类似的虚拟的合成图像,以满足图像的文本检测算法的训练样本量要求。
[0033]在一个示例性实施例中,本申请提供的包含文本的图像合成方法,可以应用在一个计算机设备中,也可以应用在至少两个计算机设备组成的系统中,以通过设备之间的信息交互来实现上述方法。
[0034]在一些实施例中,该计算机设备可以为终端或服务器。其中,终端可以但不限于为各种个人计算机、笔记本电脑、智能手机、平板电脑、便携式可穿戴设备等;服务器可以但不限于为至少一个独立服务器、分布式服务器、云服务器、服务器集群等。
[0035]需要说明的是,本申请实施例提供的一种包含文本的图像合成方法,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种包含文本的图像合成方法,其特征在于,包括:基于模板图像的文本标注信息,预测所述模板图像的文本填充参数;所述文本标注信息用于指示所述模板图像包括的至少一个字段的原始文本和第一属性信息,所述文本填充参数用于指示所述模板图像中各所述字段的内容填充格式;生成所述模板图像中各所述字段分别对应的合成文本;根据所述第一属性信息和所述文本填充参数,在所述模板图像中依次采用各所述字段的合成文本替换对应的原始文本,得到多张合成图像。2.根据权利要求1所述的方法,其特征在于,所述基于模板图像的文本标注信息,预测所述模板图像的文本填充参数,包括:生成所述模板图像对应的初始种群;所述初始种群包括多个初始个体,且每个所述初始个体对应所述模板图像的一个填充参数解,每个所述填充参数解包括所述模板图像中各所述字段分别对应的字段参数解;从所述多个初始个体包含的字段参数解中,获取所述模板图像中各所述字段分别对应的最优字段解;根据所述模板图像中各所述字段分别对应的最优字段解,确定所述模板图像的文本填充参数。3.根据权利要求2所述的方法,其特征在于,所述从所述多个初始个体包含的字段参数解中,获取所述模板图像中各所述字段分别对应的最优字段解,包括:生成目标字段在所述多个初始个体中分别对应的字段参数解的目标图像;所述目标字段为所述模板图像中的任一个字段,所述目标字段在一个所述初始个体中对应一个字段参数解;从所述模板图像中获取所述目标字段的标准字段图像;基于所述标准字段图像与各所述字段参数解的目标图像之间的重叠像素累加量,确定所述目标字段与对应的多个字段参数解之间的字段相似度;根据各所述字段对应的多个字段相似度,从各所述字段在所述多个初始个体对应的字段参数解中获取各所述字段的候选字段解;基于各所述字段的候选字段解,对所述多个初始个体进行变异处理,直至个体变异处理结果满足预设的种群进化结束条件,得到多个目标个体;基于所述目标个体,确定所述模板图像中各所述字段分别对应的最优字段解。4.根据权利要求3所述的方法,其特征在于,所述字段参数解包括字体参数、字号参数和偏移量参数;所述生成目标字段在所述多个初始个体中分别对应的字段参数解的目标图像,包括:根据所述目标字段在所述模板图像中的文本填充区域,生成各所述字段参数解对应的初始图像;根据各所述字段参数解中的字体参数和字号参数,在对应的初始图像上添加所述目标字段的原始文本,得到各所述字段参数解对应的中间图像;所述原始文本在所述初始图像和所述中间图像中的像素值不同;根据各所述字段参数解中的偏移量参数,对对应的中间图像进行投影变换,得到各所述字段参数解对应的目标图像。
5.根据权利要求1所述的方法,其特征在于,所述根据所述第一属性信息和所述文本填充参数,在所述模板图像中依次采用各所述字段的合成文本替换对应的原始文本,包括:根据各所述字段的文本填充区域,生成各所述字段对应的第一字段图像;根据各所述字段的字体颜色、字体类型和字体大小,在对应的第一字段图像中添加所述字段的合成文本,得到各所述字段对应的第二字段图像;根据各所述字段的区域偏移量,对各所述字段对应的第二字段图像进行投影变换,得到各所述字段对应的第三字段图像;将各所述字段对应的第三字段图像中的字符像素值,填充至所述模板图像中各所述字段的文本填充区域中。6.根据权利要求1至5任一项所述的方法,其特征在于,所述生成所述模板图像中各所述字段分别对应的合成文本,包括:在所述模板图像中确定各所述字段的第二属性信息;根据各所述字段的第二属性信息,获取各所述字段分别对应的文本合成策略;所述文本合成策略包括字段的文本内容和内容合成方式;按照各所述字段文本合成策略,生成所述模板图像中各所述字段分别对应的合成文本。7.一种包含文本的图像合成装置,其特征在于,包括:参数预测模块,用于基于模板图像的文本标注信息,预测所述模板图像的文本填充参数;所述文本标注信息用于指示所述模板图像包括的至少一个字段的原始文本和第一属性信息,所述文...

【专利技术属性】
技术研发人员:邱明项超奇
申请(专利权)人:杭州海康威视系统技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1