生成书面印刷数据的样本的方法、装置及计算机存储介质制造方法及图纸

技术编号:21894723 阅读:19 留言:0更新日期:2019-08-17 15:37
提供了一种生成书面印刷数据的样本的方法、装置及计算机存储介质。该方法包括:生成语料并为所述语料选取字体;生成背景图案;根据所述背景图案为所述语料选取字体颜色;将所述语料渲染至所述背景图案生成样本。由此可见,本发明专利技术实施例的生成书面印刷数据的样本的方法能够生成语料和背景图像,并渲染为印刷数据的样本,能够模拟真实印刷的各种现象,保证样本的真实性。并且该过程无需大量的人力,能够极大地节约人力物力和财力,节省开支。

Method, Device and Computer Storage Media for Generating Samples of Written Printed Data

【技术实现步骤摘要】
生成书面印刷数据的样本的方法、装置及计算机存储介质
本专利技术涉及图像处理领域,更具体地涉及一种生成书面印刷数据的样本的方法、装置及计算机存储介质。
技术介绍
在对图像识别时,通常首先需要大量的样本通过深度学习得到模型。样本对于深度学习非常重要,更多的样本和更符合实际的样本能很大提升识别准确率。在对图像识别的场景中,很多时候会涉及文字识别。在文字识别中,需要提供越来越多的样本改进学习效果,然而真实样本往往难以获取或者不够充分,因此需要生成大量数据代替真实样本。目前开源的数据生成的方法中,一种方法是基于自然场景生成文字数据,然而由于自然场景与真实纸面有很大的差距,因此这种方法生成的文字数据与真实纸面的文字数据(比如,票据证件上的文字数据)也有一定差距。另一种方法是通过人工采集真实数据,然而时间和金钱成本会大大提升,并且也很难甚至不可能涵盖到所有现象。
技术实现思路
本专利技术提供了一种生成书面印刷数据的样本的方法及装置,能够模拟真实印刷的各种现象。根据本专利技术的一方面,提供了一种生成书面印刷数据的样本的方法,其特征在于,所述方法包括:生成语料并为所述语料选取字体;生成背景图案;根据所述背景图案为所述语料选取字体颜色;将所述语料渲染至所述背景图案生成样本。在一种实现方式中,所述生成背景图案,包括:随机选取背景颜色生成单色图案;随机选取概率对所述单色图案执行以下操作的一个或多个,生成所述背景图案:模糊、光照、全局或局部仿射变换。在一种实现方式中,所述根据所述背景图案为所述语料选取字体颜色,包括:为所述语料选取字体颜色,使得所述字体颜色满足预设条件;为所述语料选取透明通道。在一种实现方式中,为所述语料选取字体颜色,使得所述字体颜色满足预设条件,包括:计算所述背景图案中每个像素点的RGB通道的归一化颜色;计算所述背景图案中所有像素点的RGB通道的归一化颜色的平均值;为所述语料进行等概率随机颜色选取,并计算所述随机颜色的归一化颜色;判断所述随机颜色的归一化颜色是否满足第一预设条件,判断所述随机颜色的归一化颜色与所述平均值的关系是否满足第二预设条件;如果不满足所述第一预设条件或者不满足所述第二预设条件,则重新选取所述随机颜色,使得同时满足所述第一预设条件和所述第二预设条件。在一种实现方式中,第一预设条件表示为fr+fg+fb<2;第二预设条件表示为|r-rm|>A或|g-gm|>A或|b-bm|>A,其中,r,g和b表示所述随机颜色的归一化颜色,rm,gm和bm表示所述背景图案的归一化颜色的平均值,其中,若rm+gm+bm>P,则fr=bool(r-t),fg=bool(g-t),fb=bool(b-t);若rm+gm+bm≤P,则fr=bool(1-r-t),fg=bool(1-g-t),fb=bool(1-b-t),其中,A和t均为小于1的预设正值,P为小于3的预设正值。在一种实现方式中,A=0.2,P=1.5,t=0.8。在一种实现方式中,为所述语料选取透明通道,包括:从区间[0.6,1]为所述语料选取透明通道。在一种实现方式中,将所述语料渲染至所述背景图案生成样本,包括:将所述语料渲染至所述背景图案生成渲染后的图像;基于所述渲染后的图像生成样本。在一种实现方式中,基于所述渲染后的图像生成样本包括:将所述渲染后的图像作为样本;或者,对三角网格进行变形,以便模拟实际印刷品存在的褶皱,然后将所述渲染后的图像作为纹理贴到变形后的三角网格从而生成样本。在一种实现方式中,将所述语料渲染至所述背景图案生成渲染后的图像,包括:对所述语料执行以下操作的一个或多个,再与所述背景图案融合生成所述渲染后的图像:部分或全部加粗、偏移、倾斜、拉伸、收缩、高斯模糊、光照亮度、噪声、局部仿射和弹性变换、在所述语料的周围生成文字。根据本专利技术的另一方面,提供了一种生成书面印刷数据的样本的装置,所述装置用于实现前述方面或任一实现方式所述方法的步骤,所述装置包括:第一生成模块,用于生成语料并为所述语料选取字体;第二生成模块,用于生成背景图案;颜色选取模块,用于根据所述背景图案为所述语料选取字体颜色;渲染模块,用于将所述语料渲染至所述背景图案生成样本。根据本专利技术的又一方面,提供了一种生成书面印刷数据的样本的装置,包括存储器、处理器及存储在所述存储器上且在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现前述方面或任一实现方式所述的生成书面印刷数据的样本的方法的步骤。根据本专利技术的再一方面,提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现前述方面或任一实现方式所述的生成书面印刷数据的样本的方法的步骤。由此可见,本专利技术实施例的生成书面印刷数据的样本的方法能够生成语料和背景图像,并渲染为印刷数据的样本,能够模拟真实印刷的各种现象,保证样本的真实性。并且该过程无需大量的人力,能够极大地节约人力物力和财力,节省开支。附图说明通过结合附图对本专利技术实施例进行更详细的描述,本专利技术的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本专利技术实施例的进一步理解,并且构成说明书的一部分,与本专利技术实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中,相同的参考标号通常代表相同部件或步骤。图1是本专利技术实施例的电子设备的一个示意性框图;图2是本专利技术实施例的生成书面印刷数据的样本的方法的一个示意性流程图;图3是采用本专利技术实施例的方法所生成的样本的示意图;图4是本专利技术实施例的生成书面印刷数据的样本的装置的一个示意性框图;图5是本专利技术实施例的生成书面印刷数据的样本的装置的另一个示意性框图。具体实施方式为了使得本专利技术的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本专利技术的示例实施例。显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是本专利技术的全部实施例,应理解,本专利技术不受这里描述的示例实施例的限制。基于本专利技术中描述的本专利技术实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本专利技术的保护范围之内。本专利技术实施例可以应用于电子设备,图1所示为本专利技术实施例的电子设备的一个示意性框图。图1所示的电子设备10包括一个或更多个处理器102、一个或更多个存储装置104、输入装置106、输出装置108、图像传感器110以及一个或更多个非图像传感器114,这些组件通过总线系统112和/或其它形式互连。应当注意,图1所示的电子设备10的组件和结构只是示例性的,而非限制性的,根据需要,所述电子设备也可以具有其他组件和结构。所述处理器102可以包括中央处理单元(CentralProcessingUnit,CPU)1021和图形处理单元(GraphicsProcessingUnit,GPU)1022或者具有数据处理能力和/或指令执行能力的其它形式的处理单元,例如现场可编程门阵列(Field-ProgrammableGateArray,FPGA)或进阶精简指令集机器(AdvancedRISC(ReducedInstructionSetComputer)Machine,ARM)等,并且处理器102可以控制所述电子设备10中的其它组件以执行期望的功能。所述存储装置104可以包括一个或更多个计算本文档来自技高网...

【技术保护点】
1.一种生成书面印刷数据的样本的方法,其特征在于,所述方法包括:生成语料并为所述语料选取字体;生成背景图案;根据所述背景图案为所述语料选取字体颜色;将所述语料渲染至所述背景图案生成样本。

【技术特征摘要】
1.一种生成书面印刷数据的样本的方法,其特征在于,所述方法包括:生成语料并为所述语料选取字体;生成背景图案;根据所述背景图案为所述语料选取字体颜色;将所述语料渲染至所述背景图案生成样本。2.根据权利要求1所述的方法,其特征在于,所述生成背景图案,包括:随机选取背景颜色生成单色图案;随机选取概率对所述单色图案执行以下操作的一个或多个,生成所述背景图案:模糊、光照、全局或局部仿射变换。3.根据权利要求1所述的方法,其特征在于,所述根据所述背景图案为所述语料选取字体颜色,包括:为所述语料选取字体颜色,使得所述字体颜色满足预设条件;为所述语料选取透明通道。4.根据权利要求3所述的方法,其特征在于,为所述语料选取字体颜色,使得所述字体颜色满足预设条件,包括:计算所述背景图案中每个像素点的RGB通道的归一化颜色;计算所述背景图案中所有像素点的RGB通道的归一化颜色的平均值;为所述语料进行等概率随机颜色选取,并计算所述随机颜色的归一化颜色;判断所述随机颜色的归一化颜色是否满足第一预设条件,判断所述随机颜色的归一化颜色与所述平均值的关系是否满足第二预设条件;如果不满足所述第一预设条件或者不满足所述第二预设条件,则重新选取所述随机颜色,使得同时满足所述第一预设条件和所述第二预设条件。5.根据权利要求4所述的方法,其特征在于,第一预设条件表示为fr+fg+fb<2;第二预设条件表示为|r-rm|>A或|g-gm|>A或|b-bm|>A,其中,r,g和b表示所述随机颜色的归一化颜色,rm,gm和bm表示所述背景图案的归一化颜色的平均值,其中,若rm+gm+bm>P,则fr=bool(r-t),fg=bool(g-t),fb=bool(b-t);若rm+gm+bm≤P,则fr=bool(1-r-t),fg=bool(1-g-t),fb=bool(1-b...

【专利技术属性】
技术研发人员:张婕蕾曹志敏贺欣刘毅博谢锋明姚聪
申请(专利权)人:北京旷视科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1