用于生成图片的方法和装置制造方法及图纸

技术编号:18459075 阅读:41 留言:0更新日期:2018-07-18 12:49
本申请公开了用于生成图片的方法和装置。该方法的一具体实施方式包括:随机生成包括文字和背景的样本图片;从预先生成的文字的灰度概率分布集合中选取文字的灰度概率分布,并从预先生成的背景的灰度概率分布集合中选取背景的灰度概率分布;按照所选取的文字的灰度概率分布调整样本图片的文字的灰度,并且按照所选取的背景的灰度概率分布调整样本图片的背景的灰度,得到调整后的样本图片。该实施方式生成了文字的灰度概率分布和背景的灰度概率分布不会过拟合的样本图片。

A method and device for generating pictures

The application discloses a method and device for generating pictures. The method includes randomly generating sample pictures including text and background, selecting the gray probability distribution of the text from the gray probability distribution set of the pre generated text, and selecting the gray probability distribution of the background from the set of gray probability distribution in the pre generated background; according to the selected text, The gray probability distribution of the word adjusts the gray level of the text of the sample picture, and adjusts the gray level of the background of the sample picture according to the gray probability distribution of the selected background, and gets the sample picture after the adjustment. The implementation method generates the probability distribution of the gray probability of the text and the probability distribution of the background gray value, and the sample pictures that are not over fitting.

【技术实现步骤摘要】
用于生成图片的方法和装置
本申请涉及计算机
,具体涉及图像处理
,尤其涉及用于生成图片的方法和装置。
技术介绍
近年来深度学习技术发展迅猛,在光学字符识别(OpticalCharacterRecognition,OCR)领域利用卷积神经网络(ConvolutionalNeuralNetwork,CNN)和循环神经网络(RecurrentNeuralNetworks,RNN)技术能使文字识别的准确率和覆盖率得到明显提升。深度学习技术在识别性能上能显著超过传统算法(比如人工特征+SVM(SupportVectorMachine,支持向量机)),但相应的深度学习技术需要比传统算法更多的样本数据。可以说,有没有足够的优质样本数据是决定一个深度学习模型能否有好的效果的重要前提。现有的文字标注数据获取方法主要有2种:1、人工标注,即人工选取图片的文字区域,并输入该区域的对应文字信息。2、程序生成,利用程序在图片上添加文字,由于文字是程序生成的,因此文字的位置和文字信息均可知。为了模拟现实的图片文字的模糊情况,一般程序生成的图片会加入随机噪声和模糊化。人工标注的数据质量最好,但人工标注数据所需的成本高,获取数据的周期长。程序生成的图片数据量大,理论上可以无限生成,数据获取时间短。缺点是程序生成的图片数据往往和现实差距比较大,导致的一个问题是利用程序生成的数据训练的模型存在数据集上的过拟合,即在程序生成的图片上识别效果好,但面对实际的待识别图片时识别的效果很差。
技术实现思路
本申请的目的在于提出一种改进的用于生成图片的方法和装置,来解决以上
技术介绍
部分提到的技术问题。第一方面,本申请提供了一种用于生成图片的方法,该方法包括:随机生成包括文字和背景的样本图片;从预先生成的文字的灰度概率分布集合中选取文字的灰度概率分布,并从预先生成的背景的灰度概率分布集合中选取背景的灰度概率分布;按照所选取的文字的灰度概率分布调整样本图片的文字的灰度,并且按照所选取的背景的灰度概率分布调整样本图片的背景的灰度,得到调整后的样本图片。在一些实施例中,该方法还包括预先生成文字的灰度概率分布集合和背景的灰度概率分布集合的步骤:获取模板图片集合,其中,模板图片集合中每个模板图片包含文字和背景;获取模板图片集合中每个模板图片的文字的灰度和背景的灰度;确定模板图片集合中每个模板图片的文字的灰度的均值和方差以及背景的灰度的均值和方差;根据模板图片集合中每个模板图片的文字的灰度的均值和方差确定该模板图片的文字的灰度概率分布,得到文字的灰度概率分布集合;根据模板图片集合中每个模板图片的背景的灰度的均值和方差确定该模板图片的背景的灰度概率分布,得到背景的灰度概率分布集合。在一些实施例中,获取模板图片集合,包括:获取待识别图片;将待识别图片转化为灰度图;检测出灰度图中的各行文字;针对每行文字,从灰度图中截取出包含该行文字的部分作为模板图片,得到模板图片集合。在一些实施例中,获取模板图片集合中每个模板图片的文字的灰度和背景的灰度,包括:将模板图片集合中每个模板图片进行二值化处理;根据灰度将每个经二值化处理后的模板图片分成文字和背景;针对模板图片集合中每个模板图片分别获取该模板图片的文字和背景在二值化处理之前的灰度。在一些实施例中,文字的灰度概率分布和背景的灰度概率分布为高斯分布。在一些实施例中,该方法还包括:使用调整后的样本图片训练用于识别文字的深度学习神经网络。第二方面,本申请提供了一种用于生成图片的装置,该装置包括:生成单元,用于随机生成包括文字和背景的样本图片;选取单元,用于从预先生成的文字的灰度概率分布集合中选取文字的灰度概率分布,并从预先生成的背景的灰度概率分布集合中选取背景的灰度概率分布;调整单元,用于按照所选取的文字的灰度概率分布调整样本图片的文字的灰度,并且按照所选取的背景的灰度概率分布调整样本图片的背景的灰度,得到调整后的样本图片。在一些实施例中,该装置还包括:模板获取单元,用于获取模板图片集合,其中,模板图片集合中每个模板图片包含文字和背景;灰度获取单元,用于获取模板图片集合中每个模板图片的文字的灰度和背景的灰度;均值方差确定单元,用于确定模板图片集合中每个模板图片的文字的灰度的均值和方差以及背景的灰度的均值和方差;文字灰度分布确定单元,用于根据模板图片集合中每个模板图片的文字的灰度的均值和方差确定该模板图片的文字的灰度概率分布,得到文字的灰度概率分布集合;背景灰度分布确定单元,用于根据模板图片集合中每个模板图片的背景的灰度的均值和方差确定该模板图片的背景的灰度概率分布,得到背景的灰度概率分布集合。在一些实施例中,模板获取单元进一步用于:获取待识别图片;将待识别图片转化为灰度图;检测出灰度图中的各行文字;针对每行文字,从灰度图中截取出包含该行文字的部分作为模板图片,得到模板图片集合。在一些实施例中,灰度获取单元进一步用于:将模板图片集合中每个模板图片进行二值化处理;根据灰度将每个经二值化处理后的模板图片分成文字和背景;针对模板图片集合中每个模板图片分别获取该模板图片的文字和背景在二值化处理之前的灰度。在一些实施例中,文字的灰度概率分布和背景的灰度概率分布为高斯分布。在一些实施例中,该装置还包括:训练单元,用于使用调整后的样本图片训练用于识别文字的深度学习神经网络。本申请提供的用于生成图片的方法和装置,通过将随机生成的图片中的文字的灰度按预先生成的文字灰度概率分布进行调整并将背景的灰度按预先生成的背景灰度概率分布进行调整,使得该样本图片更接近待识别图片以防止过拟合,从而有效地提高了样本图片的质量。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请可以应用于其中的示例性系统架构图;图2是根据本申请的用于生成图片的方法的一个实施例的流程图;图3a、3b、3c和3d是根据本申请的用于生成图片的方法的应用场景的示意图;图4是根据本申请的用于生成图片的方法的又一个实施例的流程图;图5是根据本申请的用于生成图片的装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的服务器或终端设备的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的用于生成图片的方法或用于生成图片的装置的实施例的示例性系统架构100。如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种文档应用,例如PDF阅读器、WORD等。终端设本文档来自技高网...

【技术保护点】
1.一种用于生成图片的方法,其特征在于,所述方法包括:随机生成包括文字和背景的样本图片;从预先生成的文字的灰度概率分布集合中选取文字的灰度概率分布,并从预先生成的背景的灰度概率分布集合中选取背景的灰度概率分布;按照所选取的文字的灰度概率分布调整所述样本图片的文字的灰度,并且按照所选取的背景的灰度概率分布调整所述样本图片的背景的灰度,得到调整后的样本图片。

【技术特征摘要】
1.一种用于生成图片的方法,其特征在于,所述方法包括:随机生成包括文字和背景的样本图片;从预先生成的文字的灰度概率分布集合中选取文字的灰度概率分布,并从预先生成的背景的灰度概率分布集合中选取背景的灰度概率分布;按照所选取的文字的灰度概率分布调整所述样本图片的文字的灰度,并且按照所选取的背景的灰度概率分布调整所述样本图片的背景的灰度,得到调整后的样本图片。2.根据权利要求1所述的方法,其特征在于,所述方法还包括预先生成文字的灰度概率分布集合和背景的灰度概率分布集合的步骤:获取模板图片集合,其中,所述模板图片集合中每个模板图片包含文字和背景;获取所述模板图片集合中每个模板图片的文字的灰度和背景的灰度;确定所述模板图片集合中每个模板图片的文字的灰度的均值和方差以及背景的灰度的均值和方差;根据所述模板图片集合中每个模板图片的文字的灰度的均值和方差确定该模板图片的文字的灰度概率分布,得到文字的灰度概率分布集合;根据所述模板图片集合中每个模板图片的背景的灰度的均值和方差确定该模板图片的背景的灰度概率分布,得到背景的灰度概率分布集合。3.根据权利要求2所述的方法,其特征在于,所述获取模板图片集合,包括:获取待识别图片;将所述待识别图片转化为灰度图;检测出所述灰度图中的各行文字;针对每行文字,从所述灰度图中截取出包含该行文字的部分作为模板图片,得到模板图片集合。4.根据权利要求2所述的方法,其特征在于,所述获取所述模板图片集合中每个模板图片的文字的灰度和背景的灰度,包括:将所述模板图片集合中每个模板图片进行二值化处理;根据灰度将每个经二值化处理后的模板图片分成文字和背景;针对所述模板图片集合中每个模板图片分别获取该模板图片的文字和背景在二值化处理之前的灰度。5.根据权利要求1所述的方法,其特征在于,所述文字的灰度概率分布和背景的灰度概率分布为高斯分布。6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:使用所述调整后的样本图片训练用于识别文字的深度学习神经网络。7.一种用于生成图片的装置,其特征在...

【专利技术属性】
技术研发人员:陈标龙王永亮王青泽
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1