The application discloses a method and device for generating pictures. The method includes randomly generating sample pictures including text and background, selecting the gray probability distribution of the text from the gray probability distribution set of the pre generated text, and selecting the gray probability distribution of the background from the set of gray probability distribution in the pre generated background; according to the selected text, The gray probability distribution of the word adjusts the gray level of the text of the sample picture, and adjusts the gray level of the background of the sample picture according to the gray probability distribution of the selected background, and gets the sample picture after the adjustment. The implementation method generates the probability distribution of the gray probability of the text and the probability distribution of the background gray value, and the sample pictures that are not over fitting.
【技术实现步骤摘要】
用于生成图片的方法和装置
本申请涉及计算机
,具体涉及图像处理
,尤其涉及用于生成图片的方法和装置。
技术介绍
近年来深度学习技术发展迅猛,在光学字符识别(OpticalCharacterRecognition,OCR)领域利用卷积神经网络(ConvolutionalNeuralNetwork,CNN)和循环神经网络(RecurrentNeuralNetworks,RNN)技术能使文字识别的准确率和覆盖率得到明显提升。深度学习技术在识别性能上能显著超过传统算法(比如人工特征+SVM(SupportVectorMachine,支持向量机)),但相应的深度学习技术需要比传统算法更多的样本数据。可以说,有没有足够的优质样本数据是决定一个深度学习模型能否有好的效果的重要前提。现有的文字标注数据获取方法主要有2种:1、人工标注,即人工选取图片的文字区域,并输入该区域的对应文字信息。2、程序生成,利用程序在图片上添加文字,由于文字是程序生成的,因此文字的位置和文字信息均可知。为了模拟现实的图片文字的模糊情况,一般程序生成的图片会加入随机噪声和模糊化。人工标注的数据质量最好,但人工标注数据所需的成本高,获取数据的周期长。程序生成的图片数据量大,理论上可以无限生成,数据获取时间短。缺点是程序生成的图片数据往往和现实差距比较大,导致的一个问题是利用程序生成的数据训练的模型存在数据集上的过拟合,即在程序生成的图片上识别效果好,但面对实际的待识别图片时识别的效果很差。
技术实现思路
本申请的目的在于提出一种改进的用于生成图片的方法和装置,来解决以上
技术介绍
部分提到的技术 ...
【技术保护点】
1.一种用于生成图片的方法,其特征在于,所述方法包括:随机生成包括文字和背景的样本图片;从预先生成的文字的灰度概率分布集合中选取文字的灰度概率分布,并从预先生成的背景的灰度概率分布集合中选取背景的灰度概率分布;按照所选取的文字的灰度概率分布调整所述样本图片的文字的灰度,并且按照所选取的背景的灰度概率分布调整所述样本图片的背景的灰度,得到调整后的样本图片。
【技术特征摘要】
1.一种用于生成图片的方法,其特征在于,所述方法包括:随机生成包括文字和背景的样本图片;从预先生成的文字的灰度概率分布集合中选取文字的灰度概率分布,并从预先生成的背景的灰度概率分布集合中选取背景的灰度概率分布;按照所选取的文字的灰度概率分布调整所述样本图片的文字的灰度,并且按照所选取的背景的灰度概率分布调整所述样本图片的背景的灰度,得到调整后的样本图片。2.根据权利要求1所述的方法,其特征在于,所述方法还包括预先生成文字的灰度概率分布集合和背景的灰度概率分布集合的步骤:获取模板图片集合,其中,所述模板图片集合中每个模板图片包含文字和背景;获取所述模板图片集合中每个模板图片的文字的灰度和背景的灰度;确定所述模板图片集合中每个模板图片的文字的灰度的均值和方差以及背景的灰度的均值和方差;根据所述模板图片集合中每个模板图片的文字的灰度的均值和方差确定该模板图片的文字的灰度概率分布,得到文字的灰度概率分布集合;根据所述模板图片集合中每个模板图片的背景的灰度的均值和方差确定该模板图片的背景的灰度概率分布,得到背景的灰度概率分布集合。3.根据权利要求2所述的方法,其特征在于,所述获取模板图片集合,包括:获取待识别图片;将所述待识别图片转化为灰度图;检测出所述灰度图中的各行文字;针对每行文字,从所述灰度图中截取出包含该行文字的部分作为模板图片,得到模板图片集合。4.根据权利要求2所述的方法,其特征在于,所述获取所述模板图片集合中每个模板图片的文字的灰度和背景的灰度,包括:将所述模板图片集合中每个模板图片进行二值化处理;根据灰度将每个经二值化处理后的模板图片分成文字和背景;针对所述模板图片集合中每个模板图片分别获取该模板图片的文字和背景在二值化处理之前的灰度。5.根据权利要求1所述的方法,其特征在于,所述文字的灰度概率分布和背景的灰度概率分布为高斯分布。6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:使用所述调整后的样本图片训练用于识别文字的深度学习神经网络。7.一种用于生成图片的装置,其特征在...
【专利技术属性】
技术研发人员:陈标龙,王永亮,王青泽,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。