【技术实现步骤摘要】
用于光学字符识别的训练数据生成方法、系统和电子设备
本公开涉及计算机
,更具体地,涉及一种用于光学字符识别的训练数据生成方法、系统和电子设备。
技术介绍
随着机器学习,深度学习的发展,在光学字符识别(OCR)领域,之前一些传统的分类识别方法,被各种深度神经网络所代替,相比于传统方法,深度学习算法可以自主的提取特征,进行学习,获得更好的识别效果。但是,深度学习常常依靠数据推动,为了得到一个好的模型,往往需要上亿甚至更多的数据来支撑这个训练过程,现实中的训练样本往往达不到这么多,所以需要利用样本生成算法生成文字训练样本进行训练。
技术实现思路
有鉴于此,本公开提供了一种用于光学字符识别的训练数据生成方法、系统和电子设备。本公开的一个方面提供了一种用于光学字符识别的训练数据生成方法,包括获得文字信息,获得背景图像,所述背景图像包括从真实场景的图像中提取的第一背景图像,以及基于所述文字信息以及所述背景图像,生成用于光学字符识别的训练数据。根据本公开实施例,所述基于所述文字信息以及所述背景图像,生成用于光学字符识别的训练数据包括,基于所述文字信息以及所述背景图像,分批次生 ...
【技术保护点】
1.一种用于光学字符识别的训练数据生成方法,包括:获得文字信息;获得背景图像,所述背景图像包括从真实场景的图像中提取的第一背景图像;以及基于所述文字信息以及所述背景图像,生成用于光学字符识别的训练数据。
【技术特征摘要】
1.一种用于光学字符识别的训练数据生成方法,包括:获得文字信息;获得背景图像,所述背景图像包括从真实场景的图像中提取的第一背景图像;以及基于所述文字信息以及所述背景图像,生成用于光学字符识别的训练数据。2.根据权利要求1所述的方法,其中,所述基于所述文字信息以及所述背景图像,生成用于光学字符识别的训练数据包括:基于所述文字信息以及所述背景图像,分批次生成用于光学字符识别的训练数据,其中,在生成训练数据的过程中,调整参数使每批次生成的训练数据的数量增加。3.根据权利要求1所述的方法,其中,所述获得文字信息包括以下至少一种:从字符集中随机选取多个字符作为文字信息;从语料库中随机抽取连续字符串作为文字信息,其中,所述方法还包括以下至少一种:去除所述语料库中重复的语料;在所述字符集包括多种字体的字符的情况下,从所述字符集中剔除错误字符,所述错误字符包括不支持特定字体的特定字符。4.根据权利要求1所述的方法,其中,所述获得背景图像包括:随机选用第一方式或第二方式获得背景图像,其中,所述第一方式包括从背景库中选取从真实场景的图像中提取的第一背景图像作为背景图像,所述第二方式包括基于图像处理方法随机生成的第二背景图像作为背景图像。5.根据权利要求4所述的方法,其中,所述基于图像处理方法随机生成的第二背景图像作为背景图像包括:获得文字颜色;获得颜色差值范围;基于所述文字颜色以及所述颜色差值范围,确定背景颜色;以及基于所述背景颜色,生成背景图像。6.根据权利要求1所述的方法,其中,所述基于所述文字信息以及所述背景图像,生成用于光学字符识别的训练数据包括:组合所述文字信息和所述背景图像,获得组合图像;处理所述组合图像,生成用于光学字符识别的训练数据,其中,所述处理所述组合图像包括以下至少一种:将所述组合图像缩小,然后放大到原始尺寸;将所述组合图像按照图像质量因子存储为jpg格式,其中,所述图像质量因子的值设定在预设范围内。7.一种用于光学字符识别的训练数据生成系统,包括:文字获得模块,用于获得文字信息;背景获得模块,用于获得背景图像,所述背景图像包括从真实场景的图像中提取的第一背景图像;以...
【专利技术属性】
技术研发人员:郭新然,刘永强,桂晨光,邓超,王超,
申请(专利权)人:北京京东金融科技控股有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。