【技术实现步骤摘要】
一种字符识别图像的生成方法、电子设备和可读存储介质
本专利技术实施例涉及数据处理领域,特别涉及一种字符识别图像的生成方法、电子设备和可读存储介质。
技术介绍
随着信息的快速增长,文字数量已经非常庞大、待获取的信息类别繁杂,导致人们通过人力来获取信息的时间成本和人力成本大幅度增加;为了解决这个问题,目前人们利用计算机对光学字符进行识别,从而大大节省人工阅读的成本。光学字符识别通常采用深度学习的方式,如:卷积循环神经网络(ConvolutionalRecurrentNeuralNetwork,简称“CRNN”)、基于统一网络的快速文本定位(FastOrientedTextSpottingwithaUnifiedNetwork,简称“FOTS”)等。专利技术人发现相关技术中至少存在如下问题:目前基于深度学习的光学字符识别技术的准确性依赖于用于进行字符识别训练的字符图像训练集合,该字符图像训练集合中的字符图像是从不同背景图像的字符识别图像中截取获得,背景图像可以是自然场景下拍摄获得、在弱光场景下拍摄获得等;而字符识别图像的不同背景图像,导致其需要的字符数据往往不同,如:银 ...
【技术保护点】
1.一种字符识别图像的生成方法,其特征在于,包括:获取第一字符数据以及背景图像;将所述背景图像与由所述第一字符数据形成的字符图像进行叠加,得到原始字符识别图像;对所述原始字符识别图像进行图像变换处理,以修正所述原始字符识别图像与真实字符识别图像之间的误差,生成字符识别图像,其中,所述第一字符数据至少包括一个第一字符。
【技术特征摘要】
1.一种字符识别图像的生成方法,其特征在于,包括:获取第一字符数据以及背景图像;将所述背景图像与由所述第一字符数据形成的字符图像进行叠加,得到原始字符识别图像;对所述原始字符识别图像进行图像变换处理,以修正所述原始字符识别图像与真实字符识别图像之间的误差,生成字符识别图像,其中,所述第一字符数据至少包括一个第一字符。2.根据权利要求1所述的字符识别图像的生成方法,其特征在于,所述图像变换处理包括以下之一或任意组合:图像的视角变换处理、图像的模糊处理、图像的光照处理、按照不同的图像质量对图像进行保存处理或者增加图像噪声处理。3.根据权利要求1或2所述字符识别图像的生成方法,其特征在于,所述获取所述第一字符数据,具体包括:从语料库中选取包括多个第二字符的语料;统计所述语料中每个第二字符的历史次数,所述第二字符的历史次数为所述第二字符在所述语料中出现的次数,或者所述第二字符的历史次数为所述第二字符在所述语料中出现的次数与在历史语料中出现的次数之和;根据每个所述第二字符的历史次数,确定第一字符数据。4.根据权利要求3所述字符识别图像的生成方法,其特征在于,根据每个所述第二字符的历史次数,确定第一字符数据,具体包括:将每个所述第二字符的历史次数与预设次数阈值进行比较;若确定存在历史次数超过所述预设次数阈值的第二字符,则将所述历史次数超过所述预设次数阈值的第二字符作为待替换第二字符,并确定历史次数最小的第二字符;将所述历史次数最小的第二字符替换所述待替换第二字符;并将替换处理后的所述语料作为所述第一字符数据;其中,所述替换处理后的语料中的第二字符被作为所述第一字符。5.根据权利要求1至4中任一项所述字符识别图像的生成方法,其特征在于,在将所述背景图像与由所述第一字符数据形成的字符图像进行叠加,得到原始字符识...
【专利技术属性】
技术研发人员:梁昊,南一冰,廉士国,
申请(专利权)人:深圳前海达闼云端智能科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。