【技术实现步骤摘要】
一种基于国产化平台的OCR识别方法及其识别系统
本专利技术属于模式识别与计算机视觉
,尤其是一种基于国产化平台的OCR识别方法及其识别系统。
技术介绍
近年来计算机视觉技术快速发展,图片文字的OCR识别成为热门方向,目前常规文本识别,自然场景下文本识别,安防领域中的身份证识别,金融领域中票据银行卡识别等背景下的OCR识别研究较多,并且已经有成熟的应用。OCR识别技术的实现主要依赖于深度学习框架,如TensorFlow,caffe和Paddle等框架,在框架中搭建识别的网络模型,通过大量数据对模型进行优化训练,进而实现通过模型识别文字。现阶段深度学习框架的应用平台为windows平台和linux平台,基于x86和AMD架构,皆是国外研发的平台。国产化平台的CPU采用飞腾研发的芯片,该芯片使用自研的ARMv8架构。x86等架构采用复杂指令集计算机,ARMv8采用精简指令集计算机。两者的不同导致不同平台的底层指令不同,双方平台的软件无法直接使用。这也导致基于国产化系统和硬件平台中的OCR识别研究几乎为空白,大部分使用国产化软 ...
【技术保护点】
1.一种基于国产化平台的OCR识别方法,其特征在于,包括如下步骤:/n步骤1、数据集标注与整理:先整理需要识别的字符,其次根据收集的字符制作数据集,最后对所有数据做数据增广处理;/n步骤2、识别模型搭建:先构建国产化平台的图像处理工具建立深度学习框架,搭建OCR识别网络结构;/n步骤3、识别模型训练:先利用编译的图像处理工具将待训练数据进行图像尺寸归一化,其次对编写的prototxt文件进行修改,添加模型训练的设置参数与准备文件,包括图像路径,标签路径,反向传播学习率,最后设定训练参数进行训练,训练过程中网络结构的参数会不断根据反向传播的训练结果进行迭代优化,最终训练结束, ...
【技术特征摘要】
1.一种基于国产化平台的OCR识别方法,其特征在于,包括如下步骤:
步骤1、数据集标注与整理:先整理需要识别的字符,其次根据收集的字符制作数据集,最后对所有数据做数据增广处理;
步骤2、识别模型搭建:先构建国产化平台的图像处理工具建立深度学习框架,搭建OCR识别网络结构;
步骤3、识别模型训练:先利用编译的图像处理工具将待训练数据进行图像尺寸归一化,其次对编写的prototxt文件进行修改,添加模型训练的设置参数与准备文件,包括图像路径,标签路径,反向传播学习率,最后设定训练参数进行训练,训练过程中网络结构的参数会不断根据反向传播的训练结果进行迭代优化,最终训练结束,网络结构的最优参数以二进制文件的形式被保存,即训练后的模型文件;
步骤4、识别模型应用:将处理后的图片送入训练后的网络结构中计算,匹配模型计算后最匹配的标签结果,在构建的标签文件中检索标签结果并输出OCR识别结果。
2.根据权利要求1所述的基于国产化平台的OCR识别方法,其特征在于,所述字符包括:GB2312国标码中一级字库和二级字库共6763个汉字;数字、一般符号、拉丁字母、希腊字母、俄文字母、拼音符号和注音字母共682个常用字符;由银行和政务机关收集而来的人名中较为常用的20个生僻汉字。
3.根据权利要求1所述的基于国产化平台的OCR识别方法,其特征在于,所述数据集合成方法为:合成数据通过生成工具生成,给定文字字体类型和字体大小,从语料库中随机生成包含汉字的图片数据和相对应的数据标签;标注数据这是通过存折、发票、存单等场景下截取的数据字段,对截取数据进行标注。
4.根据权利要求3所述的基于国产化平台的OCR识别方法,其特征在于,所述数据增广方法为:通过旋转,拉伸,添加背景方法,提高数据的多样性,最终生成数据集,包括训练集和测试集,训练集和测试集的标签文件分别保存在train.txt和test.txt文件中。
5.根据权利要求1所述的基于国产化平台的OCR识别方法,其特征在于,所述国产化平台为国产的飞腾FT-2000芯片作为CPU,搭配国产化UOS操作系统。
6.根据权利要求1所述的基于国产化平台的OCR识别方法,其特征在于,所述OCR识别网络结构包括:编译安装图像处理ggimage框架和深度学习框架caffe;
其中,深度学习框架caffe包括两层卷积层Conv1层和Conv2层,三层inception结构层inception_3a层,inception_3b层和inception_3c层,经过El...
【专利技术属性】
技术研发人员:孔飞,张文强,徐明,谢鑫,
申请(专利权)人:江苏国光信息产业股份有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。